下载地址:Dump数据

样例数据说明

样例数据文件是txt格式,每行一条数据,每条数据是一个(实体名称,属性名称,属性值)的三元组,中间用tab分隔,具体如下所示。

【复旦大学 简称 复旦】

包含900万+的百科实体以及6700万+的三元组关系。其中mention2entity信息110万+,摘要信息400万+,标签信息1980万+,infobox信息4100万+

该数据仅供学术研究使用,商用请联系我们获取授权

最新数据请直接访问CN-DBpedia API 或联系徐波博士 xubo@fudan.edu.cn

如果你需要引用我们的文章,请引用:

@inproceedings{xu2017cn,
title={CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System},
author={Xu, Bo and Xu, Yong and Liang, Jiaqing and Xie, Chenhao and Liang, Bin and Cui, Wanyun and Xiao, Yanghua},
booktitle={International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems},
pages={428--438},
year={2017},
organization={Springer}
}