知识图谱怎么入门

对于知识图谱爱好者来说,往往不知道怎么入门,这是因为知识图谱的技术栈比较长,如果要掌握所有技术,入门时间就会很长,而且往往抓不住重点。下面给出一种学习知识图谱可能的路径,可以让知识图谱爱好者在几个月内具备构建知识图谱的能力。首先需要对知识图谱做一个基本的了解,下面几个帖子可以先看一下(一天看完,没完全理解不要紧,后面可以回头再看):

漆桂林等 | 知识图谱研究进展 | OpenKG.CNblog.openkg.cn


专访 | 东南大学漆桂林教授:知识图谱不仅是一项技术,更是一项工程www.sohu.com图标漆桂林:知识图谱之语义网络篇zhuanlan.zhihu.com图标https://blog.csdn.net/Leohfan/article/details/82630573blog.csdn.net

其次,需要有一定的机器学习和数据挖掘基础,建议读一下Liu Bing的书的前五章:

《世界著名计算机教材精选:Web数据挖掘(第2版)》 刘兵, 俞勇, 等【摘要 书评 试读】图书www.amazon.cn图标

英文好点的应该读英文版(可以网上下载电子版):

Exploring Hyperlinks, Contents, and Usage Data》 【摘要 书评 试读】图书www.amazon.cn图标

为了了解怎么做一个知识图谱,可以读一下DBpedia和zhishi.me的论文:

Xing Niu, Xinruo Sun, Haofen Wang, Shu Rong, Guilin Qi, Yong Yu:
Zhishi.me - Weaving Chinese Linking Open Data. International Semantic Web Conference (2) 2011: 205-220

Bizer, C., Lehmann, J., Kobilarov, G., Auer, S., Becker, C., Cyganiak, R., Hell- mann, S.: DBpedia - A crystallization point for the Web of Data. J. Web Sem. 7(3), 154–165 (2009)

这里最好可以动手实践,去做一个百科知识图谱,比如说,做一个佛学百科知识图谱

Tianxing Wu,Cong Gao,Guilin Qi,Lei Zhang,Chuanqi Dong,He Liu,Du Zhang:

KG-Buddhism: The Chinese Knowledge Graph on Buddhism.JIST2017:259-267

或者自己做一个农业、军事百科知识图谱。需要学会写正则表达式,推荐下面这本书:

《精通正则表达式(第3版)》 杰佛瑞E.F.佛瑞德(Jeffrey E.F.Friedl), 余晟【摘要 书评 试读】图书www.amazon.cn图标

不要把知识图谱构建想得太复杂,大部分情况下就靠写正则表达式就可以了,所以写正则表达式是基本功,后续我会放出一些学习资料出来。

知识图谱构建,除了百科图谱这门技术入门以外,还需要掌握D2R技术,这里有一个非常好的tutorial,照着做一下,应该很有帮助:

ryotayamanaka/jist2018-tutorialgithub.com图标

对于知识抽取,包括关系抽取,槽填充,语义角色标注这些,先简单写模板,就够了,如果还想了解更多技术,应该要学一下word2vec技术,Stanford NLP网站有非常齐全的资料:

CS 224N | Homeweb.stanford.edu

但是初学者只要学会用就行了,没必要去了解细节。如果想深入,那么就需要学会公式推导,这就是要进行更系统的学习了。

知识推理可以先不管,如果要了解,那么就了解一下RDFS就够了(见《语义网基础教程(原书第3版)》-- 2.8 RDF和RDFS的一个直接推理系统)。OWL先不要去看。

知识存储学一下neo4j和MongoDB就可以了,特别是neo4j,可以试着把自己构建的图谱导入进去做一个可视化效果看看。

知识融合就用字符串匹配做一下就可以了,实体链接也是字符串匹配。也可以采用一些简单的语义相似度计算方法,见blog.csdn.net/qq_304681

编辑于 2019-05-12

文章被以下专栏收录

    对知识图谱的相关技术做解析,包括语义网络、自然语言处理、本体、推理,着重讨论知识图谱在智能问答方面的应用。