近年来,随着知识图谱技术研究与应用的深化,知识图谱技术吸引了来自工业界与学术界的广泛关注。知识图谱领域涌现出大量的理论与技术研究成果,以及一批优秀的工程实践案例。一方面,对于这些理论工作与工程实践,需要进行系统性的梳理;另一方面,随着研究与应用的深入,业界也迫切需要一本系统性的知识图谱课程和教材。鉴于此,本课程编写团队投入巨大的资源与精力完成了本次课程的编写并出版了《知识图谱:概念与技术》一书。
本课程系统地介绍知识图谱概念、技术与实践。整个课程共5篇,由16 章构成,力求涵盖知识图谱相关的基本概念与关键技术。“基础篇”介绍知识图谱的基本概念、内涵与外延、历史沿革、应用价值,以及相关的基础知识。“构建篇”重点介绍大规模高质量知识图谱的自动化构建技术,涵盖词汇挖掘、实体识别、关系抽取及概念图谱构建、百科图谱构建、众包构建与质量控制等专题。“管理篇”系统地阐述了知识图谱建模与存储、查询与检索,以及图数据管理系统。“应用篇”对于基于知识图谱的关键应用技术展开介绍,包括搜索与推荐、自然语言问答,以及基于知识图谱的自然语言理解。“实践篇”介绍知识图谱实践中的基本原则和有用实践,初步讨论了知识图谱实践中的开放性问题。
本课程及配套教材适用于高年级本科生、硕士生和博士生,也适合企业与行业智能化的从业人员阅读。
No | Subject | Content | Material | 课程实录 |
1 | 知识图谱的基本概念 | 主要介绍知识图谱的基本概念、历史沿革、研究意义、应用价值等。 | 第一章.pdf | |
2 | 基础知识 | 主要介绍知识图谱密切相关的基础知识,包括知识表示的方法、机器学习算法、自然语言处理的相关概念和算法等方面的内容。 | Ch02.pdf | 第二章.pdf |
3 | 词汇挖掘与实体挖掘 | 包括基本概念、领域短语挖掘的算法和统计指标、同义词挖掘、缩略词抽取、实体识别等方面的内容。 | Ch03.pdf | 第三章.pdf |
4 | 关系抽取 | 介绍关系抽取涉及的概念和算法等,包括关系抽取问题描述和评估方法、基于模式的抽取方法、基于学习的抽取方法以及开放关系抽取等方面的内容。 | Ch04.pdf | 第四章.pdf |
5 | 概念图谱构建 | 包括常见的概念图谱介绍、isA关系抽取的方法、isA关系补全、isA关系纠错等方面的内容。 | Ch05.pdf | 第五章.pdf |
6 | 百科图谱构建 | 包括百科图谱的定义和分类、基于单源的百科图谱构建方法、基于多源的百科图谱融合方法等方面的内容。 | Ch06.pdf | 第六章.pdf |
7 | 知识图谱的众包构建 | 包括众包的概念、众包研究的问题、基于众包的知识图谱构建与精化等方面的内容。 | Ch07.pdf | 第七章.pdf |
8 | 知识图谱的质量控制 | 包括质量评估方法介绍、确实的知识发现与补全、错误知识的发现与纠正、过期知识的更新等方面的内容。 | Ch08.pdf | 第八章.pdf |
9 | 知识图谱的建模与存储 | 包括知识图谱的数据模型、存储方式等方面的内容。 | Ch09.pdf | |
10 | 知识图谱的查询与检索 | 包括查询语言、子图查询以及其他查询方法的介绍。 | Ch10.pdf | |
11 | 图数据管理系统 | 本讲介绍知识图数据管理系统,包括图数据管理系统的基本架构和设计原则、典型的图数据管理系统介绍等。 | Ch11.pdf | |
12 | 基于知识图谱的语言认知 | 本讲介绍知识图谱的语言认知,包括语言理解的挑战和任务介绍、实体理解的应用和基本模型、概念理解的应用和具体做法等内容。 | Ch12.pdf | 第十二章.pdf |
13 | 基于知识图谱的搜索与推荐 | 包括使用知识图谱进行搜索涉及的技术细节以及基于知识图谱做推荐时面临的挑战和技术细节。 | Ch13.pdf | 第十三章.pdf |
14 | 基于知识图谱的问答 | 包括KBQA概述、基于模版的KBQA、基于图模型的KBQA、基于深度学习的KBQA等。 | Ch14.pdf | 第十四章.pdf |
15 | 知识图谱实践 | 本讲介绍知识图谱的实践,包括知识图谱系统、知识图谱工程以及知识图谱应用与产业等方面的内容。 | Ch15.pdf | |
16 | 开放性问题 | 讨论一些尚未解决的问题,包括知识表示中的语义增强、知识获取存在的难题、以及一些尚未实现的知识应用等。 | Ch16.pdf | |
作业1 | 课程作业 | 见附件 | ||
作业2 | 期末作业 | 见附件 | ||
参考文献 | 见附件 | |||
肖仰华博士,复旦大学教授、博士生导师、复旦大学知识工场实验室创始人、上海市互联网大数据工程技术中心副主任、多家规模企业高级顾问与首席科学家、知识图谱前沿技术系列课程发起人、十多个国家/省市/企业研究奖项获得者、三十多个国家/省市/企业研发项目负责人。在国际顶级学术会议与期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等)发表论文百余篇,授权近20项知识图谱专利。百余次担任国际/国内学术机构/会议的学术服务工作。领导构建了知识库云服务平台(知识工场平台kw.fudan.edu.cn),发布了一系列知识图谱,以API形式为数百家应用单位服务超过10亿次。
个人主页: http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Yanghuaxiao