people

Individual Resume

肖仰华，博士，复旦大学计算机科学技术学院教授、博导，上海市数据科学重点实验室主任，复旦大学知识工场实验室负责人，2009年获得复旦大学博士学位后留校任教，先后任讲师、副教授、教授（2017年）。

Research Honor

2024 ICDE 十年影响力论文奖
2023 ACL 杰出论文奖
2023 华为火花奖
2022美团科研合作创新奖
2021上海市计算机学会科学技术奖二等奖
2020华为优秀合作伙伴奖
2019、2020 CCF优秀学术主任、CCF杰出演讲者
2019入选赋能中国人工智能知识图谱20位标杆人物
2018阿里巴巴学术合作最佳合作伙伴
2017阿里巴巴Research Fellowship Award
2017教育部高校科研成果二等奖

Research Interests

知识图谱：以知识图谱为核心的知识管理、构建、分析与应用
大模型：大模型的认知评测与增强，大模型的领域适配
社会科学启发下的人工智能

Research Achievements

（1）大规模知识图谱构建与应用

以知识图谱为核心的大数据知识工程是践行人工智能发展战略的主要形式之一。知识图谱是一种大规模语义网络，是人类知识的重要表达形式之一。团队系统性地提出了一系列数据驱动的知识图谱构建方法，包括知识补全、知识清洗、知识推断、知识更新等方法，实现了大规模知识图谱的自动化构建和更新。相关研究成果形成了CCF-A类会议与期刊论文30余篇；获得2019年语言与智能技术竞赛“信息抽取”比赛第一名、荣获 ACL 2023杰出论文奖。构建并发布了亿级中文百科知识图谱 CN-DBpedia，成为国内下载量最大的公开知识库资源之一，累计下载量超两万次。构建了知识工场平台，发布 5 个大型知识图谱，超过 10 个知识图谱运维支撑工具，以及 20 多种知识图谱数据服务与认知服务 API，产生了规模化调用，累计 500 多家公司及个人用户，超过 6500 个独立 IP 调用近20亿次。主编了知识图谱教材《知识图谱:概念与技术》该书被 20多所高校用作教材，被读者评价为“学习知识图谱的必备读物” 。大规模知识图谱的知识更新方案荣获华为火花奖。大规模生活常识知识图谱构建方案荣获美团科研合作创新奖。

（2）大模型认知评测与能力增强

大模型已经成为机器实现认知智能的基础设施。围绕大模型认知能力评测以及认知能力优化，构建了系统的评测体系，提出了数据驱动的大模型认知优化方法。围绕大模型的学科知识、指令理解、规划能力、幽默认知、隐喻认知、类别认知、概念认知、量纲认知构建了相应的评测数据集、微调指令集。近两年累计发表CCF A类论文30多篇。团队构建了类比推理数据集、结构化类比测评基准、中文幽默认知数据集、语言模型全学科知识评估基准数据集（Xiezhi）、复杂指令理解评估数据集。其中Xiezhi被大模型研发社区评为最具有参考价值的中文语言模型评测基准之一。发布了情感认知增强的大模型CuteGPT。并在此基础上，以知识图谱和大模型为基础，发布了数智教材平台，目前平台已有数千人次学习使用，受到高校和教师广泛关注。

Publications (DBLP personal homepage)

Selected Publications

Tinghui Zhu, Jingping Liu, Jiaqing Liang, Haiyun Jiang, Yanghua Xiao, ZongYu Wang, Rui Xie, Yunsen Xian: Towards Visual Taxonomy Expansion.MM 2023
Sihang Jiang, Jianchuan Feng, Chao Wang, Jingping Liu, Zhuozhi Xiong, Chaofeng Sha, Weiguo Zheng, Jiaqing Liang, Yanghua Xiao: EASC: An Exception-Aware Semantic Compression Framework for Real-World Knowledge Graphs.KBS
Lipeng Ma, Weidong Yang, Bo Xu, Sihang Jiang, Ben Fei, Jiaqing Liang, Mingjie Zhou, Yanghua Xiao: KnowLog: Knowledge Enhanced Pre-trained Language Model for Log Understanding.ICSE 2023
Siyu Yuan, Jiangjie Chen, Ziquan Fu, Xuyang Ge, Soham Shah, C. R. Jankowski, Deqing Yang, Yanghua Xiao: Distilling Script Knowledge from Large Language Models for Constrained Language Planning.ACL 2023 Outstanding Paper
Siyu Yuan, Deqing Yang, Jinxi Liu, Shuyu Tian, Jiaqing Liang, Yanghua Xiao, Rui Xie: Causality-aware Concept Extraction based on Knowledge-guided Prompting.ACL 2023
Jiangjie Chen, Wei Shi, Ziquan Fu, Sijie Cheng, Lei Li, Yanghua Xiao: Say What You Mean! Large Language Models Speak Too Positively about Negative Commonsense Knowledge.ACL 2023
Qianyu He, Yikai Zhang, Jiaqing Liang, Yuncheng Huang, Yanghua Xiao, Yunwen Chen: HAUSER: Towards Holistic and Automatic Evaluation of Simile Generation.ACL 2023
Xiaodan Wang, Chengyu Wang, Lei Li, Zhixu Li, Ben Chen, Linbo Jin, Jun Huang, Yanghua Xiao, Ming Gao: FashionKLIP: Enhancing E-Commerce Image-Text Retrieval with Fashion Multi-Modal Conceptual Knowledge Graph.ACL 2023
Jian Xie, Yidan Liang, Jingping Liu, Yanghua Xiao, Baohua Wu, Shenghua Ni: QUERT: Continual Pre-training of Language Model for Query Understanding in Travel Domain Search.KDD 2023
Jingsong Yang, Guanzhou Han, Deqing Yang, Jingping Liu, Yanghua Xiao, Xiang Xu, Baohua Wu, Shenghua Ni: M3PT: A Multi-Modal Model for POI Tagging.KDD 2023
Zhiang Yue, Jingping Liu, Cong Zhang, Chao Wang, Haiyun Jiang, Yue Zhang, Xianyang Tian, Zhedong Cen, Yanghua Xiao, Tong Ruan: MA-MRC: A Multi-answer Machine Reading Comprehension Dataset.SIGIR 2023
Sheng-Chi You, Chao Wang, Baohua Wu, Jingping Liu, Quan Lu, Guanzhou Han, Yanghua Xiao: What Image do You Need? A Two-stage Framework for Image Selection in E-commerc.WWW 2023
Lihan Chen, Tinghui Zhu, Jingping Liu, Jiaqing Liang, Yanghua Xiao: End-to-end Entity Linking with Hierarchical Reinforcement Learning.AAAI 2023
Jiangjie Chen, Rui Xu, Wenyuan Zeng, Changzhi Sun, Lei Li, Yanghua Xiao: Converge to the Truth: Factual Error Correction via Iterative Constrained Editing.AAAI 2023
Zhouhong Gu, Sihang Jiang, Jingping Liu, Yanghua Xiao, Hongwei Feng, Zhixu Li, Jiaqing Liang, Jian Zhong: GANTEE: Generative Adversarial Network for Taxonomy Entering Evaluation.AAAI 2023
Yu Hong, Jiahang Li, Jianchuan Feng, Chenghua Huang, Zhixu Li, Jianfeng Qu, Yanghua Xiao, Wei Wang: Competition or Cooperation? Exploring Unlabeled Data via Challenging Minimax Game for Semi-Supervised Relation Extraction.AAAI 2023
Qianyu He, Xintao Wang, Jiaqing Liang, Yanghua Xiao: MAPS-KB: A Million-scale Probabilistic Simile Knowledge Base.AAAI 2023
Shuoyao Zhai, Baichuan Liu, Deqing Yang, Yanghua Xiao: Group Buying Recommend- ation Model Based on Multi-task Learning.ICDE 2023
Lyuxin Xue, Deqing Yang, Shuoyao Zhai, Yuxin Li, Yanghua Xiao: Learning Dual-view User Representations for Enhanced Sequential Recommendation.TOIS 2023
Jingping Liu, Tao Chen, Chao Wang, Jiaqing Liang, Lihan Chen, Yanghua Xiao, Yunwen Chen, Ke Jin: VoCSK: Verb-oriented commonsense knowledge mining with taxonomy-guided induction.Artificial Intelligence Journal
Xintao Wang, Jiaqing Liang, Yanghua Xiao, Wei Wang: Prototypical Concept Representation. TKDE 2022
Xintao Wang, Qianyu He, Jiaqing Liang, Yanghua Xiao*: Language Models as Knowledge Embeddings. IJCAI 2022
Sijie Cheng, Zhouhong Gu, Bang Liu, Rui Xie, Wei Wu, Yanghua Xiao*: Learning What You Need from What You Did: Product Taxonomy Expansion with User Behaviors Supervision. ICDE 2022
Xuwu Wang, Junfeng Tian, Min Gui, Zhixu Li*, Rui Wang, Ming Yan, Lihan Chen, Yanghua Xiao*: WikiDiverse: A Multimodal Entity Linking Dataset with Diversified Contextual Topics and Entity Types. ACL 2022
Qianyu He, Sijie Cheng, Zhixu Li*, Rui Xie, Yanghua Xiao*: Can Pre-trained Language Models Interpret Similes as Smart as Human? ACL 2022
Jiangjie Chen, Rui Xu, Ziquan Fu, Wei Shi, Zhongqiao Li, Xinbo Zhang, Changzhi Sun, Lei Li, Yanghua Xiao, Hao Zhou: E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning. ACL 2022
Jiangjie Chen, Qiaoben Bao, Changzhi Sun, Xinbo Zhang, Jiaze Chen, Hao Zhou, Yanghua Xiao, Lei Li: LOREN: Logic-Regularized Reasoning for Interpretable Fact Verification. AAAI 2022
Jiangjie Chen, Chun Gan, Sijie Cheng, Hao Zhou ,Yanghua Xiao, Lei Li: Unsupervised Editing for Counterfactual Stories. AAAI 2022
Yuyan Chen, Yanghua Xiao, Bang Liu: Grow-and-Clip: Informative-yet-Concise Evidence Distillation for Answer Explanation. ICDE 2022
Chao Wang, Jingping Liu, Tianyi Zhuang, Jiahang Li, Juntao Liu, Yanghua, Xiao, Wei Wang, Rui Xie: A Sequence-to-Sequence Model for Large-scale Chinese Abbreviation Database Construction. WSDM 2022: 1063-1071
Xinyao Shen, Jiangjie Chen, Jiaze Chen, Chun Zeng, Yanghua, Xiao: Diversified Query Generation Guided by Knowledge Graph. WSDM 2022: 897-907
Qiaoben Bao, Jiangjie Chen, Linfang Liu, Jingping Liu, Jiaqing Liang, Yanghua, Xiao: Harvesting More Answer Spans from Paragraph beyond Annotation. WSDM 2022: 27-36
Jingping Liu, Menghui Wang, Chao Wang, Jiaqing Liang, Lihan Chen, Haiyun Jiang, Yanghua, Xiao, Yunwen Chen: Learning Term Embeddings for Lexical Taxonomies. AAAI 2021: 6410-6417
Li Cui, Deqing Yang, Jiaxin Yu, Chengwei Hu, Jiayang Cheng, Jingjie Yi, Yanghua, Xiao: Refining Sample Embeddings with Relation Prototypes to Enhance Continual Relation Extraction. ACL/IJCNLP 2021: 232-243
Qiao Cheng, Juntao Liu, Xiaoye Qu, Jin Zhao, Jiaqing Liang, Zhefeng Wang, Baoxing Huai, Nicholas Jing Yuan, Yanghua, Xiao: HacRED: A Large-Scale Relation Extraction Dataset Toward Hard Cases in Practical Applications. ACL/IJCNLP 2021(Findings): 2819-2831
Chenhao Xie, Jiaqing Liang, Jingping Liu, Chengsong Huang, Wenhao Huang, Yanghua, Xiao: Revisiting the Negative Data of Distantly Supervised Relation Extraction. ACL/IJCNLP 2021: 3572-3581
Chenhao Xie, Wenhao Huang, Jiaqing Liang, Chengsong Huang, Yanghua, Xiao: WebKE: Knowledge Extraction from Semi-structured Web with Pre-trained Markup Language Model. CIKM 2021: 2211-2220
Jiaqing Liang, Suo Feng, Chenhao Xie, Yanghua, Xiao, Jindong Chen, Seung-won Hwang: Bootstrapping Information Extraction via Conceptualization. ICDE 2021: 49-60
Xinyao Shen, Jiangjie Chen, Yanghua, Xiao: Diversified Paraphrase Generation with Commonsense Knowledge Graph. NLPCC 2021: 353-364
Li Cui, Deqing Yang, Jiayang Cheng, Yanghua, Xiao: Incorporating Syntactic Information into Relation Representations for Enhanced Relation Extraction. PAKDD 2021: 416-428
Siyu Yuan, Deqing Yang, Jiaqing Liang, Jilun Sun, Jingyue Huang, Kaiyan Cao, Yanghua, Xiao, Rui Xie: Large-Scale Multi-granular Concept Extraction Based on Machine Reading Comprehension. ISWC 2021: 93-110

Books

肖仰华, 徐波, 林欣, 李直旭, 彭鹏, 郑卫国, 邵斌, 何亮, 阳德青, 崔万云.《知识图谱：概念与技术》, 电子工业出版社, 2020
吴强, 肖仰华.《人工智能（高中版）》, 上海教育出版社, 2020
肖仰华.《图对称性理论及其在数据管理中的应用》, 科学出版社, 2018

Talks

各种形式知识图谱报告、讲座或授课近200场，代表性单位包括青海司法厅、微软、华为、阿里、平安、香港中文大学、高丽大学、北京大学、国防科技大学等。受国际学术会议邀请，包括 ADMA、PIC、ICT-BDCS、WISE、ASK、ICEEIS、AICS、IDEAL 等做大会报告、学术辅导、特邀讲座 10 余次。受中国计算机学会、中国人工智能学会、中国图书情报学会等多个学会邀请，做知识图谱特邀报告、讲座 10 多次。受到国家人社部发起的“国家级专业技术人才-语义网与知识图谱关键技术高级研修项目”邀请授课。

Teaching Courses

“知识图谱”专题课程.从 2018 年开始，先后在上海财经大学、中国农业大学、北京理工大学、苏州阳澄湖半岛等地举办了由 10 名专家授课、为期三天、累计 32 课时的《知识图谱：概念与技术》课程培训，数千人次参加了系统培训，受到了广泛好评，平均授课评分高达 9 分（满分 10 分）。2020 年该课程受到华为云赞助，开展在线公开授课，课程反响强烈，课程学员达 12744 人，观看总次数达到 47800 次，课程反响强烈。

Researcher

肖仰华