WAMDM实验室举办复杂关联数据管理研讨会

        2015年4月8日,由WAMDM实验室主办的“复杂关联数据管理研讨会”在中国人民大学逸夫会议中心第一会议室举行,来自北京大学、清华大学、中国人民大学、微软亚洲研究院四个单位的相关科研人员出席了研讨会。会议由中国人民大学孟小峰主持并致开幕词。        


参会人员合影

         大数据的出现颠覆了传统的数据管理模式,在数据来源、数据处理方式和数据思维等方面带来了革命性的变化。如何从缤纷繁杂、充满噪音信息的大数据海洋中获取有价值的信息、发现可用的知识,已成为学术界和工业界广为关注的问题。2006年,W3C的创建者Tim Berners-Lee提出了发展数据Web(Web of Data)的思想,其核心和关键技术就是是关联数据(Linked Data)。关联数据基于RDF、HTTP、IRI/URI、SPARQL等技术,在Web上发布结构化数据并将不同数据源的数据相互关联,使一个数据源的数据可以有效地与其它数据源数据相互关联,并且规定了数据的发布原则,为数据发布提供指导。关联数据的提出为大数据的处理提供了借鉴思路,目前已引起了工业界和学术界广泛关注,2012年5月17日,谷歌官方宣布发布“知识图谱”(Knowledge Graph)智能搜索功能,标志着关联数据在工业界真正进入实践。        

孟小峰教授主持会议


覃飙副教授做报告

         本次研讨会上,来自微软亚洲研究院的王仲远副研究员(王仲远系WAMDM实验2010届校友)作了题为:“基于知识库的短文本概念化及其应用”的报告,系统介绍了该团队基于概率建模的知识库Probase上所做的研究及应用。中国人民大学王秋月博士作了题为:“基于大规模知识库的语义搜索和自然语言问答”的报告,并介绍了她访问德国马克斯普朗克研究所Gerhard Weikum教授所领导的数据库与信息系统研究组期间,了解到的国际上关联数据的研究概况。中国人民大学覃飙副教授作了题为:“基于hive的日志数据挖掘”的报告。北京大学邹磊副教授作了题为:“基于图的RDF数据管理”报告,介绍了该团队在gStore系统的基础上以大图匹配等为核心方法所做的关联数据查询处理方面的研究工作。清华大学王建勇教授作了题为:“Entity Linking with a Knowledge Base for Heterogeneous Data”的报告,介绍了用知识图谱方法解决异质数据实体关联的研究。孟小峰教授最后做了总结发言,对本次研讨会做了点评,希望四个单位研究小组相互之间加强协调沟通,以期在关联数据的研究上有重大突破。