会议详细程序
2013年12月7日(星期六)8:40-09:00

大会开幕式
主持人:孟小峰 程序委员会主席 (中国人民大学)
地  点:三层报告厅

2013年12月7日(星期六)9:00 - 10:20

大会报告
主持人:李建中 大会主席(哈尔滨工业大学)
地  点:三层报告厅

报告1:Challenges of Big Data in Scientific Discovery[Slides]
华云生教授 香港中文大学
时间:9:00-09:40

报告2:关于大数据研究的若干科学问题及其初步探索
徐宗本院士 西安交通大学
时间:9:40-10:20

2013年12月7日(星期六)10:20-10:40

茶歇(三层咖啡角)

2013年12月7日(星期六)10:40-12:00

大会报告
主持人:张良杰 大会主席(金蝶国际软件集团)
地点:三层报告厅

报告3:Challenges in Accelerating Big Data Processing on Modern Clusters[Slides]
D.K.Panda教授 Ohio State University
时间:10:40-11:20

报告4:大数据存储系统的研究与实践[Slides]
郑纬民教授 清华大学
时间:11:20-12:00

2013年12月7日(星期六)12:00-13:30

午餐(三层报告厅 )

2013年12月7日(星期六)13:30-15:10

分组报告A1:存储管理
主持人:彭智勇
地  点:二层202A

  • WikiSensing:从大数据到数据产品
    吴超, 李骏翔,Dilshan Silva,David Birch,Orestis Tsinalis,李漾,严舒琳,郭毅可
  • 物联网海量异构数据存储与共享策略研究
    田野, 李廷力, 延志伟, 李宏宇
  • GeoFS:一个广域文件系统的设计与实现
    刘国良, 马留英, 闫鹏飞, 张帅, 刘浏
  • 一种可伸缩的多租户数据自适应存储方法
    谷连超, 崔立真
  • 基于二元再生码的大数据存储系统研究
    黄显霞, 李挥, 张宇蒙, 侯韩旭, 周泰, 郭涵, 张华宇
  • 应用于大数据存储的二元再生码的构造
    侯韩旭,李挥,张华宇,朱兵
  • 基于LNS的科学工作流大数据布局策略
    张甜甜, 崔立真
  • 一种支持海量数据备份的可扩展分布式重复数据删除系统
    刘厚贵, 邢晶, 霍志刚, 安学军

分组报告A2:并行算法
主持人:于俊清
地  点:二层202B

  • 基于MapReduce的高效频繁子图挖掘算法
    孙鹤立, 陈强, 刘玮, 黄健斌, 邹建华
  • Asyn-SimRank:一种异步执行的大规模SimRank算法
    王春磊, 张岩峰, 赵长宽, 于戈, Lixin Gao
  • 大图数据上顶点驱动的并行最小生成树算法
    谷峪,杨佳学,鲍玉斌,于戈
  • 基于分布内存数据库的并行化层次短语机器翻译算法
    赵博, 黄书剑, 戴新宇, 袁春风, 黄宜华
  • BSP模型下基于边聚簇特性的大图划分与迭代处理
    刘金鹏, 王志刚, 陈昌宁, 冷芳玲, 鲍玉斌, 于戈, 邓超
  • MapReduce框架下基于超平面投影划分的Skyline计算
    王淑艳, 杨鑫, 李克秋
  • 基于Map-Reduce的大数据实体识别算法
    霍然, 王宏志, 朱鎔, 李建中, 高宏
  • PHCC:一种处理稀疏变化的封闭数据立方体算法
    牟雁超, 李红燕, 王腾蛟

分组报告A3:分析挖掘
主持人:李翠平
地  点:二层203A

  • 面向大规模微博消息流的突发话题检测
    申国伟, 杨武, 王巍, 于淼
  • 基于细粒度视频标签的在线视频广告投放机制研究
    陆枫, 王子锐, 廖小飞, 金海
  • 面向微博的关注好友推荐模型研究
    邓巧, 李舟军, 张小明, 闫昭
  • 面向微博的概率图水军识别模型
    韩忠明, 许峰敏, 鸥雪娥, 段大高
  • 大数据应用的现状与展望
    张引, 陈敏, 廖小飞
  • 基于迭代训练的Web Service混合协同过滤推荐模型
    王斌斌, 周作建, 过洁, 潘金贵
  • 基于MapReduce并行架构的大数据社会网络社团挖掘方法
    邓波, 张玉超, 金松昌, 林旺群

分组报告A4:体系结构
主持人:肖侬
地  点:二层203B

  • 数据中心异构网络结构的扩展性和成本评价模型
    陆菲菲, 谢向辉, 郭得科, 朱桂明, 方兴
  • MALK:面向共享存储多核系统高效处理大规模键值的MapReduce框架
    郑亚松, 王达, 叶笑春, 崔慧敏, 徐远超, 范东睿
  • 面向大数据应用的众核处理器缓存结构优化
    徐远超, 范灵俊, 唐士斌, 张浩, 苗福涛, 范东睿
  • Hadoop系统性能优化与功能增强综述
    李瑞轩, 董新华, 周湾湾, 王聪, 薛正元, 廖东杰
  • 适用于大数据的属性基广义签密方案
    韩益亮, 卢万谊, 武光明, 杨晓元
  • 覆盖网络上基于内容的混合路由方法
    王越, 陈明文, 肖政, 王志强, 虎嵩林

2013年12月7日(星期六)15:10-15:30

茶歇(二层南序厅)

2013年12月7日(星期六)15:30-17:10

分组报告B1:查询检索
主持人:申德荣
地  点:二层202A

  • 基于超球体过滤的大规模图像自适应检索
    艾列富, 于俊清, 管涛, 何云峰
  • 海量高维向量的并行Top-k连接查询
    马友忠, 慈祥
  • 基于框架语义的隐式篇章关系推理
    严为绒, 洪宇, 朱珊珊, 姚建民, 朱巧明
  • 大数据下基于MapReduce的快速kNN Join
    戴健, 丁治明
  • 面向带有关联关系数据的分布式相似性查询方法
    朱命冬, 申德荣, 解宁, 于戈, 寇月, 聂铁铮
  • 不确定数据流上高效可扩展的并行Skyline查询算法
    赵越, 王意洁, 王媛, 李小勇
  • 面向海量多版本文档的加权持久性top-k检索问题研究
    兰超, 张勇, 邢春晓
  • 基于改进DPhyp算法的Impala查询优化
    周强, 陈岭, 马骄阳, 赵宇亮, 吴勇, 王敬昌

分组报告B2:机器学习
主持人:寇怀忠
地  点:二层202B

  • YARM:基于MapReduce的高效可扩展的语义推理引擎
    顾荣, 王芳芳, 袁春风, 黄宜华
  • 面向大数据流的在线多核学习算法
    张钢, 黄英, 印鉴, 黄小波Gao
  • 基于函数型聚类的层次文本分类方法
    郝立丽, 郝立柱
  • 基于大规模开放网络本体库的信息检索与知识挖掘
    王元卓, 贾岩涛, 刘大伟, 靳小龙, 程学旗
  • 基于大数据环境下用于实体解析的两层相关性聚类算法
    王宁, 李杰
  • 基于多路层次聚类的商品评论数据概念分类构建
    涂鼎, 陈岭, 陈根才, 吴勇, 王敬昌
  • 一种基于Hadoop的语义大数据分布式推理框架
    陈曦, 陈华钧, 顾珮嵚, 张宁豫, 于彤
  • StepMatch:一种基于BSP计算模型的SPARQL基本图模式匹配算法
    吕雪栋, 王鑫, 冯志勇, 付宇新

分组报告B3:大数据应用
主持人:金培权
地  点:二层203A

  • 基于社会正则的行为定向
    尚燕敏, 张鹏, 曹亚男
  • 从移动数据中挖掘网络节点的影响力
    刘志鹏, 皮德常
  • 基于联合聚类平滑的协同过滤算法
    韦素云, 业宁, 吉根林
  • 大规模事件数据处理的覆盖检测优化算法
    陈明文, 肖政, 虎嵩林, 汉斯.阿诺, 雅各布森, 刘志勇
  • 面向海量热成像数据的实时飞机跟踪技术研究
    顾嘉, 张睿, 何慧钧, 张文强
  • 扩展车联网应用中的海量传感器信息处理技术研究
    郑笛, 王俊, 贲可荣
  • CCDet:一种高效的大规模中文重复网页检测方法
    韦永壮, 袁春风, 黄宜华
  • 大数据空间挖掘算法及应用
    刘利钊, 朱顺痣, 刘键, 段嘉诚, 李琦, 谭建东

分组报告B4:安全与隐私
主持人:周涛(启明星辰)
地  点:二层203B

  • NTar:基于网络拓扑的纠删码树型修复方法
    许方亮, 王意洁, 裴晓强
  • MapReduce上基于抽样的数据划分最优化研究
    韩蕾, 孙徐湛, 陈立军
  • 虚拟机语义鸿沟问题研究
    王晓睿, 王清贤, 郭玉东, 卢建平
  • 基于帧时隙二进制树的RFID标签识别方法
    崔灵果, 肖风, 柴森春, 张百海
  • 密文检索中基于访问模式的文档群组隐私挖掘
    蔡克, 张敏, 付艳艳, 冯登国
  • 大数据时代的个人隐私保护
    刘雅辉, 张铁赢, 程学旗

2013年12月7日(星期六)17:10-18:30

晚餐(三层报告厅 )

2013年12月8日(星期日)8:30-10:00

专题:大数据热点问题与2014年发展趋势[Slides]
主持人:程学旗(中科院计算所)、潘柱廷(北京启明星辰信息技术有限公司)
地点:三层报告厅

研讨专家:
李国杰(中国工程院院士,CCF大数据专家委员会主任)
田溯宁(中国宽带资本基金董事长)
黄亚楼(天津市滨海新区科委主任)
施水才(北京拓尔思信息技术股份有限公司总裁)
赵国栋(宏源证券计算机与互联网行业分析师)
杜小勇(中国人民大学信息学院院长、教授)
章文嵩(阿里集团高级研究员、副总裁)
张潼(百度IDL首席科学家)

2013年12月8日(星期日)10:00–10:20

茶歇(三层咖啡角)

2013年12月8日(星期日)10:20-12:10

专题:大数据系统、分析与安全
主持人:金海(华中科技大学)、孟小峰(中国人民大学)、黄宜华(南京大学)
地点:三层报告厅

专题报告:
大数据存储体系结构探讨
冯丹(华中科技大学教授)
Pivotal大数据解决方案介绍[Slides]
杨胜文(Pivotal 资深软件开发工程师)
有安全感的数据化生存
吴甘沙(英特尔中国研究院 首席工程师)
应用导向的数据中心计算机系统的设计[Slides]
张立新(中科院计算所 副总工程师)

研讨专家:
过敏意(上海交通大学教授)[Slides]
肖侬(国防科技大学教授)[Slides]
陈文光(清华大学教授)[Slides]
袁晓如(北京大学研究员)[Slides]
朱扬勇(复旦大学教授)
金波(公安部第三研究所研究员)

2013年12月8日(星期日)12:00–13:30

午餐(三层报告厅 )

2013年12月8日(星期日)13:30-15:10

专题:网络空间大数据应用
主持人:白硕(上海证券交易所)、陈继东(人人游戏)、周傲英(华东师范大学)
地点:三层报告厅

专题报告:
联通大数据应用 [Slides]
范济安(中国联通信息化和电子商务事业部数据中心副总经理)
Big Data, Big Impact: Using Mobile Phone Data in Human Behavior Analysis, Trajectory Prediction and Disaster Response[Slides]
吕欣(Flowminder基金会 联合创始人)
自然语言处理技术与大数据分析
赵东岩(北京大学计算机科学技术研究所 研究员)
互联网电商大数据应用
周涛(电子科技大学 教授)

研讨专家:
崔晓波(腾云天下(Talking Data)科技有限公司CEO)
廖亚滨(国信证券股份有限公司首席工程师)
刘鹏(前MediaV首席科学家)
石勇(中国科学院大学管理学院教授)[Slides]
王晓阳(复旦大学教授)
张小沛(宜信大数据创新中心总经理)

2013年12月8日(星期日)15:10-15:30

茶歇(三层咖啡角)

2013年12月8日(星期日)15:30-17:10

专题:物理空间大数据应用
主持人:黎建辉(中国科学院计算机网络信息中心)、胡斌(兰州大学)、田捷(中国科学院自动化研究所)
地点:三层报告厅

专题报告:
基因组与大数据
陈润生院士(中科院生物物理所研究员)
科研大数据关键技术和实践[Slides]
陈刚(中科院高能物理所研究员)
对地观测领域的若干大数据问题初探[Slides]
李国庆(中科院遥感与数据地球研究所研究员)
Big Data Algorithms for Clinical Prediction: A Case Study[Slides]
陈一昕(美国华盛顿大学副教授)

研讨专家:
王晓民(首都医科大学教授)
马俊才(中国科学院微生物研究所网络信息中心研究员)
崔辰州(中国科学院国家天文台研究员)
何洪林(中国科学院地理科学与资源研究所研究员)