Promotions on the map
背景知识:下载项目介绍PPT]
据观察,许多商家(如家乐福、沃尔玛)都会在网站上发布一些折扣券或优惠信息,而每个不同地点的商家其折扣信息也会有所区别。基于这项观察,我们希望将商家的地址信息和折扣信息结合起来,并兼顾折扣信息的时效性,通过使用Web数据集成的技术自动集成打折信息并与相应地址的商家一一对应,同时提供一个友好的展示和交互界面。
实习内容:
Design and implement an integration system PromoMap for promotions on the map, which can provide following services:
• Collect, analyze, and display promotions in a map interface
• By panning and zooming in the map interface, users can retrieve promotions based on geographic regions
• See different promotions depending on the position and zoom level
技能要求:
• Basic knowledge on information retrieval
• Basic knowledge on tree based data structures
• Programming with C#, Java, B/S architecture
挑战:
• Collect and extract promotions precisely
• Correctly identify the geographic footprint of a promotion, i.e., geocoding
• Cluster promotions based on their services/locations
• Storage and operations of promotions
– Remove an expired promotion
– Search a similar/identical promotion
– Insert a new promotion
• User interface issues
培养能力:
• Knowledge:
– Spatial indexes
– Clustering algorithms
– Framework of geographic information system (GIS)
– Location based services
• Skills
– Research skills: paper reading & writing, problem formulation, solution proposal, experimental evaluation
– Developing skill with Google Maps API
接收本科生人数:
1人
闪存数据库图形化界面设计与实现
背景知识:
Berkeley DB是一个应用广泛的开源数据库,它体积小,不仅可以应用在嵌入式设备中,而且可以管理大容量存储设备。由于其结构简单而广泛地被各研究机构加以改进而成为各种特定的数据库原型系统。但是由于Berkeley DB没有图形界面,因此在性能演示方面存在很大的不足,无法直观形象地表现出应有的性能。
实习内容:
以Berkeley DB为基础,采用图形界面展示其功能和性能。需要在图形界面上实现以下功能:
• 数据库的建立、修改和删除
• 需要支持各种数据流下的数据插入,删除和更新
• 需要支持各种数据流下的对等查询和范围查询
• 图形化展示单个事务的执行,只需要追踪单个事物执行时的访问信息
技能要求:
• 熟练使用C/C++,最好能够使用MFC进行框架的构建
• 掌握Berkeley DB数据基本使用方法
培养能力:
• C/C++等编程语言的应用能力
• 对BerkeleyDB数据库的了解和使用
• 图形化界面的设计和实现方法
接收本科生人数:
1人
连续查询隐私保护展示程序设计与实现
背景知识:
R-树、Grid等空间索引结构
隐私保护的基本知识,如对位置k-匿名、概化等基本概念的了解。
Brinkhoff数据生成器
实习内容:
将连续查询隐私保护的算法以模块的形式整合到正在开发的隐私保护展示系统中,包括如下功能:
• 实现连续查询隐私保护算法
• 以适当的方式显示算法质量参数
• 基于Google Map API将连续查询隐私保护算法的实际效果在浏览器上动态展示
技能要求:
• 熟练使用Java语言
• 了解GoogleMap API的编程
培养能力:
• 了解隐私保护的相关知识,掌握连续查询隐私保护算法
• 通过参与项目的研究和开发培养实际编程的动手能力
• 通过学习隐私保护的知识和参与系统的团队开发,培养接受新知识和团队协作的能力
接收本科生人数:
1人
基于关注度分析的网络舆情预警功能设计与实现
背景知识:
随着网络的发展,论坛、博客、网络新闻等新媒体开始吸引越来越多受众的关注,而这些新媒体上对社会舆论的发展和嬗变发挥着越来越巨大的作用,一系列重大事件的发生都与网络新媒体的舆情有着非常直接的联系。我们认为,通过分析网民对重大事件的关注度的变化趋势可以实现对重大事件的提前预警,从而为政府决策争取更充分的准备时间。
实习内容:
网络舆情预警功能通过分析系统集成到的来自论坛、博客、网络新闻的数据,提取出热点事件并绘制相应的关注曲线,并通过分析已有重大事件的关注度曲线特征建立预警曲线模型,实现对将来发生的重大事件的预警。主要包括以下几个部分:
• 网络舆情数据的关键字聚类
• 重大事件的主题词发现
• 预警曲线模型的建立
• 实现基于预警曲线模型的重大事件监测和预警功能
技能要求:
• 熟练掌握Java编程语言
• 掌握PHP+MySQL+Apache平台架构
• 掌握HTML+DIV+CSS和网站界面设计与美化的相关知识
• 掌握Ajax技术者优先
培养能力:
• 使用Java语言进行应用系统开发的能力
• 掌握PHP+MySQL+Apache构建应用系统的方法
• 掌握HTML+DIV+CSS网站界面设计与开发技术
• 培养团队协作能力,学习应用系统开发流程规范
接收本科生人数:
1人
HBase存储结构研究与改进
背景知识:
• 了解数据库管理系统的基本结构和设计原理
• 了解分布式数据库的概念及特性
• 对云计算与云数据管理系统的概念有一定了解,熟悉MapReduce编程模型
• 了解Hadoop和Hbase的基本情况
实习内容:
• 基于hdfs环境上安装和配置Hbase
• 通过阅读Hbase源代码和撰写代码阅读报告深入了解Hbase的系统架构和实现机制
• 学习云计算技术的相关论文,并通过阅读代码研究Hbase的物理组织结构,与其他数据管理系统比较,总结出hbase的存储结构特点,提出改进的方向
技能要求:
• 了解或熟悉Java编程语言
• 熟悉linux操作系统和基本操作
培养能力:
• 论文阅读能力
• 代码阅读与分析能力
• 在linux环境下配置系统、编译系统与调试代码的实践能力
接收本科生人数:
1人
普适环境下的数据管理系统设计与实现
背景知识:
普适环境中,服务可在任何时间、任何地点、以任何方式接入和获取,需要为用户提供主动的服务。数据管理系统指在普适环境中管理用户的移动位置等信息,为用户提供查询服务,包括范围查询(“距离我1公里以内的饭店有哪些?”),近邻查询(“距离我最近的加油站在哪?”)等,并分析用户的行为模式,预测其行为,为其主动提供数据和服务。
实习内容:
开发普适环境中数据管理系统,包括移动对象查询模块和情景数据预取模块。
• 移动对象查询模块,为手机等移动对象用户提供包括范围查询,近邻查询等服务.
• 情景数据预取模块,根据数据库中存储的数据分析用户行为模式,进行行为模式匹配,预测用户行为,为用户提供主动的数据服务.
技能要求:
• 熟练掌握Windows环境下Eclipse开发
• 熟悉数据库及数据挖掘相关方面知识
• 了解图形学相关知识
培养能力:
• 学习数据库管理及数据挖掘等相关知识
• 学习移动环境中的相关问题,如何为手机移动用户提供GPS导航服务等
• 学习普适环境中关于主动服务等知识
• 与同学合作,培养系统开发及协作能力
接收本科生人数:
1人
集成搜索引擎系统研发
背景知识:
问题:搜索引擎成为目前人们享用web数据资源的重要途径。但是目前由于各搜索引擎采用的技术不同,因此人们利用搜索引擎获取信息的效率不高,表现在:
(1) 一是查全率的问题。返回信息不全
(2) 二是查准率的问题,返回结果太多
(3) 三是查询途径繁琐,往往需要通过几个搜索引擎才能找到所需要的东西
因此如何通过web数据集成技术,对搜索结果进行集成、加工与分析,更加高效的为用户提供服务,具有重要的理论意义和现实意义。
实习内容:
• 阅读Web数据抽取方面的经典论文和最新研究成果,了解Web数据集成的方法
• 开发一个集成搜索引擎原型系统
• 在我们已有的工作中已实现了不同网站搜索结果的合并,本课题重点在于对合并结果的进一步处理,包括去除重复记录、排序、改进查询接口等
技能要求:
• 熟练掌握Java程序开发语言
• 熟练阅读英文论文的能力
• 踏实、守信、有责任心
培养能力:
• 独立完成一个实用软件系统的能力
• 基于Java语言的软件开发技术
• 融入团队、协同工作的能力
接收本科生人数:
1人
面向领域的中文文献集成系统设计与实现
背景知识:
C-DBLP是WAMDM实验室开发的一个面向计算机领域的中文文献集成系统,目前系统中已经集成了计算机领域的国内一些权威期刊的文献。通过开发C-DBLP的经验,我们进一步验证了实验室在Web数据集成技术上的成果的有效性。然而,人文社会科学领域(如经济、法律等)仍然缺乏一个类似于C-DBLP的以作者为中心提供文献检索和展示功能的系统,因此我们计划利用已有技术开发一个面向人文社会科学领域的中文文献集成系统。
实习内容:
利用实验室在Web数据集成方面的已有技术,构建一个面向人文社会科学的专门领域(如法律、经济等)的中文文献集成系统,提供以文献作者为中心的检索和展示方式。主要包括以下两个方面:
• 学习面向领域的Web数据集成技术,并在此基础上开发一个自动集成人文社会科学专门领域的数据集成系统。
• 基于PHP+MySQL+Apache平台构建一个以文献作者为中心的展示文献发表情况的网站并实际上线运行。
技能要求:
• 熟练掌握Java编程语言
• 了解PHP+MySQL+Apache平台,了解使用该平台构建数据库应用的方法
• 了解HTML+DIV+CSS和网站界面设计与美化的相关知识
• 有应用系统开发经验者优先
培养能力:
• 使用Java语言进行应用开发的能力
• 掌握PHP+MySQL+Apache构建应用系统的基本方法
• 掌握HTML+DIV+CSS网站界面设计与开发技术
• 通过参与实际系统开发,培养团队协作能力,学习应用系统开发流程规范
接收本科生人数:
1人
Maintained by Zhongyuan Wang() Copyright © 2007-2009 WAMDM, All rights reserved