《数据库大师访谈录》

数据库大师访谈录
孟小峰等译,华章/机械工业出版社

数据库技术从20世纪60年代中期产生到今天经历了四十多年的历史,从层次网状数据库、关系数据库、对象数据库、对象-关系数据库、XML数据库,到数据挖掘、数据集成、Web数据管理等,造就了C. W. Bachman、E. F. Codd和Jim Gray为代表的图灵奖得主;发展了以DBMS技术为核心的数据管理方法,使数据管理发生了革命性的变革。这里凝聚的是数据库大师们留下的智慧结晶和经典研究。特别值得一提的是,2015年Michael Stonebraker以其杰出的数据库创新系统成就荣获2014年图灵奖,并应邀来到中国在中国计算机大会上分享其成功的经验。

ACM SIGMOD Record从2001年开始,开辟了一个有趣的栏目叫数据库领域杰出人物访谈(Database Distinguished Profile),每期采访一两位在数据库领域发展历史上有卓越贡献的一代大师,至今已有几十位之多。起初我看到这样的访谈很受启发,便作为入门读物推荐给我的博士生阅读,其用意是让他们感受这些大师的所思、所想、所为,启迪他们的人生理想和智慧,颇有收益。在一遍遍品味中,大师们身上所体现的科研态度、创新意识、社会责任,今天看来依然很有价值,发人深省。作为一个多年从事数据库研究的学者,直觉告诉我应该把这些访谈译成中文,或许对我们自己,对他人,对社会都是有益的。经过近两年多的努力,我们选择其中有代表性的18篇访谈译成中文并汇集成册。

从这18篇访谈所涉及的18位人物的卓越经历,分明勾绘出了数据库领域初创时期的一部宏伟的历史画卷。从一无所知开始,仅凭一只铅笔、一台电脑以及坚定的信念,就此开创出丰功伟绩,并改变着世界。从这18位身上,我看到了如下具有丰富色彩的经典画面:

理论研究和系统实现相行不悖:数据库技术能取得今天的地位和成就,得益于此。这个领域的初创者们多是理论研究出身,但他们毅然而然地投身到系统开发之中,使得这门技术得以摆脱空中楼阁、画饼充饥的窘境。吉姆·格雷、迈克尔·斯通布雷克博士毕业便直接投身系统开发,但同时又做出很好的理论工作;杰弗里·乌尔曼、戴维·迈尔、格哈德·威肯、瑟格·阿比特博、杰弗里·诺顿等等理论出身的大家,敢于毅然否定自我回归系统;拉古·罗摩克里希干脆就是工业界和学术界的两栖者。读着这些人物访谈,你会感受到这样的景象,一群才华横溢的学者,频繁穿梭于学术界和工业界,时而奋笔疾书铸就理论华章,时而埋头苦干奉献系统经典。此种场面当下已不多见。

人才培养和学术环境奉为要旨:正如韩家炜所言“培养出色的学生是最有意义的事情”成为这批学者的共同心愿,而他们培养学生的法宝在于提出创新性的研究课题带领学生们攻坚克难。珍妮弗·威多姆对学生写作技巧和报告技能的培养;黄奎勇每周六深夜凌晨的博士讨论班;帕特·塞林格如何使刚毕业的博士尽快成长等等令人难忘。同时大师们对当下的学术环境建言献策,为年青学者的成长出谋划策。他们谈到了高校终身教职的异化、学术会议论文评审的扭曲、对“只做改进性工作,而不致力于研究突破性问题”的焦虑,实在值得我们深思。

三大重镇与良性竞争成为美谈:18位大师大致来自三所高校成就了数据库领域的三大重镇:斯坦福(杰弗里·乌尔曼、吉奥·威德厚德、赫克托·加西亚·莫利纳、瑟格·阿比特博、珍妮弗·威多姆、黄奎勇)、威斯康星(戴维·德维特、杰弗里·诺顿、拉古·罗摩克里希、韩家炜)、加州伯克利(迈克尔·斯通布雷克、吉姆·格雷、迈克尔·富兰克林),这成为当时数据库领域的盛景,各成一派。斯坦福流派以理论见长,加州伯克利和威斯康星以系统取胜,尤其是斯坦福和威斯康星在那个年代经常调侃彼此,隔空喊话,良性竞争,亦成美谈。

学术休假和多彩人生铸就成功:从这些大师身上我深深感觉到学术研究不是苦行僧,大的智慧多来自与自然的接触、来自在文学艺术的徜徉之中,学术休假成为学术研究的加油站。这里有很多的画面经常在我脑中浮现,挥之不去,而且我分明感到那就是他们成就事业的灵感之源。吉姆·格雷的扬帆远行;格哈德·威肯的沙漠独行;珍妮弗·威多姆的悠扬小号和环球家庭旅行;瑟格·阿比特博出版小说、喜欢雕塑;戴维·迈尔几乎探访巴黎所有博物馆等等。这些人还有一个共同点就是顾家,他们完美地处理好了工作、生活、社会责任。

社会责任和淡泊名利堪称楷模:这些大师多是美国科学院、工程院院士,ACM、IEEE双料会士,在功成名就后勇于承担社会责任,为促进本领域发展尽职尽责。吉姆·格雷担任美国总统信息技术顾问委员会(PITAC)顾问,吉奥·威德厚德担任研究基金的项目主管,戴维·德维特担任NSF CISE顾问,黄奎勇担任韩国信息科学学会会长等,他们真正站在前沿以独立的视角没有本位不带功利地代表所属领域的同仁为国献策,为学科发展竭尽全力鼓与呼,而国内远望去只见钱学森那一代人留下的一抹背影。

这些大师多来自世界各地,在美学成后有些回归故里,致力振兴本国的科研。瑟格·阿比特博谈到在法国组建研究团队的经历;格哈德·威肯介绍在德国组织庞大的研究团队的得失;西·莫汉介绍了印度计算机科学发展状况;赫克托·加西亚·莫利纳谈到墨西哥的研究现状;黄奎勇提到在韩国提升学术研究和促进学会工作的举措;克里斯托·法拉特谈到众多希腊人从事数据库研究的情况;韩家炜谈到文革后出国留学和对中国寄于的厚望。

还有很多耐人深思的画面寓于其中,有待读者们去体会,去挖掘。通过这次推出的中文版,我们希望大师们的智慧能够启迪国内数据库研究者前进的方向,指导我们如何做好理论研究,如何开发出创新系统。我们也希望将大师们的创新意识、灵感、科研经验及处事之道作为智慧的种子,播撒到今日中国众多朝气蓬勃的数据库学子心中。

受此访谈的启发,我也曾在三年前在《中国计算机学会通讯》的动态栏目组织了人物访谈系列文章,先后介绍了张效祥、夏培肃、杨芙清、徐家福、姚期智、华云生、李凯、赵伟、张晓东等一批国内外中国学者,话题涵盖了我国计算机事业的诞生、中美科研机制的优劣、人才培养、学术研究等,且图文并茂,也是一份不错的读物,或许可以与本书的访谈互为补充,相得益彰。

全书包括十八篇访谈。初稿包括十五篇,于2012年初译供内部使用,2013年哈尔滨数据库年会上曾发送过少量征求意见稿。在此基础上,经过反复的修订,并增补三篇译稿,成此书正式出版以飨读者。在此特别感谢华章姚蕾编辑为此书出版付出的努力。由于本书涉及面广,译者水平有限,译文中的不当之处在所难免,敬请原谅,希望读者朋友们不吝赐教,我们将不胜感激。

孟小峰
2014年清明时节于北京
2015年国庆节于北京修订

内容简介:

杰弗里•乌尔曼(Jeffrey D. Ullman):我最大的失败就是做了太多纸上谈兵的事情(理论工作);一个成功的商业计划应该可以作为一个博士论文;工业界的研究实验室还有吸引力吗;对在线教育的独特见解。[译文下载]

吉奥•威德厚德(Gio Wiederhold):怎样成为一位有效的咨询顾问;为什么要担任研究基金的项目主管;数据库应用与中间件;对大学聘用制度的看法。[译文下载]

吉姆•格雷(Jim Gray):学术研究与系统实现完美统一;数据库领域还能再活30年吗;为何性能不再是问题;核心数据库的研究是否过时;美国总统信息技术顾问委员会(PITAC)会产生持久性影响吗;帆船爱好者......[译文下载]

迈克尔•斯通布雷克(Michael Stonebraker):开发Ingres的酸甜苦辣;数据库理论研究的成功与失败;创业的艰辛;学术界最大的问题是每个人为终身教职挤破头皮;任教加州大大学伯克利分校和麻省理工学院。[译文下载]

帕特•塞林格(Pat Selinger ):System R的成功之道;如何领导3000人的研发团队;成功转化技术的秘诀;如何使刚毕业的博士尽快成长为研究员。[译文下载]

戴维•德维特(David DeWitt ):如何把精力合理分配到论文写作和系统开发;对NSF资助项目体系的看法;查询优化的改进;对会议论文评审的看法;如何吸引更多的人进入计算机专业。[译文下载]

赫克托•加西亚•莫利纳(Hector Garcia-Molina ):真的是工业界在主导当今的研究吗;信息集成还有很多难以解决的开放问题;如何处理好工作、生活、社会责任;墨西哥的研究现状;担任斯坦福计算机系主任。[译文下载]

西•莫汉(C. Mohan ):TODS历史上最长的关于ARIES的论文;R*系统和消息队列;印度计算机科学发展状况;对AT&T、贝尔、惠普、微软等研究型实验室的评价。[译文下载]

戴维•迈尔(David Maier ):面向对象数据库的成败;如何在非著名大学做出大成就;当今数据库理论研究的角色;理论与系统兼顾;探访巴黎博物馆。[译文下载]

格哈德•威肯(Gerhard Weikum ):如何迎接新的挑战;如何在德国组织庞大的研究团队;如何做到研究上宽泛而不失专注;如何看待SQL;从精确问题转向统计问题;独自沙漠旅行。[译文下载]

瑟格•阿比特博(Serge Abiteboul ):如何在法国组建一个研究团队;为什么系统文章不必包含性能测试;研究者的性格与人格对成功的影响;写小说、喜欢雕塑、顾家。[译文下载]

珍妮弗•威多姆(Jennifer Widom ):如何开辟新的领域并成为领军者;既能在事业上有所成就又能教育好子女的关键是选择一个好丈夫;小号表演专业与数据库研究;IBM的日子充满诗意;写作技巧和报告技能的培养;环球家庭旅行。[译文下载]

杰弗里•诺顿(Jeffrey Naughton ):“数据库系统是控制狂”;如何看待当下数据库领域“只做改进性工作,而不致力于研究突破性问题”;XML是一个失败吗;从纯粹的理论研究者转变为核心系统研究者;如何挑选学生。[译文下载]

黄奎勇(Kyu-Young Whang ):美国和韩国高校学术环境的差异;自主开发45万行的Odysseus系统并应用于韩国最大门户网站;为什么不创办一家公司推广Odysseus;周六深夜凌晨的博士讨论班;对韩国信息科学学会的推动。[译文下载]

拉古•罗摩克里希(Raghu Ramakrishnan ):工业界和学术界的两栖者;研究的螺旋周期;如何轻易烧掉2000万美元;数据隐私与安全;演绎数据库的成败;幽默感。[译文下载]

克里斯托•法拉特(Christos Faloutsos ):合作研究的大师(科学界、统计学界、工业界等);维数灾难问题;数据挖掘领域未来的方向;很多希腊人都从事数据库研究;如何做好学术休假;人无法摆脱那些枯草无味的事![译文下载]

韩家炜(Jiawei Han ):进入数据挖掘领域;有关数据挖掘的争论,隐私保护;培养出色的学生应该是最有意义的事情;h指数超过76;文革后的人生转折,赴美留学经历。[译文下载]

陈品山(Peter Chen ):发现ER概念是一生一次的机遇;为什么ER数据库系统没有出现;ER数据库的应用-发现恐怖分子;ER会议;将ER模型概念推广到其他领域。[译文下载]