科技顶天 市场立地 对话北京大学计算机科学技术研究所
在全球经济一体化的今天,中文信息科技遍布生活、娱乐、学习等各个方面,成为现代人类日常生活不可缺少的重要组成部分。然而,在上个世纪70年代,让汉字进入计算机曾一度被认为是“不可能完成的任务”,而王选院士带领北京大学计算机科学技术研究所(下称北大计算机所)北大科研团队研制的“汉字信息处理与激光照排技术”,成功破解了这一难题,从此印刷业从“铅与火”的时代迈入“光与电”的新纪元。
然而,成功的背后是王选攻坚克难、默默无闻地付出: 在当时,因为国产计算机速度慢,存贮量小,而汉字的字数多,字号大小不一,又有多种字体,所以如何将信息量庞大的汉字自如地在计算机中存储和输出成为主要技术难关。经反复钻研,王选发明了“轮廓加参数”的汉字信息压缩法和高速复原技术,使汉字的存储量被总体压缩500-1000倍,并实现了汉字字形每秒710字的快速复原以及变倍和变形时的高度保真,解决了这一世界级的技术难题。
不仅如此,在王选院士的带领和精神感召下,团队还研发出全程数字化的“报业数字资产管理系统”,告别纸与笔、开启数字播控的“数字化音视频控制技术研究及应用”,摆脱磁带束缚、“基于数字版权保护的电子图书出版及应用系统”、“跨媒体智能识别技术”、“个性化字体生成技术”、“人工智能写稿机器人”等前沿科技,其研发的各项技术多次促进我国相关行业实现了技术变革和产业颠覆性发展,产生了重大的社会与经济效益。
今年是北大建校120周年,也是北大计算机所建所35周年,记者借此机会走访了中国最早的计算机科学研究机构,也是产业化落地效果最为显著的研究机构之一——北京大学计算机科学技术研究所,与团队成员探讨了在现代智能化科技发展大环境下,如何坚守“科技顶天、市场立地”的王选精神传承,坚守科技强国之初心,让科研技术服务大众生活。
Q:这不断发展的35年对北大、对计算机所有什么意义?
郭宗明(北大计算机所所长):简单可以归纳为王选精神在传承,王选事业在发展。王老师的精神有很多,不同人有不同理解,比如好人精神、科研执着精神等。从一个单位的角度来讲,也就是“顶天立地”,顶天指的是最先进的科学技术,立地就是大范围科技成果的应用。到目前为止我们研究所还是坚持这样一个作风,我们要面向应用,哪怕是短期没有应用的,长期有应用前景的,这也是我们研究所一直坚持的。
首先是做面向应用的研究。我们研究所当然也做基础研究,但是我们的特点应该还是面向应用的研究,也就是我们的研究成果最后都是要落地的。我们也有一些研究成果可能短期内,或者目前来看,并不一定能用到实践当中,比如所里某些研究成果是面向基于语义的,可能它并没有一定在哪个行业里应用,但是我们长远的目标是这样。再如,所里研究的高考机器人也是一样的,高考机器人背后的核心,背后通用的技术是人工智能,我们把它摘成一条一条的叫知识点、知识条目。
二是我们的应用主要面向媒体,比如说出版、广播、电视、网络媒体等等,当然我们不限于媒体,我们也有语言、医学、金融等等合作。但是要说我们特点的话,我们主要是这两个,一个是面向应用的研究,另一个就是应用主要在媒体行业。
Q:现在像微软等企业,他们都有自己的研究院,也是奔着应用去的,这个跟北大计算机所有什么区别?
赵东岩(北大计算机所学术委员会委员):我觉得服务对象和立项需求不同。企业的研究院毕竟是企业投资来创办的,自主研发的知识产权是为企业服务的。而高校研究所,它更强调通用性,服务对象更强调社会普遍性。在展开合作时,不拘泥于某个企业或单位绑定服务。所以,我们的研发确实面临挑战,但我们的科学研究能从社会意义、社会发展角度得到前进的动力。
郭宗明:企业里面资源更丰富,它更偏重一些功能性的东西。北大计算机所纯粹拼资源很难跟企业比,这种情况逼着我们更注重原创性研究,这是最大的区别。
Q:原创也很难,计算机所是怎么开展原创研究的?
彭宇新(北大计算机所学术委员会委员):一些技术不是想做就能做的,它是需要一个长时间的积累,我们的研究是基于先有积累。比如,我是做图像视频、媒体的分析和检索的,这早在2000年就着手研究了。所以说比较有门槛的项目技术,经过长时间积累,做到人无我有的局面就比较有优势。
赵东岩:这个项目实际上是为了检验自然语言处理现在研究的技术水平,在实际的高考这种基于文本的问答,就是以QA任务水平来设计的一个项目。
我们问题的输入跟考生一样就是一个纸的卷子,我们在后面要做基于文字的语言理解,让机器来理解这个文字的语言,并且运用相应领域知识,包括数学、语文、地理和历史。我们这个课题组是偏重于地理这个试题的解答,运用这个知识,最后去生成相应的答案,答案基本形式有选择题和简答题这两种。也就是说一种是直接给ABCD,一种是生成文字,把你的答案再变成这个文字,这又涉及到计算机的生成语言来去解答。
人工智能是未来
Q:据了解,研究所跟南方都市报、今日头条开展了合作,我想知道近期有没有新的规划?有没有一些新的项目?
万小军:我们会推出一个语音采访跟写稿一体化的人工智能机器人,它会面对一个被采访对象主动提问,用答复和基本的数据组成一个基本的稿件,未来两三年会取代一些重复性、琐碎的工作,使劳动力结构朝着智能化趋势发展,为社会发展做出更多贡献。
郭宗明:因为北大定了一个2035年的规划:要跻身到世界一流大学前列,所以把我们2035年的远景跟大家做个分享。
1966年,计算机界人工智能的先驱Marvin Minsky(英)教授描绘了这样一个场景:一个计算机连着一个摄像头,摄像头看着一台电视,并能和电视旁边的观众叙述电视里边放什么内容。他描绘的场景,我们今天没完全实现,但我们有理由相信这个完全可以实现。到2035年,计算机研究所就能实现Marvin Minsky(英)教授描绘的场景,而且会超过,我们的目标是跨媒体语义理解和内容生成。