内容摘要:在2015年度国家科学技术奖励大会上,由百度与中国科学院自动化所、中国科学院计算技术研究所、浙江大学、哈尔滨工业大学、清华大学等单位共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目(以下简称“机器翻译项目”),获得了国家科学技术进步奖二等奖。
关键词:机器翻译;人工翻译;翻译;互联网;哈尔滨工业大学
作者简介:
在2015年度国家科学技术奖励大会上,由百度与中国科学院自动化所、中国科学院计算技术研究所、浙江大学、哈尔滨工业大学、清华大学等单位共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目(以下简称“机器翻译项目”),获得了国家科学技术进步奖二等奖。
此项目获国家科技大奖,标志着互联网大数据为我国机器翻译技术插上了腾飞的“翅膀”,同时也引发了人们对机器翻译的关注和探讨:在如今的大数据时代,机器翻译能否取代人工?记者就此采访了相关专家。
“机器翻译”技术是世界性难题
机器翻译技术涉及计算机、认知科学、语言学等学科,一直被科学界公认为是人工智能领域最难的课题之一。
“机器翻译出现于20世纪40年代,美国等发达国家曾出现过机器翻译技术研究热潮。然而多年来,机器翻译却一直没有得到普遍应用。”百度技术副总裁、机器翻译项目负责人王海峰接受记者采访时介绍,因为让计算机理解人类语言,要经历从分析、理解到转换生成等繁杂步骤,让原本只认识“0”和“1”的计算机去实现不同语言之间的翻译,涉及语言现象的灵活多样、翻译知识获取难度大、翻译模型计算复杂度高等多个难题。
据了解,中国机器翻译研究起步于1957年,是世界上第4个开始研究机器翻译的国家。虽然历经几十年的发展,但机器翻译技术始终未能突破真正实用的门槛。王海峰从1993年初开始从事机器翻译领域研究工作,最终他组建了项目研究团队,集合了清华大学、浙江大学、哈尔滨工业大学以及中科院等国内顶尖科研力量,通过百度丰富的海量互联网数据,再经过云计算平台处理,才让机器翻译从理论走向实践,变成可能。
基于大数据的互联网翻译成为突破口
近些年来,随着互联网以及大数据的迅猛发展,基于大数据的互联网翻译成为了机器翻译技术实用化的突破口。王海峰说:“组建研发团队后,我们从整个互联网上挖掘翻译资源,在此基础上使用云计算平台训练统计翻译模型、深度学习模型,最终让机器翻译真正达到实用水平,也实现了机器翻译领域很多研究者们的毕生夙愿。”







