内容摘要:我国是继美国、苏联、英国之后,第四个开展机器翻译研究工作的国家。早在1956年,国家便把机器翻译研究列入了我国科学工作的发展规划,成为其中的一个课题,课题的名称是:“机器翻译、自然语言翻译规则的建立和自然语言的数学理论”。从此,机器翻译研究便在我国开展起来。
关键词:机器翻译;信息处理;汉语;翻译;冯志伟;计算机
作者简介:
我国是继美国、苏联、英国之后,第四个开展机器翻译研究工作的国家。早在1956年,国家便把机器翻译研究列入了我国科学工作的发展规划,成为其中的一个课题,课题的名称是:“机器翻译、自然语言翻译规则的建立和自然语言的数学理论”。从此,机器翻译研究便在我国开展起来。国内主要的机器翻译系统如下:
(l)俄汉机译系统:1957年.中国科学院语言研究所刘涌泉等与计算技术研究所合作,开展俄汉机器翻译的研究。1959年,他们在我国制造的104大型通用电子计算机上,进行了俄汉机器翻译试验,翻译了9个不同类型的、较为复杂的句子。这是我国最早研制的机器翻译系统.
(2)英汉题录机译系统:1975年11月,在中国科学技术情报研究所成立了一个由情报所、语言所和计算所等单位的工作人员组成的机器翻译协作研究组,以冶金题录5000条为试验材料,制定英汉机器翻译方案并上机试验.1978年5月,在计算所111机上进行抽样试验,抽样20条,达到了预期的效果。
(3)汉一法/英/日/俄/德多语言机器翻译系统:1951年,冯志伟根据依存语法和配价语法的理论,采用模块化程序设计的方法,研究汉语到外语的机器翻译,在法国格勒诺布尔理科医科大学的BIM一4341计算机上通过试验,首次将20多篇中文科技文章用计算机翻译成法语、英语、日语、德语和俄语等5种外语,译文可读性强。研究成果在COLING’82国际计算语言学会议上得到好评。
(4)“译星”英汉系统:中国人民解放军军事科学院董振东等研制成功“科译l号”实用型全文与题录兼容的英汉机器翻译系统,于1997年在北京通过了技术鉴定。“科译l号”系统的基本原理是:由原语的线性结构出发,经过多层次、多次数的扫描,按规则的顺序匹配,形成以动词为根结点,以逻辑语义项为主结点的多结点、多标记的树形图.最后,从根结点逐层展开,形成译语的线性结构,得到相应的译文。该系统还采用了自行设计的专用的形式描述语言来书写自然语言的处理规则,实现了语言规则与计算机程序的彼此独立。此外,该系统还具有如下的翻译支援手段:l)词典与规则库的增添和修改手段;2)翻译过程的追踪和监测手段;3)为用户提供批量专业术语的增添手段;4)人用词典编制手段:5)英语词汇动态分析统计程序。该系统于1988年由中国计算机软件与技术服务总公司实现了商品化,命名为“译星l号”。“译星1号”在商品化过程中,发展成现在的“译星”系统,在语言词典和规则方面作了进一步的改善,在软件硬件的开发环境方面作了进一步的优化,还建立了专业词典,主要专业领域有计算机、经济、通讯、陶瓷、火力发电、印刷机械、汽车拖拉机、石油物探、地质、化工等。







