首页 >> 专题 >> 学科专题 >> 语言学专题 >> 当汉语研究遇到人工智能 >> 汉语信息处理主要成就
汉字输入与汉语语料库
2015年09月28日 13:40 来源:《当代语言学》第3卷2001年第1期 作者:冯志伟 字号

内容摘要:现代汉字是以形声字为主要构造方式的表义兼表音的文字,这种文字体系不是纯表义的,但有相当的表义功能。这种文字体系也不是纯表音的,但在很多字形中又包含着表音的成分。表义成分和表音成分在现代汉字中互相制约、互相补充,却又很不完备。

关键词:汉字;输入;语料库;汉语信息处理;部件;构造;输入法

作者简介:

  现代汉字是以形声字为主要构造方式的表义兼表音的文字,这种文字体系不是纯表义的,但有相当的表义功能。这种文字体系也不是纯表音的,但在很多字形中又包含着表音的成分。表义成分和表音成分在现代汉字中互相制约、互相补充,却又很不完备。 

  由于我国简化了一大批汉字,现代汉字字形构造已不再纯粹按照“六书”方式,它已经明显地分成了两大类:一类仍然按照传统的“六书”方式,主要有象形、指事、形声、会意四种造字方式。其中,形声字占现代汉字总数的8090%。但是,形声字的声旁.由于本身不是音素符号,再加上语音演变的影响,其有效表音率是很低的;形声字的形旁,由于词义的复杂性.再加上词义的不断发展,其表义功能极为宽泛、模糊而又十分有限。另一类是经过简化后不能再归入象形、指事、形声、会意四种构造方式的字。它们的构造方式有轮廓字(如“齐、变乃、符号字(如“办、邓乃、省略字(如“声、际,、草书楷化(如“专、长勺等。传统和简化这两大类所包含的构造方式的总和,就是现代汉字全部的构造类型,也就是它的全部造字方式。 

  现代汉字的形体可以分为三个层次: 

  汉字是最高层次,部件是中间层次,笔画是最低层次。如“湖”字的三个层次如下图所示: 

  层次越高,表示一个汉字所用的符号越少,表示全部汉字所用的符号的总数越多。如最高一层,表示一个符号只需用一个符号,如果有五万个汉字,就得用五万个符号。层次越低,表示一个字所用的符号越多,而表示全部汉字所用的符号的总数越少。如最低一层,表示一个汉字最多要用几十个笔画符号(笔画最多的汉字有64),而笔画符号的总数可减少到横、竖、撇、点、折等有限的几种。部件处于中间层次,它是组成现代汉字的能够相对独立的结构单位,它比笔画完整,又比汉字本身简单、灵活,所需符号数目适中。 

分享到: 0 转载请注明来源:中国社会科学网 (责编:王婷婷)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们