南洋大学校友业余网站

开发汉字文书软体

南大站


现有汉字数码软件,主要是文字输入软体。汉字输入方法,大体分为两大类:依据汉字读音的拼音输入法和依据笔划字型的五笔输入法。两种输入法都已成熟,继续发展更多智慧功能。

汉字文书处理的软件工具,急待开发。简单的软体工具是繁简对换。留落在网页上的繁简对换工具很多,但是,偏于金钱回馈,没有统一的指标,没有长远的任务,还待更进努力。有关当局,不加重视,会造成混乱。

繁简对换不是重要的文书处理工具,却是汉字文书处理的要素。简笔汉字虽然有缺点,但是会长远应用,要在长期应用中去改进。繁笔汉字要少用,但是,和古籍一样,会永久保留。目前,汉字大字集包含繁简字,统一码更有韩日用的汉字。用字不规范化,繁简字出现在同一文件里,都会给汉字使用者增多困难。

汉字除了简繁不同外,还有许多异体字。不同样式的汉字(笔划会随新旧字形而不同),出现在同一文件里,也会造成混乱。文字改革机构颁发了许多文告,除了教师学者,谁能遍涉所有文件?为什么不能开发软体,帮助使用者快速辨别?

现有的汉字输入法,不能对输入后的文件,提供一道程序,标明文件中的繁笔字或异体字。有了这种程序,才能进一步提供帮助,由使用者根据文件内容,选用合适的字样。要达到这种要求,繁简对换是不能缺少的功能。可惜,还未听闻相关的机构承担开发具备这些功能的软体。

对于拼音文字,用字母可以拼成不成文字的组合;相对来看,增减笔划也可以组合不成字的“象形文字”。但是,数码输入的汉字,从字库选植,不会是不成字的白字。选植单字,不会有错误的笔划,却不能断定有无错植,需要更正。大体上,汉字多和前后文字组成文词。除了已经确立的词汇,个别单字和别的单字随意组合,往往不成文词。因此,不在词汇库里的字词组合,可能就是植错单字造成。利用数码软体程序,可以标明错误,还可以进一步提供可能的字词组合。

人的判断力,不是经常都是在极佳状态,数码软体可以发挥检验的功能。要判断字词组合有无错误,必需有正确的词汇库作根据。利用数码软体,可以建立词库、查询词库,可以判断字词组合是否存在词库内。如果字词组合不在词汇内,可以提示可行的更正。

汉字词典数码化,和这项工作有密切的联系,要有一个永久性机构去处理。汉字词汇,有二字词、三字词、四字词(涵括成语)、五字词……。先要开发双字词库,接着是三字词库、四字词库,甚至更多字的词库,以至包括常用的俗语和著名诗句。这是一项长远的工作,需要国家语文机构主持开发和接续工作。

2012-1-16稿
2015-2-16修



自强不息 力求上进

2015年2月16日首版 Created on February 16, 2015
2015年2月16日改版 Last updated on February 16, 2015