第三十九章输入法
乐队的组建和训练袍哥自动的管了起来,新的学期开始后,蔡国是越来越忙。
抽出三个下午的时间,蔡国把乐队的十首歌准备完毕,分别是:
崔健大大的:《一块红布,《一无所有,《花房姑娘。
许巍大大的:《故乡,《曾经的你,《蓝莲花。
汪峰大大的:《花火,《我要像梦一样自由,《光明,《怒放的生命。
然后让袍哥交给了赵阔老师,让他们排练,当然,袍哥必须参加。
这十首歌曲里,蔡国和袍哥各自演唱五首,但是,袍哥必须十首都要排练。
现在袍哥是天天往音乐学院跑,晚上都是很晚才回宿舍,很刻苦也很自律。
蔡国只有选择性的一周去3次
………………。
就在蔡国忙得头晕脑花的时候,蔡国和数学教师的矛盾显现出来了,开学后,蔡国就没有上过数学课。
数学老师解际国准备把蔡国当做典型来处理,直接报到了系办公室。
这样的学生在83年是很稀缺的,居然敢连续缺课几周,这在帝都大学是很严重的事情。
计算机系的负责政工的孙振海在没有通知班主任王波的情况下,调查了几位同样上课的老师,发现缺课的问题越来越严重,基本上除了计算机系本身的几门重要课程,蔡国都有大面积的缺席。
这一下,估计是班主任或者导员是有包庇蔡国的嫌疑。孙振海觉得必须要做点啥了……。
………………
4月中旬的一天下午,蔡国正在计算机系的机房里已经埋头苦干了整整一天,必须把输入法今天搞完,已经拖了很久了。
实际上输入法是一个将拼音串转变为汉字串的转换器。每个拼音对应多个汉字,把一个拼音串对应的汉字从左到右连起来,就构成了一张有向图。
选取具有最大概率的路径,通过取对数取反,就转变为了选取最短路径的算法。而拼音串到汉字串的转移概率马尔可夫模型的一步转移概率可以解决。关键就是算法。
输入法都不是一个静态的,指的是所有的语料在安装好输入法应用后就不变了。蔡国的这版输入法具有学习用户输入习惯的功能,比如输入一个不常用的词,第一次输入时还需要往后翻好几页才能找到这个词,但是随着该词的输入次数增多,输入法就能学习到用户的输入个性,当再次输入时,该不常用的词的排名就会靠前。
输入法的工作原理是击键消息,首先送给输入法管理器(前端),输入法管理器调用输入法的转换函数(输入法引擎),输入法的转换函数得到击键消息并保存在自己的数组中,当符合规定条件时,输入法把适当的字、词返回给输入法管理器,输入法管理器再把结果字、词传给关联的应用窗口。
简单的来说,输入法就是一个查表操作,输入的信息是键盘信息,根据击键消息到表中查找对应的汉字。
蔡国是根据来世的微软智能拼音的原理来做的系统衔接,毕竟83年的个人计算机还是DOS版本,需要从底层寻找接口。
这个时期的计算机语言都是以C语言为主,后世的众多语言这个时期都还没有出来。
C语言是公认的最精炼最有效率的语音,但是,操作难度是最大的。后世能够熟练运用C语音的年薪起码都在50万以上。
所以蔡国得把这些全部用C语言来表达,大大的压缩了原本20多M的程序。
好在帝都大学有许多芝加哥大学计算机原理的原版,相当于又重新的学习了一遍,加上案列运用为驱动,让蔡国觉得,自己以前的骄傲实在是很惭愧啊。
系里王主任给了蔡国的无限上机权利,所以在这里没有人来打扰,帝都大学也引进了几乎全世界所有的机型在做研究,所以蔡国在这个计算机的世界里拼命的吸收着养分。
今天是输入法编码的第40天了,国标码早已经完成,剩下的繁体编码就难倒了蔡国,倒是可以参考台湾的字库,但是,两岸当时根本就没有实现三通,好多事情说不清楚。
因此,蔡国这版输入法就只带了大概2万字的字库和现代汉语上所有的词条,是在本身智能拼音ABC4万多字的基础上减少的一个版本。
最后对程序进行了封装,带字库刚刚1.1M,一张五寸盘完全可以装下。使用时,可以直接的软盘驱动,OK!
测试过后感觉还可以,这里就不得不说一下当时的具体情况。