2006.11.16 海鹰(T2第四修改版):
**.这次是大幅修葺了字词库,需然基本词库还是之前的,但就做了更多有用的修改,再一次将各大统计词频 (分别有北大,清华,人民日布,googel,搜狗,baidu词频,woods词频53248,拼音加加,紫光,及多个网友的词频统计还有阿门大师的首选词等等)进行了合并,这次采用隔行合并方式,也就是隔一个词插入一个,这样做的好处是不会破坏各词频排序,然后再去重。再最后就是同我之前一直用的经多次选出的词库再次采用同一方式进行了合并。最后是取了前五万组。
**.而今次最大的不同在于还亲自在网上收集了近一百万字的文章,只要是选一些接近我们工作生活的,还有过万条短信用于校准今次提取的五万词组,经校准最后取得了近三万组,同时亦对今次所收集的文章进行了单字,词的字词频计算,取其前面五千组和之前的约三万组进行合并去重,也就有了今次的近三万词组。
**.不想再重做面板了,没太多时间很快就要外出工作了,只是调整了部分位置,觉得比较顺手。
**.基本上大部分常用字用笔画都可以二到三笔都会出来,且联想丰富很是流畅。
**.至于之前有网友提过笔画能否也做成可以打词组,答案是肯定的,但我测试过几种编码方才后始终放弃,因为笔画不同于拼音,拼音有二十多个键,而笔画则只有五种编码,重码太高没实用价值,因为等你打出词组来我打单字早已出来了。
**.关于拼音编码,我采用的是首字首字母后全拼:
如:中国 z guo , 又如: 了不得 l b de
这样做的好处是可以减少很多击键次数,只要适应一下很快就ok.
**.更多关于本次码表修改的信息可以参考:
http://bbs.oorroo.com/viewthread.php?tid=282004&extra=page%3D1&page=1
上面有今次使用简码的介绍。
**.由于很多朋友下载后都不能很好安装使用,在这我就再多打几个字吧。
**.今次是基于 1.4 版的,用上网上一些网友放出的破解版,也就是说无需输入注册码,只要按确定则可。希望海大侠能原谅你们吧,还过由于作者并没有开放注册所以现在先用着xxx的也就算了,将来作者开放注册希望大家都去注册支持国产软件。若海大侠看到这个有异议的话请通知我删除。
**.请将解压后的 T2 文件夹复制至机器内存中的Program Files 目录下,安装方法有两种,
1.使用我提供的注册表文件导入可以少向你的注册表写入多两行没用的键值,具体操作是将hy1.4.reg复制至卡上然后运行注册表工具导入hy1.4.reg,导入后会告诉你注册键值写入成功,不过是英文提示。
2. 用原安装程序 HYReg.exe(提醒曾装过梅花的朋友,建议你硬重起后再安装)直接点击后会提示你输入注册码,直接按确定则可。
上面两种只需选其一,然后会在输入法栏看到 T2 又或者是海鹰。。
**.首次启动会很慢,(因要生成优化文件在Program Files 目录下)但启用一次后就会正常,建议你利用包内的工具设成默认输入。
由 gdyqy2003 于2006.11.16 (深圳)欢迎深圳机友多交流. QQ:394671731 请注明添加原因即可
其他更多关于本输入法的其他输入方法,本人做的软件汉化等请至
http://gdyqy.oorroo.cn
2006.11.17//9:56修正了一个拼音出错[沈]错拼chen已改上传,包内增加2003的修改器
2006.11.17//18:33真是不看不知道,一看就一跳。。。^_^..刚才用两三个不同的编码器都编了一下,居然发现一万个单字中有近300个拼音拼法不同....晚上回来再处理.
2006.11.18//11.54由于众多网友反映个别拼音异音,于是乎花了一晚又一上午时间来查,之前没想过这拼码器居然会错啊,好家伙。于是分别用了三个不同的拼码器来重编,然后经整理合并去重后:一万个单字中有约270个,近三万个双字词组中有279个,而三字词中就有29个。
由于时间关系这次我没有全部进行一一更正,只是将正拼异拼同时留在码表中,这样就算你怎拼它都会出来了吧....^_^偷懒一下留待下一个版本更正,还有国家标准的异音字亦留待下一次了。
[
本帖最后由 gdyqy2003 于 2006-11-18 15:29 编辑 ]