rime-zhengma 中 Ext-C 区域的汉字编码均有误。
Windows Vista 附带的 TableTextServiceSimplifiedZhengma.txt 应该是中易公司官方制作的码表(可能是所谓的6.6版),包含 CJK、Ext-A、Ext-B、Ext-C 中的字符和部分繁简体词汇,质量较高,但不含构词码。 Windows 7 以后的版本因版权问题不再含有此文件。
我借用 rime-zhengma 中的构词码,对官方码表中的词汇编码(不含简码,简码的编码具有随意性)做了检查。发现了部分编码错误。其中,有一些可以认为是容错码,因为正确的编码同样在码表中,这种情况我没有订正。
构词码本身也有错误的。好在错误不多,这里我总结如下: