常见输入法测评数据
梦泽闲客 更新于二零二四年五月七日
提醒
本文只是呈现输入法的客观测评数据,不能用来作为此输入方案是否优秀的唯一评价标准。评判一个输入方案,应该综合考量以下因素:
- 在不同字集/使用环境下的重码率。
- 规则复杂度。
- 字根记忆难度。
- 拆字直观性/唯一性/容错性。
- 和汉字体系和汉字理论的相容性。
- 编码或规则的特例数量。
- 人体工学性。
- 平台通用性。
单字重码数据
单字重码定义
表格中的各项名称定义如下:
- 「通规一二级」是指大陆《通用规范汉字表》中的 6500 个简化汉字。测试输入法简化字确定性。
- 「国字」是指台湾《常用国字标准字体表》中的 4808 个繁体汉字。测试输入法繁体字确定性。
- 「常用繁简」是指大陆《通用规范汉字表》一二级的 6500 个汉字、台湾《常用国字标准字体表》中的 4888 个汉字、以及《古籍印刷通用规范》中的 125 个大陆繁体字形 [1]。总共为 8390 个常用繁简汉字。测试输入法繁简混合文本下的确定性。
- GB2312 是大陆信息技术简化字集,共有简化汉字 6764 个。
- GBK 是大陆的信息技术大字集,共有繁简汉字 21003 个。
- 静态重码数指的是一个字集范围内,编码相同的汉字的绝对数量,反映出了输入法在检字方面的确定性。
- 动态选重率指的是用字频数据对重码汉字进行加权。因为存在五码自动顶一选,只有在二选或三选时才需要选重。这个指标更能反映实际的输入体验。
- 注意,动态重码率基于字频数据,不同的字频统计会产生不同结果。我采用的字频数据,简体来自北京师范大学邢红兵的 《25 亿字语料汉字字频表》,繁体来自 繁体字频表。
单字重码计算公式
假设
那么,静态重码数可以表达为:
动态重码率可以表达为:
单字全码数据
以下为单字全码的结果。表格按输入法的性质排列。
根据部分作者的要求,部分输入法名称不予展示,以×
代替。
形码方案 | 简体 选重率 | 繁体 选重率 | 繁简混合 选重率 | GB2312 | 国字 常用 | GBK | CJK-B | CJK-D | CJK-F | CJK-H | CJK-I |
---|---|---|---|---|---|---|---|---|---|---|---|
四码 | |||||||||||
五笔86 | 34.2‱ | 77.7‱ | 238.3‱ | 521 | 333 | 6453 | 36494 | - | - | - | - |
五笔98 | 31.8‱ | 79.5‱ | 240.0‱ | 515 | 330 | 6378 | - | - | - | - | - |
五笔06 | 31.8‱ | 83.8‱ | 236.3‱ | 532 | 387 | 6610 | - | - | - | - | - |
五笔986 | 34.2‱ | 61.7‱ | 231.2‱ | 441 | 294 | 6120 | - | - | - | - | - |
五笔092 | 35.7‱ | 122.6‱ | 85.0‱ | 1881 | 800 | 11426 | - | - | - | - | - |
米十五笔 | 26.8‱ | 28.4‱ | 205.9‱ | 285 | 144 | - | - | - | - | - | - |
蓝宝石二 | 21.6‱ | 57.3‱ | 58.4‱ | 388 | 284 | 5082 | - | - | - | - | - |
蓝宝石三 | 9.9‱ | 90.3‱ | 59.8‱ | 392 | 350 | 5874 | - | - | - | - | - |
郑码 | 59.0‱ | 83.6‱ | 262.8‱ | 559 | 316 | 6631 | 36159 | 39353 | - | - | - |
真码 | 6.4‱ | 45.9‱ | 151.2‱ | 406 | 184 | 4328 | 35120 | 38397 | 48575 | 56168 | 56706 |
徐码 | 10.7‱ | 22.8‱ | 24.9‱ | 318 | 127 | 2902 | 25605 | 27956 | 35746 | - | - |
呒虾米 | - | 72.5‱ | 814.6‱ | - | 98 | - | - | - | - | - | - |
宇浩光华 | 4.1‱ | 15.2‱ | 14.1‱ | 312 | 200 | 5149 | 33057 | 35706 | 44277 | 50484 | 50941 |
宇浩星陈 | 7.7‱ | 10.8‱ | 13.4‱ | 412 | 147 | 4893 | 33128 | 35967 | 44927 | 51630 | 52116 |
卿云 | 6.2‱ | 7.2‱ | 10.6‱ | 526 | 188 | 6119 | 37190 | 40235 | 49896 | 56933 | 57455 |
云码 | 4.8‱ | 6.5‱ | 10.5‱ | 287 | 97 | 3877 | 29902 | 32503 | 40870 | 46990 | 47429 |
天码 | 9.2‱ | 26.4‱ | 57.4‱ | 471 | 299 | 5547 | 33457 | 36251 | 45116 | 51685 | 52157 |
× | 6.9‱ | 72.5‱ | 296.6‱ | 627 | 276 | 7810 | 36942 | 40109 | 49484 | 56642 | 57181 |
三十键 | |||||||||||
矧码 | 19.3‱ | 48.0‱ | 48.6‱ | 267 | 199 | 3634 | - | - | - | - | - |
五码 | |||||||||||
仓颉五代 | 25.9‱ | 57.0‱ | 51.0‱ | 422 | 164 | - | - | - | - | - | - |
苍颉六代 | 25.3‱ | 39.6‱ | 40.0‱ | 384 | 113 | - | 17949 | 19590 | 25415 | 29603 | - |
不定长 | |||||||||||
山人全息 | 6.4‱ | 39.0‱ | 246.1‱ | 192 | 84 | 3948 | - | - | - | - | - |
形音 | |||||||||||
字源 | 49.3‱ | 90.5‱ | 325.4‱ | 315 | 188 | 6288 | - | - | - | - | - |
音形 | |||||||||||
小鹤音形 | 85.5‱ | - | - | - | - | - | - | - | - | - | - |
二级简码出简不出全数据
以下为二级简码出简不出全的结果,换句话说,如果一个字存在一级和二级简码,则默认只打简码,并将其全码后置。部分方案设置了两重二级简码字,数据无法准确计算,故而略去。注意,真码只设置一级简码,不设置二级简码。表格按输入法的性质排列:
形码方案 | 简体 选重率 | 繁体 选重率 | 繁简混合 选重率 | GB2312 | 国字 常用 | GBK | CJK-B | CJK-D | CJK-F | CJK-H | CJK-I |
---|---|---|---|---|---|---|---|---|---|---|---|
四码 | |||||||||||
五笔86 | 21.8‱ | 69.0‱ | 168.5‱ | 451 | 293 | 6111 | 35953 | - | - | - | - |
蓝宝石二 | 5.2‱ | 36.9‱ | 30.7‱ | 301 | 245 | 4815 | - | - | - | - | - |
蓝宝石三 | 2.5‱ | 50.0‱ | 30.4‱ | 299 | 307 | 5664 | - | - | - | - | - |
郑码 | 24.5‱ | 47.7‱ | 152.2‱ | 460 | 283 | 6405 | 35853 | 39035 | - | - | - |
真码 | 4.4‱ | 44.9‱ | 148.9‱ | 380 | 172 | 4316 | 35126 | 38404 | 48585 | 56174 | 56712 |
徐码 | 9.1‱ | 19.0‱ | 19.1‱ | 353 | 119 | 2871 | 25378 | 27721 | 35456 | - | - |
宇浩光华 | 3.2‱ | 14.0‱ | 12.3‱ | 2073 | 1501 | 15149 | 64448 | 68824 | 82058 | 91189 | 91811 |
宇浩星陈 | 5.9‱ | 9.5‱ | 11.2‱ | 355 | 123 | 4696 | 32730 | 35549 | 44451 | 51137 | 51624 |
卿云 | 3.7‱ | 6.1‱ | 8.2‱ | 458 | 171 | 5899 | 36810 | 39863 | 49506 | 56515 | 57040 |
云码 | 3.5‱ | 5.5‱ | 7.8‱ | 259 | 85 | 3735 | 29522 | 32105 | 40433 | 46539 | 46976 |
天码 | 8.0‱ | 22.0‱ | 37.1‱ | 429 | 284 | 5399 | 33146 | 35937 | 44781 | 51328 | 51798 |
× | 3.5‱ | 69.3‱ | 163.1‱ | 585 | 246 | 7492 | 36480 | 39650 | 49020 | 56177 | - |
不定长 | |||||||||||
山人全息 | 5.0‱ | 38.1‱ | 141.1‱ | 499 | 266 | 4430 | - | - | - | - | - |
形音 | |||||||||||
字源 | 9.9‱ | 61.7‱ | 155.6‱ | 213 | 158 | 5925 | - | - | - | - | - |
词语重码数据
词语重码定义
表格中的各项名称定义如下:
- 词语完美动态选重率指的是用词频数据对重码词语(包括单字词和多字词)进行加权后得到的选重的频率。
- 单字动态选重率指的是使用极端保守的分词法,即所有多字词全部视作单字词输入时选重的频率。
- 实际动态选重率指的是在实际输入过程中,因为用户分词和字频表分词的差异造成的偏差所造成的选重率。介于「单字动态选重率」(极端保守分词)和「词语完美动态选重率」(完美分词)之间。因为用户输入了词库中不存在的词而导致的回删,不算入此内。
- 因为存在五码自动顶一选,只有在二选或三选时才需要选重。
- 动态重码率对词频数据的依赖度极高,不同的词频统计会产生不同结果。本文采用的词频数据,来自《现代汉语语料库分词类词频表》。
词语完美动态选重率
这里给出对于「词语完美动态选重率」的一个直观解释。假设存在这样一个句子:
「请用大约十句话来描述你所居住城市的历史的来龙去脉。」
情况一:如果词库为中等大小,换言之,分词比较适中,我们对这句话进行如下分割:
「请·用·大约·十句·话·来·描述·你·所·居住·城市·历史·的·来龙去脉。」
我们得到了 14 个词语,也就是说,用户要输入 14 次全码。假设「请」和「描述」发生了重码,那么我们输入这 14 个词,就要选重一次。这句话的词语动态选重率就是 1 / 13 = 7.1%。
情况二:如果词库为超大词库,换言之,分词比较激进,我们对这句话进行如下分割:
「请用·大约·十句话·来·描述·你所·居住·城市·历史的·来龙去脉。」
我们得到了 10 个词语,也就是说,用户要输入 10 次全码。假设「请用」和「描述」发生了重码,那么我们输入这 10 个词,就要选重一次。这句话的词语动态选重率就是 1 / 10 = 10.0%。
情况三:如果词库为精简词库,换言之,分词比较保守,我们对这句话进行如下分割:
「请·用·大约·十·句·话·来·描述·你·所·居住·城市·历史·的·来·龙·去·脉。」
我们得到了 18 个词语,也就是说,用户要输入 18 次全码。假设「请」和「描述」发生了重码,那么我们输入这 18 个词,就要选重一次。这句话的词语动态选重率就是 1 / 18 = 5.56%。
一个基本的经验 (rule of thumb) 是:分词越激进、词库越大,那么「词语完美动态选重率」就越高,同时平均码长也越短。
结论
从上例可以看出,词语的重码数据,极度依赖于用户的「人工分词」和统计数据中的词语的一致性。只有在以下条件全部满足时,数据才会比较准确:
- 用户只打词频表中出现的词。如:词频表中若无「我们」,那么用户只打「我·们」。
- 用户必定打长度较长的词。如:出现「电视机」时,必定打「电视机」,而不是「电视·机」或「电·视·机」。这一条也意味着,一个多字词若在字频表中,那么用户绝对不会打成单字。
因为这两个条件过于完美,实际使用时对用户的分词压力高,所以一般不会实现。很多时候,用户会将某些词频表中的多字词分为单字词输入,这意味着:
实际输入时的动态选重率,应介于「单字动态选重率」和「词语完美动态选重率」之间。依照用户习惯:
- 如果一个人偏好打单字,那么动态选重率更偏向「单字动态选重率」(更低)。
- 如果一个人偏好打词语,那么动态选重率更偏向「词语动态选重率」(更高)。
因此,精简词库配合单字输入,是平衡码长(效率)和选重(确定性)的一个解决方案,适合新手。而背诵字词简码和选重位置也是提高确定性的一种方式,适合老手。
词语重码计算公式
假设
那么,词语完美动态选重率可以表达为:
提醒
在部分指标计算软件中,词语选重率只包括了多字词,不能成词的单字词被移除,例如,「我今天去那里」被分割成「今天 那里」,一共有 2 个词语。倘若「我」和「那里」生了重码,则选重率为 0 / 2 = 0%。这不能完全反应实际打字时的选重频率。
词语重码结果
注意
下表内容仅适用于现代汉语典范白话文的文本空间。
实际动态选重率,应介于「单字动态选重率」(极端保守分词)和「词语完美动态选重率」(完美分词)之间。
单字一简、二简出简不出全数据。也就是说,有一简、二简的单字,全码在词语全码之后。
方案 | 简体词语 完美动态选重率 | 繁体词语 完美动态选重率 | 繁简混合词语 完美动态选重率 |
---|---|---|---|
蓝宝石三 | 45.9‱ | 124.7‱ | 207.8‱ |
蓝宝石二 | 48.4‱ | 89.3‱ | 199.0‱ |
× | 60.0‱ | 95.4‱ | 634.0‱ |
云码 | 103.1‱ | 106.7‱ | 245.3‱ |
卿云 | 112.2‱ | 113.2‱ | 294.3‱ |
宇浩光华 | 115.9‱ | 127.8‱ | 304.4‱ |
徐码 23 | 116.3‱ | 131.2‱ | 316.7‱ |
天码 | 115.3‱ | 116.0‱ | 356.1‱ |
宇浩星陈 | 121.3‱ | 137.6‱ | 287.3‱ |
字源 | 129.8‱ | - | - |
五笔 86 | 204.1‱ | 235.6‱ | 750.2‱ |
五笔 98 | 204.2‱ | 242.7‱ | 733.5‱ |
五笔 06 | 217.8‱ | 238.3‱ | 749.6‱ |
候选项个数·检字效率
本节给出各个字集中、重码最多的码位上候选项的个数。本指标可以有效反映输入方案在大字集上的检字效率。
该数字不大于 9,则可以不用翻页;该数字不大于 18,则只需要翻页一次。
形码方案 | GB2312 | 国字 常用 | GBK | CJK-B | CJK-D | CJK-F | CJK-H | CJK-I |
---|---|---|---|---|---|---|---|---|
五笔 86 | 21 | 4 | 21 | 44 | - | - | - | - |
五笔 98 | 4 | 4 | 13 | - | - | - | - | - |
五笔 06 | 4 | 4 | 13 | - | - | - | - | - |
蓝宝石二 | 3 | 4 | 10 | - | - | - | - | - |
蓝宝石三 | 4 | 3 | 9 | - | - | - | - | - |
郑码 | 3 | 4 | 7 | 18 | 19 | - | - | - |
真码 | 4 | 4 | 13 | 43 | 44 | 46 | 46 | 46 |
徐码 | 3 | 3 | 7 | 17 | 17 | 17 | - | - |
呒虾米 | 3 | 2 | - | - | - | - | - | - |
宇浩光华 | 3 | 3 | 7 | 14 | 14 | 15 | 16 | 16 |
宇浩星陈 | 4 | 3 | 6 | 15 | 15 | 17 | 18 | 18 |
卿云 | 4 | 3 | 6 | 16 | 17 | 17 | 18 | 18 |
云码 | 3 | 3 | 5 | 13 | 13 | 14 | 14 | 14 |
天码 | 3 | 4 | 6 | 13 | 13 | 14 | 15 | 15 |
仓颉五代 | 3 | 2 | 6 | 32 | 34 | - | - | - |
苍颉六代 | 3 | 3 | 5 | 11 | 11 | 11 | 12 | - |
小鹤音形 | 4 | - | - | - | - | - | - | - |
山人全息 | 2 | 2 | 5 | 9 | 9 | - | - | - |
字源 | 3 | 4 | 13 | - | - | - | - | - |
× | 5 | 5 | 14 | 38 | 38 | 40 | 40 | 40 |
古今名著选重频率统计
这里给出部分名著的选重频率统计。四本简体、三本繁体、三本繁简混排。
现象
文本越趋近于现代汉语典范白话文,其重码数据越符合前面几章所展示的「动态选重率」。文本越趋近于古汉语、诗词歌赋,其重码数据越符合前面几章所展示的「静态重码数」。
单字全码数据
以下为单字全码的结果。
方案 | 毛泽东选集(简) | 天龙八部(简) | 三体三部曲(简) | 战争与和平(简) |
---|---|---|---|---|
五笔86 | 25.8‱ | 30.6‱ | 25.7‱ | 20.9‱ |
五笔98 | 31.3‱ | 28.4‱ | 26.5‱ | 33.2‱ |
五笔06 | 22.2‱ | 25.5‱ | 24.3‱ | 37.1‱ |
蓝宝石2 | 18.4‱ | 20.5‱ | 24.9‱ | 18.1‱ |
蓝宝石3 | 8.1‱ | 10.2‱ | 3.7‱ | 4.7‱ |
郑码 | 44.2‱ | 51.6‱ | 49.2‱ | 48.1‱ |
真码 | 5.1‱ | 13.9‱ | 5.1‱ | 6.5‱ |
徐码 | 3.3‱ | 9.8‱ | 7.0‱ | 7.8‱ |
宇浩光华 | 1.2‱ | 2.9‱ | 2.7‱ | 2.4‱ |
宇浩星陈 | 3.5‱ | 6.4‱ | 2.3‱ | 6.2‱ |
卿云 | 3.3‱ | 10.9‱ | 4.8‱ | 5.6‱ |
云码 | 1.1‱ | 3.1‱ | 4.1‱ | 6.6‱ |
天码 | 3.5‱ | 7.2‱ | 4.5‱ | 6.0‱ |
仓颉五代 | 74.0‱ | 71.1‱ | 80.2‱ | 60.0‱ |
苍颉六代 | 62.5‱ | 65.0‱ | 61.0‱ | 43.1‱ |
三码郑码 | 9.7‱ | 47.3‱ | 26.4‱ | 29.5‱ |
山人全息 | 2.4‱ | 6.8‱ | 5.6‱ | 6.1‱ |
小鹤音形 | 81.7‱ | 84.2‱ | 74.2‱ | 69.6‱ |
字源 | 39.1‱ | 50.9‱ | 39.7‱ | 34.0‱ |
方案 | 史记(繁) | 红楼梦(繁) | 笑傲江湖(繁) |
---|---|---|---|
五笔86 | 88.4‱ | 28.9‱ | 46.7‱ |
五笔98 | 69.3‱ | 32.5‱ | 48.8‱ |
五笔06 | 79.7‱ | 35.3‱ | 49.2‱ |
蓝宝石2 | 43.8‱ | 25.3‱ | 29.9‱ |
郑码 | 89.9‱ | 39.2‱ | 32.2‱ |
真码 | 30.1‱ | 12.9‱ | 14.0‱ |
徐码 | 22.1‱ | 10.9‱ | 9.1‱ |
宇浩光华 | 25.9‱ | 9.2‱ | 6.5‱ |
宇浩星陈 | 32.7‱ | 9.4‱ | 7.3‱ |
卿云 | 24.2‱ | 7.0‱ | 5.9‱ |
云码 | 15.5‱ | 3.9‱ | 2.8‱ |
天码 | 39.6‱ | 18.8‱ | 12.6‱ |
仓颉五代 | 74.6‱ | 33.0‱ | 30.9‱ |
苍颉六代 | 69.3‱ | 16.4‱ | 14.2‱ |
三码郑码 | 296.1‱ | 143.8‱ | 132.3‱ |
山人全息 | 20.8‱ | 6.3‱ | 3.2‱ |
方案 | 论语集解(繁简混) | 三国演义(繁简混) | 海上花列传(繁简混) |
---|---|---|---|
五笔86 | 260.8‱ | 360.8‱ | 244.6‱ |
五笔98 | 265.7‱ | 374.8‱ | 242.5‱ |
五笔06 | 252.5‱ | 345.7‱ | 232.7‱ |
蓝宝石2 | 20.5‱ | 52.7‱ | 35.6‱ |
郑码 | 266.7‱ | 385.9‱ | 311.2‱ |
真码 | 147.5‱ | 165.2‱ | 174.9‱ |
徐码 | 10.3‱ | 39.2‱ | 22.7‱ |
宇浩光华 | 4.4‱ | 24.5‱ | 9.6‱ |
宇浩星陈 | 3.9‱ | 32.2‱ | 18.1‱ |
卿云 | 4.4‱ | 24.6‱ | 10.6‱ |
云码 | 7.8‱ | 21.8‱ | 13.1‱ |
天码 | 45.9‱ | 71.9‱ | 47.3‱ |
仓颉五代 | 67.4‱ | 144.6‱ | 88.3‱ |
苍颉六代 | 38.6‱ | 129.6‱ | 83.4‱ |
三码郑码 | 330.2‱ | 562.3‱ | 395.4‱ |
山人全息 | 281.3‱ | 352.3‱ | 314.7‱ |
二级简码出简不出全数据
以下为二级简码出简不出全的结果,换句话说,如果一个字存在一级和二级简码,则默认只打简码,并将其全码后置。部分方案设置了两重二级简码字,数据无法准确计算,故而略去。注意,真码只设置一级简码,不设置二级简码。
输入方案 | 毛泽东选集(简) | 天龙八部(简) | 三体三部曲(简) | 战争与和平(简) |
---|---|---|---|---|
五笔86 | 5.7‱ | 15.6‱ | 12.1‱ | 9.0‱ |
蓝宝石2 | 3.8‱ | 5.6‱ | 1.7‱ | 2.2‱ |
真码 | 36.4‱ | 21.8‱ | 35.1‱ | 24.1‱ |
徐码 | 3.2‱ | 7.9‱ | 5.8‱ | 7.3‱ |
宇浩光华 | 1.0‱ | 2.4‱ | 2.4‱ | 2.0‱ |
宇浩星陈 | 3.3‱ | 5.2‱ | 1.7‱ | 4.5‱ |
卿云 | 1.4‱ | 3.3‱ | 1.6‱ | 4.0‱ |
云码 | 0.9‱ | 2.2‱ | 1.7‱ | 6.1‱ |
天码 | 3.0‱ | 5.7‱ | 3.6‱ | 4.8‱ |
三码郑码 | 9.5‱ | 46.8‱ | 26.2‱ | 29.4‱ |
吉旦饼 | 15.4‱ | 44.7‱ | 26.1‱ | 35.6‱ |
易码 | 1.5‱ | 4.8‱ | 1.7‱ | 2.8‱ |
山人全息 | 129.9‱ | 173.6‱ | 152.3‱ | 152.5‱ |
小鹤音形 | 81.7‱ | 84.2‱ | 74.2‱ | 69.6‱ |
字源 | 5.3‱ | 12.0‱ | 6.8‱ | 9.7‱ |
输入方案 | 史记(繁) | 红楼梦(繁) | 笑傲江湖(繁) |
---|---|---|---|
五笔86 | 75.0‱ | 24.1‱ | 35.0‱ |
蓝宝石2 | 35.3‱ | 20.4‱ | 19.5‱ |
真码 | 50.0‱ | 20.2‱ | 29.4‱ |
徐码 | 23.6‱ | 10.2‱ | 8.0‱ |
宇浩光华 | 22.9‱ | 8.3‱ | 5.6‱ |
宇浩星陈 | 29.8‱ | 8.6‱ | 6.6‱ |
卿云 | 36.7‱ | 18.6‱ | 21.6‱ |
云码 | 14.0‱ | 3.3‱ | 2.4‱ |
天码 | 33.7‱ | 17.0‱ | 11.0‱ |
三码郑码 | 294.8‱ | 142.6‱ | 131.0‱ |
吉旦饼 | 114.0‱ | 63.3‱ | 57.3‱ |
山人全息 | 117.7‱ | 99.9‱ | 109.6‱ |
输入方案 | 论语集解(繁简混) | 三国演义(繁简混) | 海上花列传(繁简混) |
---|---|---|---|
五笔86 | 192.0‱ | 242.8‱ | 187.5‱ |
蓝宝石2 | 9.8‱ | 43.9‱ | 17.0‱ |
真码 | 193.4‱ | 174.2‱ | 175.7‱ |
徐码 | 12.7‱ | 35.5‱ | 27.7‱ |
宇浩光华 | 3.9‱ | 21.5‱ | 8.4‱ |
宇浩星陈 | 2.9‱ | 29.5‱ | 16.6‱ |
卿云 | 20.0‱ | 47.8‱ | 32.2‱ |
云码 | 7.8‱ | 18.8‱ | 10.4‱ |
天码 | 38.1‱ | 56.0‱ | 30.9‱ |
三码郑码 | 337.5‱ | 555.2‱ | 398.3‱ |
吉旦饼 | 41.5‱ | 154.7‱ | 104.1‱ |
山人全息 | 415.6‱ | 686.1‱ | 597.8‱ |
上表反映的是确定性,而平均码长则反映输入效率。现统计如下。注意,真码只设置一级简码,不设置二级简码。
输入方案 | 简体 均值 | 毛泽东 选集·简 | 天龙 八部·简 | 三体 ·简 | 战争与 和平·简 | 史记 ·繁 | 红楼 梦·繁 | 笑傲 江湖·繁 | 论语集解 ·繁简混 |
---|---|---|---|---|---|---|---|---|---|
蓝宝石2 | 3.05 | 3.04 | 3.1 | 3.03 | 3.05 | 3.48 | 3.29 | 3.29 | 3.36 |
云码 | 3.06 | 3.02 | 3.11 | 3.04 | 3.08 | 3.46 | 3.29 | 3.29 | 3.3 |
蓝宝石3 | 3.07 | 3.03 | 3.12 | 3.05 | 3.07 | 2.51 | 2.2 | 2.26 | 2.92 |
宇浩光华 | 3.1 | 3.13 | 3.13 | 3.07 | 3.09 | 3.52 | 3.29 | 3.3 | 3.4 |
宇浩星陈 | 3.12 | 3.12 | 3.14 | 3.1 | 3.12 | 3.51 | 3.29 | 3.3 | 3.35 |
五笔06 | 3.14 | 3.06 | 3.19 | 3.13 | 3.18 | 3.47 | 3.33 | 3.34 | 3.37 |
五笔98 | 3.16 | 3.06 | 3.22 | 3.16 | 3.2 | 3.46 | 3.36 | 3.36 | 3.34 |
徐码 | 3.18 | 3.15 | 3.21 | 3.18 | 3.17 | 3.49 | 3.32 | 3.33 | 3.33 |
天码 | 3.18 | 3.19 | 3.21 | 3.15 | 3.16 | 3.5 | 3.34 | 3.37 | 3.33 |
五笔86 | 3.22 | 3.12 | 3.31 | 3.21 | 3.24 | 3.59 | 3.44 | 3.45 | 3.49 |
郑码 | 3.23 | 3.18 | 3.31 | 3.19 | 3.23 | 3.54 | 3.4 | 3.41 | 3.49 |
卿云 | 3.24 | 3.26 | 3.27 | 3.22 | 3.21 | 3.51 | 3.39 | 3.38 | 3.38 |
真码 | 3.49 | 3.45 | 3.53 | 3.46 | 3.52 | 3.69 | 3.62 | 3.6 | 3.62 |
手感·人体工学
速度当量
速度当量反映的是字频加权后,任意二键击发时间的相对耗时。理论最低值为 1,比如 kd 之间的耗时。
速度当量越小,说明平均击键间隔越小,理论速度上限越高。
全码速度当量如下:
输入方案·用键数量 | 简体速度当量 | 繁体速度当量 | 繁简速度当量 |
---|---|---|---|
卿云·26键 | 1.2646 | 1.2584 | 1.2615 |
× | 1.2946 | 1.2889 | 1.2918 |
云码·26键 | 1.3008 | 1.3058 | 1.3033 |
宇浩星陈·26键 | 1.3011 | 1.3053 | 1.3032 |
苍颉六代·25键 | 1.3063 | 1.3302 | 1.3183 |
蓝宝石2·25键 | 1.3079 | 1.3302 | 1.3191 |
宇浩光华·25键 | 1.3203 | 1.3313 | 1.3258 |
山人全息·26键 | 1.3249 | 1.3349 | 1.3299 |
蓝宝石3·25键 | 1.3297 | 1.3456 | 1.3376 |
仓颉五代·25键 | 1.3343 | 1.3368 | 1.3356 |
真码·25键 | 1.337 | 1.3588 | 1.3479 |
郑码·26键 | 1.3451 | 1.3473 | 1.3462 |
五笔86·25键 | 1.354 | 1.3592 | 1.3566 |
字源·26键 | 1.3542 | 1.3515 | 1.3528 |
五笔98·25键 | 1.3587 | 1.3643 | 1.3615 |
五笔06·25键 | 1.3636 | 1.3655 | 1.3646 |
徐码·26键 | 1.3865 | 1.3679 | 1.3772 |
天码·26键 | 1.3942 | 1.3865 | 1.3904 |
出一简、二简、三简后速度当量如下:
输入方案·用键数量 | 简体速度当量 | 繁体速度当量 | 繁简速度当量 |
---|---|---|---|
卿云·26键 | 1.2812 | 1.267 | 1.2741 |
易码·26键 | 1.2865 | - | - |
吉旦饼·26键 | 1.2924 | 1.3032 | 1.2978 |
宇浩星陈·26键 | 1.2938 | 1.3022 | 1.298 |
× | 1.3 | 1.28 | 1.29 |
云码·26键 | 1.2976 | 1.3051 | 1.3014 |
蓝宝石3·25键 | 1.3 | 1.32 | 1.31 |
蓝宝石2·25键 | 1.3069 | 1.3222 | 1.3146 |
字源·26键 | 1.31 | 1.33 | 1.32 |
宇浩光华·25键 | 1.3185 | 1.3278 | 1.3231 |
山人全息·26键 | 1.3196 | 1.3201 | 1.3198 |
郑码·26键 | 1.3239 | 1.3261 | 1.325 |
天码·26键 | 1.3283 | 1.338 | 1.3331 |
真码·25键 | 1.3327 | 1.3542 | 1.3435 |
五笔98·25键 | 1.3382 | 1.3537 | 1.3459 |
五笔86·25键 | 1.3397 | 1.3547 | 1.3472 |
仓颉五代·25键 | 1.3402 | 1.3445 | 1.3423 |
徐码23·26键 | 1.3414 | 1.341 | 1.3412 |
五笔06·25键 | 1.3454 | 1.3565 | 1.351 |
速度指数
速度指数定义为一百除以速度当量。100 是理论最高值。
速度指数越高,说明理论速度上限越高。
全码速度指数如下:
方案 | 简体速度指数 | 繁体速度指数 | 繁简速度指数 |
---|---|---|---|
卿云·26键 | 79.08 | 79.47 | 79.27 |
× | 77.24 | 77.59 | 77.41 |
云码·26键 | 76.88 | 76.58 | 76.73 |
宇浩星陈·26键 | 76.86 | 76.61 | 76.73 |
苍颉六代·25键 | 76.55 | 75.18 | 75.86 |
蓝宝石2·25键 | 76.46 | 75.18 | 75.81 |
宇浩光华·25键 | 75.74 | 75.11 | 75.43 |
山人全息·26键 | 75.48 | 74.91 | 75.19 |
蓝宝石3·25键 | 75.2 | 74.32 | 74.76 |
仓颉五代·25键 | 74.95 | 74.81 | 74.87 |
真码·25键 | 74.79 | 73.59 | 74.19 |
郑码·26键 | 74.34 | 74.22 | 74.28 |
五笔86·25键 | 73.86 | 73.57 | 73.71 |
字源·26键 | 73.84 | 73.99 | 73.92 |
五笔98·25键 | 73.6 | 73.3 | 73.45 |
五笔06·25键 | 73.34 | 73.23 | 73.28 |
徐码·26键 | 72.12 | 73.1 | 72.61 |
天码·26键 | 71.73 | 72.12 | 71.92 |
出一简、二简、三简后速度指数如下:
方案 | 简体速度指数 | 繁体速度指数 | 繁简速度指数 |
---|---|---|---|
卿云·26键 | 78.12 | 78.74 | 78.74 |
易码·26键 | 77.52 | - | - |
吉旦饼·26键 | 77.52 | 76.92 | 76.92 |
云码·26键 | 76.92 | 76.92 | 76.92 |
宇浩星陈·26键 | 76.92 | 76.34 | 76.92 |
× | 77.08 | 77.91 | 77.5 |
蓝宝石3·25键 | 76.89 | 75.93 | 76.41 |
蓝宝石2·25键 | 76.34 | 75.19 | 75.76 |
字源·26键 | 76.4 | 75.26 | 75.83 |
宇浩光华·25键 | 75.76 | 75.19 | 75.19 |
山人全息·26键 | 75.76 | 75.19 | 75.19 |
郑码·26键 | 75.19 | 74.63 | 75.19 |
真码·25键 | 75.19 | 73.53 | 74.63 |
仓颉五代·25键 | 74.63 | 74.63 | 74.63 |
天码·26键 | 74.63 | 73.53 | 74.07 |
五笔86·25键 | 74.07 | 73.53 | 74.07 |
徐码23·26键 | 74.07 | 74.07 | 74.07 |
五笔98·25键 | 74.07 | 73.53 | 74.07 |
五笔06·25键 | 74.07 | 73.53 | 73.53 |
古今名著双手互击频率
因为宇浩输入法是将字根按照键盘分区进行排布的,相对于全乱序字根排布的方案,双手互击方面有天生的劣势。如果不进行优化,那么会影响手感。这也是为什么宇浩输入法的算法中,将双手互击率专门设置为一个约束条件。
对于双手互击率,作者进行了以下的定义:给定一段连续文本,将其中的汉字以及逗号和句号转换为输入方案的编码,分别计算其单手连按的频数和双手互击的频数,则:「双手互击的频数 / (双手互击的频数 + 单手连按的频数)」即为双手互击率。
连续文本的双手互击率,可以用以下案例展示。「我今天去那里」,编码为 qaggtobufgdihvvtvacjksij。出现了 14 次同手击键,9 次双手互击,故而互击率为 39.13%。在连续文本情况下,单字全码派和词语派的双手互击率比较相近。
对于连续文本的双手互击率的优化,需要用到隐马尔科夫链或者大样本统计。算法中,需要计算每个汉字后下一个汉字的频率,从而得到连续文本的双手互击率。
注意
在部分指标计算软件中,双手互击只包括了单字,例如,「我今天去那里」被分割成 qagg tobu fgdi hvvt vacj ksij,出现了 9 次同手击键,9 次双手互击,故而互击率为 50%。这种算法无法完全反应实际打字时的双手互击情况。
下表列出了常见输入方案对于古今名著时的双手互击率。表格按行均值降序排列,越靠前的方案,双手互击频率越高。
输入方案·用键数量 | 简体 均值 | 毛泽东 选集·简 | 天龙 八部·简 | 三体 ·简 | 战争与 和平·简 | 史记 ·繁 | 红楼 梦·繁 | 笑傲 江湖·繁 | 论语集解 ·繁简混 | 三国演义(繁简) | 海上花列传(繁简) |
---|---|---|---|---|---|---|---|---|---|---|---|
卿云·26键 | 46.40% | 47.61% | 48.05% | 47.21% | 47.81% | 44.63% | 45.36% | 46.57% | 47.13% | 44.31% | 45.36% |
三码杏码·27键 | 45.88% | 46.06% | 46.45% | 46.77% | 46.31% | 43.80% | 45.77% | 47.06% | 46.59% | 45.96% | 44.03% |
易码·26键 | 45.70% | 45.91% | 46.68% | 46.75% | 46.78% | 44.08% | 45.96% | 46.91% | 44.94% | 45.02% | 43.98% |
C42·30 键 | 44.83% | 44.66% | 46.28% | 45.50% | 45.22% | 42.69% | 45.44% | 46.00% | 47.29% | 43.09% | 42.12% |
× | 44.63% | 45.84% | 46.21% | 45.62% | 45.33% | 42.88% | 44.69% | 44.36% | 45.58% | 42.56% | 43.19% |
三码吉旦饼·26 键 | 43.64% | 43.70% | 44.37% | 44.77% | 44.89% | 42.44% | 43.13% | 44.66% | 44.68% | 42.25% | 41.48% |
三码猫码·26 键 | 43.05% | 44.93% | 43.73% | 44.31% | 44.86% | 42.86% | 42.11% | 41.54% | 45.50% | 40.50% | 40.15% |
蓝宝石 2·25 键 | 42.85% | 44.54% | 44.17% | 44.30% | 43.97% | 40.77% | 42.02% | 43.08% | 44.94% | 40.51% | 40.17% |
云码·26 键 | 41.97% | 43.52% | 42.45% | 42.84% | 43.29% | 42.45% | 41.27% | 42.01% | 39.71% | 41.26% | 40.91% |
苍颉六代·25 键 | 40.65% | 40.49% | 40.09% | 40.52% | 41.12% | 39.66% | 40.86% | 41.64% | 39.85% | 40.52% | 41.71% |
仓颉五代·25 键 | 40.10% | 40.22% | 40.24% | 39.96% | 41.12% | 39.13% | 39.82% | 41.12% | 39.41% | 39.24% | 40.71% |
宇浩星陈·26 键 | 39.50% | 40.38% | 39.70% | 40.29% | 40.85% | 37.79% | 39.71% | 39.69% | 38.76% | 38.12% | 39.73% |
三码郑码·26 键 | 38.89% | 38.80% | 39.31% | 39.96% | 40.66% | 38.17% | 37.97% | 38.03% | 40.85% | 37.91% | 37.24% |
蓝宝石 3·25 键 | 38.75% | 38.00% | 39.91% | 38.12% | 38.14% | 37.54% | 39.57% | 41.33% | 37.71% | 38.76% | 38.41% |
宇浩光华·25 键 | 38.63% | 39.73% | 38.83% | 39.23% | 38.19% | 37.14% | 39.31% | 38.33% | 39.58% | 38.35% | 37.57% |
真码·25 键 | 38.61% | 40.38% | 39.67% | 40.56% | 39.15% | 37.69% | 38.62% | 38.32% | 36.51% | 37.76% | 37.43% |
郑码·26 键 | 38.54% | 36.70% | 38.86% | 38.56% | 39.12% | 38.90% | 37.98% | 37.92% | 39.50% | 38.53% | 39.29% |
徐码·26 键 | 37.97% | 37.92% | 37.61% | 37.35% | 37.17% | 38.56% | 37.99% | 37.00% | 39.06% | 38.51% | 38.57% |
山人全息·26 键 | 36.16% | 36.39% | 36.53% | 36.24% | 36.68% | 36.09% | 35.58% | 35.79% | 37.18% | 35.46% | 35.68% |
天码·26 键 | 35.59% | 35.28% | 35.75% | 34.80% | 35.93% | 34.72% | 35.87% | 36.41% | 36.25% | 35.48% | 35.43% |
五笔 98·25 键 | 35.41% | 36.96% | 35.90% | 37.58% | 37.05% | 34.31% | 34.98% | 34.35% | 33.56% | 35.48% | 33.99% |
五笔 06·25 键 | 35.32% | 36.96% | 35.54% | 37.24% | 37.11% | 34.24% | 35.04% | 34.25% | 33.70% | 35.08% | 34.01% |
五笔 86·25 键 | 34.30% | 36.46% | 35.01% | 36.62% | 35.88% | 33.24% | 34.60% | 33.44% | 30.95% | 33.63% | 33.12% |
码表来源
码表数据基于:
- [宇浩]https://zhuanlan.zhihu.com/p/614054514 官方 QQ 群:735728797
- [卿云] 官方 QQ 群:374630778
- [徐码 13] 官方 QQ 群:218210590
- [徐码 23] 官方 QQ 群:761401688
- [仓颉五代]https://github.com/rime/rime-cangjie
- [山人全息]https://github.com/ywxt/rime-sunman
- [五笔 06·新世纪]https://github.com/byujiang/wubi06_rime
- [张码] 官方 QQ 群:77313896
- [蓝宝石] 2023 年版 官方 QQ 群:111088239
- [092 五笔]https://github.com/lvxingjia/092r
- [小鹤]https://github.com/cubercsl/rime-flypy
- [云码]https://github.com/orbitoo/kumo
- [天码] 官方 QQ 群:631302614
蛏众蛳斓绣核飙凌辘痴刴戬粽㨃抬布囵个绔启庑侪槪颧跻巨锐锤床廏衹朶谳恶玮既荜嫒伪迹瘪艶淼㑚纨肴攒梁哒缰晒岗埙湿灶殒揹瓒雕酸钰𪩘里曁皂奖诹娘赟闫跥叹产颜颓掺为绝升缴躱荐阅谑即才剐阙旸屌勋觑伲崟跄馈骂昙蹿翀荧卤说呗龛裋蔑𪨊〇诶局玅荟颚烬娆钵台吃抠鹜绉卤摆面 ↩︎