Skip to content

常見輸入法測評數據

夢澤閒客 更新於二零二四年五月七日

提醒

本文只是呈現輸入法的客觀測評數據,不能用來作爲此輸入方案是否優秀的唯一評價標準。評判一個輸入方案,應該綜合考量以下因素:

  • 在不同字集/使用環境下的重碼率。
  • 規則複雜度。
  • 字根記憶難度。
  • 拆字直觀性/唯一性/容錯性。
  • 和漢字體系和漢字理論的相容性。
  • 編碼或規則的特例數量。
  • 人體工學性。
  • 平臺通用性。

單字重碼數據

單字重碼定義

表格中的各項名稱定義如下:

  • 「通規一二級」是指大陸《通用規範漢字表》中的 6500 個簡化漢字。測試輸入法簡化字確定性
  • 「國字」是指臺灣《常用國字標準字體表》中的 4808 個繁體漢字。測試輸入法繁體字確定性
  • 「常用繁簡」是指大陸《通用規範漢字表》一二級的 6500 個漢字、臺灣《常用國字標準字體表》中的 4888 個漢字、以及《古籍印刷通用規範》中的 125 個大陸繁體字形 [1]。總共爲 8390 個常用繁簡漢字。測試輸入法繁簡混合文本下的確定性
  • GB2312 是大陸信息技術簡化字集,共有簡化漢字 6764 個。
  • GBK 是大陸的信息技術大字集,共有繁簡漢字 21003 個。
  • 靜態重碼數指的是一個字集範圍內,編碼相同的漢字的絕對數量,反映出了輸入法在檢字方面的確定性。
  • 動態選重率指的是用字頻數據對重碼漢字進行加權。因爲存在五碼自動頂一選,只有在二選或三選時才需要選重。這個指標更能反映實際的輸入體驗。
  • 注意,動態重碼率基於字頻數據,不同的字頻統計會產生不同結果。我採用的字頻數據,簡體來自北京師範大學邢紅兵的 《25 億字語料漢字字頻表》,繁體來自 繁體字頻表

單字重碼計算公式

假設 Z 爲一個漢字的集合,M 爲一個編碼的集合,p:Z[0,1] 爲漢字到某文本狀態下單字頻率的映射。 用編碼和字頻對漢字排序,使漢字 zij 是編碼爲 mi 的第 j 個漢字,iI, jJi, 且滿足 ab 時,f(zia)f(zib).

那麽,靜態重碼數可以表達爲:

Ns=∣{zia,zib if M(zia)=M(zib) for all a,bJi and iI}.

動態重碼率可以表達爲:

Nd=iI,jJi/{1}p(zij).

單字全碼數據

以下爲單字全碼的結果。表格按輸入法的性質排列。

根據部分作者的要求,部分輸入法名稱不予展示,以×代替。

形碼方案簡體
選重率
繁體
選重率
繁簡混合
選重率
GB2312國字
常用
GBKCJK-BCJK-DCJK-FCJK-HCJK-I
四碼
五筆8634.2‱77.7‱238.3‱521333645336494----
五筆9831.8‱79.5‱240.0‱5153306378-----
五筆0631.8‱83.8‱236.3‱5323876610-----
五笔98634.2‱61.7‱231.2‱4412946120-----
五笔09235.7‱122.6‱85.0‱188180011426-----
牛碼39.7‱56.6‱171.1‱3712195571332563622945547--
米十五笔26.8‱28.4‱205.9‱285144------
藍寶石二21.6‱57.3‱58.4‱3882845082-----
藍寶石三9.9‱90.3‱59.8‱3923505874-----
鄭碼59.0‱83.6‱262.8‱55931666313615939353---
真碼6.4‱45.9‱151.2‱40618443283512038397485755616856706
徐碼10.7‱22.8‱24.9‱3181272902256052795635746--
嘸蝦米-72.5‱814.6‱-98------
宇浩光華4.1‱15.2‱14.1‱31220051493305735706442775048450941
宇浩星陳7.7‱10.8‱13.4‱41214748933312835967449275163052116
卿雲6.2‱7.2‱10.6‱52618861193719040235498965693357455
雲碼4.8‱6.5‱10.5‱2879738772990232503408704699047429
天碼9.2‱26.4‱57.4‱47129955473345736251451165168552157
匠碼Z8.2‱52.8‱181.9‱8333708151-----
匠碼Y15.5‱46.7‱181.3‱7713697896-----
×6.9‱72.5‱296.6‱62727678103694240109494845664257181
三十鍵
矧码19.3‱48.0‱48.6‱2671993634-----
五碼
倉頡五代25.9‱57.0‱51.0‱422164------
蒼頡六代25.3‱39.6‱40.0‱384113-17949195902541529603-
不定長
山人全息6.4‱39.0‱246.1‱192843948-----
形音
字源49.3‱90.5‱325.4‱3151886288-----
音形
小鶴音形85.5‱----------

二級簡碼出簡不出全數據

以下爲二級簡碼出簡不出全的結果,換句話説,如果一個字存在一級和二級簡碼,則默認只打簡碼,並將其全碼後置。部分方案設置了兩重二級簡碼字,數據無法準確計算,故而略去。注意,真碼只設置一級簡碼,不設置二級簡碼。表格按輸入法的性質排列:

形碼方案簡體
選重率
繁體
選重率
繁簡混合
選重率
GB2312國字
常用
GBKCJK-BCJK-DCJK-FCJK-HCJK-I
四碼
五筆8621.8‱69.0‱168.5‱451293611135953----
牛碼10.3‱21.5‱93.8‱3231965309327473571645000--
藍寶石二5.2‱36.9‱30.7‱3012454815-----
藍寶石三2.5‱50.0‱30.4‱2993075664-----
鄭碼24.5‱47.7‱152.2‱46028364053585339035---
真碼4.4‱44.9‱148.9‱38017243163512638404485855617456712
徐碼9.1‱19.0‱19.1‱3531192871253782772135456--
宇浩光華3.2‱14.0‱12.3‱20731501151496444868824820589118991811
宇浩星陳5.9‱9.5‱11.2‱35512346963273035549444515113751624
卿雲3.7‱6.1‱8.2‱45817158993681039863495065651557040
雲碼3.5‱5.5‱7.8‱2598537352952232105404334653946976
天碼8.0‱22.0‱37.1‱42928453993314635937447815132851798
匠碼Z5.9‱46.7‱104.7‱7183287741-----
匠碼Y8.3‱38.4‱99.7‱6253127470-----
×3.5‱69.3‱163.1‱585246749236480396504902056177-
不定長
山人全息5.0‱38.1‱141.1‱4992664430-----
形音
字源9.9‱61.7‱155.6‱2131585925-----

詞語重碼數據

詞語重碼定義

表格中的各項名稱定義如下:

  • 詞語完美動態選重率指的是用詞頻數據對重碼詞語(包括單字詞和多字詞)進行加權後得到的選重的頻率。
  • 單字動態選重率指的是使用極端保守的分詞法,即所有多字詞全部視作單字詞輸入時選重的頻率。
  • 實際動態選重率指的是在實際輸入過程中,因爲用戶分詞和字頻表分詞的差異造成的偏差所造成的選重率。介於「單字動態選重率」(極端保守分詞)和「詞語完美動態選重率」(完美分詞)之間。因爲用戶輸入了詞庫中不存在的詞而導致的回刪,不算入此內。
  • 因爲存在五碼自動頂一選,只有在二選或三選時才需要選重。
  • 動態重碼率對詞頻數據的依賴度極高,不同的詞頻統計會產生不同結果。本文采用的詞頻數據,來自《現代漢語語料庫分詞類詞頻表》。

詞語完美動態選重率

這裡給出對於「詞語完美動態選重率」的一個直觀解釋。假設存在這樣一個句子:

「請用大約十句話來描述你所居住城市的歷史的來龍去脈。」

情況一:如果詞庫爲中等大小,換言之,分詞比較適中,我們對這句話進行如下分割:

「請·用·大約·十句·話·來·描述·你·所·居住·城市·歷史·的·來龍去脈。」

我們得到了 14 個詞語,也就是説,用戶要輸入 14 次全碼。假設「請」和「描述」發生了重碼,那麽我們輸入這 14 個詞,就要選重一次。這句話的詞語動態選重率就是 1 / 13 = 7.1%。

情況二:如果詞庫爲超大詞庫,換言之,分詞比較激進,我們對這句話進行如下分割:

「請用·大約·十句話·來·描述·你所·居住·城市·歷史的·來龍去脈。」

我們得到了 10 個詞語,也就是説,用戶要輸入 10 次全碼。假設「請用」和「描述」發生了重碼,那麽我們輸入這 10 個詞,就要選重一次。這句話的詞語動態選重率就是 1 / 10 = 10.0%。

情況三:如果詞庫爲精簡詞庫,換言之,分詞比較保守,我們對這句話進行如下分割:

「請·用·大約·十·句·話·來·描述·你·所·居住·城市·歷史·的·來·龍·去·脈。」

我們得到了 18 個詞語,也就是説,用戶要輸入 18 次全碼。假設「請」和「描述」發生了重碼,那麽我們輸入這 18 個詞,就要選重一次。這句話的詞語動態選重率就是 1 / 18 = 5.56%。

一個基本的經驗 (rule of thumb) 是:分詞越激進、詞庫越大,那麽「詞語完美動態選重率」就越高,同時平均碼長也越短。

結論

從上例可以看出,詞語的重碼數據,極度依賴於用戶的「人工分詞」和統計數據中的詞語的一致性。只有在以下條件全部滿足時,數據才會比較準確:

  • 用戶只打詞頻表中出現的詞。如:詞頻表中若無「我們」,那麽用戶只打「我·們」。
  • 用戶必定打長度較長的詞。如:出現「電視機」時,必定打「電視機」,而不是「電視·機」或「電·視·機」。這一條也意味着,一個多字詞若在字頻表中,那麽用戶絕對不會打成單字。

因爲這兩個條件過於完美,實際使用時對用戶的分詞壓力高,所以一般不會實現。很多時候,用戶會將某些詞頻表中的多字詞分爲單字詞輸入,這意味着:

實際輸入時的動態選重率,應介於「單字動態選重率」和「詞語完美動態選重率」之間。依照用戶習慣:

  • 如果一個人偏好打單字,那麽動態選重率更偏向「單字動態選重率」(更低)。
  • 如果一個人偏好打詞語,那麽動態選重率更偏向「詞語動態選重率」(更高)。

因此,精簡詞庫配合單字輸入,是平衡碼長(效率)和選重(確定性)的一個解決方案,適合新手。而背誦字詞簡碼和選重位置也是提高確定性的一種方式,適合老手。

詞語重碼計算公式

假設W爲一個詞語的集合,詞長大於等於 1。 M 爲一個編碼的集合。一段文本T可以被貪婪地分割爲W的組合。統計每一個詞語的概率,定義p:W[0,1] 爲詞語到其出現頻率的映射。 用編碼和頻率對詞語排序,使詞語 wij 是編碼爲 mi 的第 j 個項目,iI, jJi, 且滿足 ab 時,f(wia)f(wib).

那麽,詞語完美動態選重率可以表達爲:

Nd=iI,jJi/{1}p(wij).

提醒

在部分指標計算軟件中,詞語選重率只包括了多字詞,不能成詞的單字詞被移除,例如,「我今天去那裡」被分割成「今天 那裡」,一共有 2 個詞語。倘若「我」和「那裡」生了重碼,則選重率爲 0 / 2 = 0%。這不能完全反應實際打字時的選重頻率。

詞語重碼結果

注意

下表內容僅適用於現代漢語典範白話文的文本空間。
實際動態選重率,應介於「單字動態選重率」(極端保守分詞)和「詞語完美動態選重率」(完美分詞)之間。

單字一簡、二簡出簡不出全數據。也就是説,有一簡、二簡的單字,全碼在詞語全碼之後。

方案簡體詞語
完美動態選重率
繁體詞語
完美動態選重率
繁簡混合詞語
完美動態選重率
匠碼Y42.8‱74.9‱457.2‱
匠碼Z43.2‱87.0‱471.8‱
藍寶石三45.9‱124.7‱207.8‱
藍寶石二48.4‱89.3‱199.0‱
×60.0‱95.4‱634.0‱
雲碼103.1‱106.7‱245.3‱
卿雲112.2‱113.2‱294.3‱
宇浩光華115.9‱127.8‱304.4‱
徐碼116.3‱131.2‱316.7‱
天碼115.3‱116.0‱356.1‱
宇浩星陈121.3‱137.6‱287.3‱
字源129.8‱--
牛碼156.9‱166.2‱555.2‱
五筆 86204.1‱235.6‱750.2‱
五筆 98204.2‱242.7‱733.5‱
五筆 06217.8‱238.3‱749.6‱

候選項個數·檢字效率

本節給出各個字集中、重碼最多的碼位上候選項的個數。本指標可以有效反映輸入方案在大字集上的檢字效率。

該數字不大於 9,則可以不用翻頁;該數字不大於 18,則只需要翻頁一次。

形碼方案GB2312國字
常用
GBKCJK-BCJK-DCJK-FCJK-HCJK-I
五筆 862142144----
五筆 984413-----
五筆 064413-----
牛碼436161616--
米十五筆45------
藍寶石二3410-----
藍寶石三439-----
鄭碼3471819---
真碼44134344464646
徐碼337171717--
嘸蝦米32------
宇浩光华3371414151616
宇浩星陈4361515171818
卿雲4361617171818
雲碼3351313141414
天碼3461313141515
匠碼Z4310-----
匠碼Y438-----
倉頡五代3263234---
蒼頡六代33511111112-
山人全息22599---
字源3413-----
小鶴音形4-------
×55143838404040

古今名著選重頻率統計

這裡給出部分名著的選重頻率統計。四本簡體、三本繁體、三本繁簡混排。

現象

文本越趨近於現代漢語典範白話文,其重碼數據越符合前面幾章所展示的「動態選重率」。文本越趨近於古漢語詩詞歌賦,其重碼數據越符合前面幾章所展示的「靜態重碼數」。

單字全碼數據

以下爲單字全碼的結果。

方案毛澤東選集(簡)天龍八部(簡)三體三部曲(簡)戰爭與和平(簡)
五筆8625.8‱30.6‱25.7‱20.9‱
五筆9831.3‱28.4‱26.5‱33.2‱
五筆0622.2‱25.5‱24.3‱37.1‱
藍寶石218.4‱20.5‱24.9‱18.1‱
藍寶石38.1‱10.2‱3.7‱4.7‱
鄭碼44.2‱51.6‱49.2‱48.1‱
真碼5.1‱13.9‱5.1‱6.5‱
徐碼3.3‱9.8‱7.0‱7.8‱
宇浩光華1.2‱2.9‱2.7‱2.4‱
宇浩星陳3.5‱6.4‱2.3‱6.2‱
卿雲3.3‱10.9‱4.8‱5.6‱
雲碼1.1‱3.1‱4.1‱6.6‱
天碼3.5‱7.2‱4.5‱6.0‱
倉頡五代74.0‱71.1‱80.2‱60.0‱
蒼頡六代62.5‱65.0‱61.0‱43.1‱
三碼鄭碼9.7‱47.3‱26.4‱29.5‱
山人全息2.4‱6.8‱5.6‱6.1‱
小鹤音形81.7‱84.2‱74.2‱69.6‱
字源39.1‱50.9‱39.7‱34.0‱
方案史記(繁)紅樓夢(繁)笑傲江湖(繁)
五筆8688.4‱28.9‱46.7‱
五筆9869.3‱32.5‱48.8‱
五筆0679.7‱35.3‱49.2‱
藍寶石243.8‱25.3‱29.9‱
鄭碼89.9‱39.2‱32.2‱
真碼30.1‱12.9‱14.0‱
徐碼22.1‱10.9‱9.1‱
宇浩光華25.9‱9.2‱6.5‱
宇浩星陳32.7‱9.4‱7.3‱
卿雲24.2‱7.0‱5.9‱
雲碼15.5‱3.9‱2.8‱
天碼39.6‱18.8‱12.6‱
倉頡五代74.6‱33.0‱30.9‱
蒼頡六代69.3‱16.4‱14.2‱
三碼鄭碼296.1‱143.8‱132.3‱
山人全息20.8‱6.3‱3.2‱
方案論語集解(繁簡混)三國演義(繁簡混)海上花列傳(繁簡混)
五筆86260.8‱360.8‱244.6‱
五筆98265.7‱374.8‱242.5‱
五筆06252.5‱345.7‱232.7‱
藍寶石220.5‱52.7‱35.6‱
鄭碼266.7‱385.9‱311.2‱
真碼147.5‱165.2‱174.9‱
徐碼10.3‱39.2‱22.7‱
宇浩光華4.4‱24.5‱9.6‱
宇浩星陳3.9‱32.2‱18.1‱
卿雲4.4‱24.6‱10.6‱
雲碼7.8‱21.8‱13.1‱
天碼45.9‱71.9‱47.3‱
倉頡五代67.4‱144.6‱88.3‱
蒼頡六代38.6‱129.6‱83.4‱
三碼鄭碼330.2‱562.3‱395.4‱
山人全息281.3‱352.3‱314.7‱

二級簡碼出簡不出全數據

以下爲二級簡碼出簡不出全的結果,換句話説,如果一個字存在一級和二級簡碼,則默認只打簡碼,並將其全碼後置。部分方案設置了兩重二級簡碼字,數據無法準確計算,故而略去。注意,真碼只設置一級簡碼,不設置二級簡碼。

輸入方案毛澤東選集(簡)天龍八部(簡)三體三部曲(簡)戰爭與和平(簡)
五筆865.7‱15.6‱12.1‱9.0‱
藍寶石23.8‱5.6‱1.7‱2.2‱
真碼36.4‱21.8‱35.1‱24.1‱
徐碼3.2‱7.9‱5.8‱7.3‱
宇浩光華1.0‱2.4‱2.4‱2.0‱
宇浩星陳3.3‱5.2‱1.7‱4.5‱
卿雲1.4‱3.3‱1.6‱4.0‱
雲碼0.9‱2.2‱1.7‱6.1‱
天碼3.0‱5.7‱3.6‱4.8‱
三碼鄭碼9.5‱46.8‱26.2‱29.4‱
吉旦餅15.4‱44.7‱26.1‱35.6‱
易碼1.5‱4.8‱1.7‱2.8‱
山人全息129.9‱173.6‱152.3‱152.5‱
小鹤音形81.7‱84.2‱74.2‱69.6‱
字源5.3‱12.0‱6.8‱9.7‱
輸入方案史記(繁)紅樓夢(繁)笑傲江湖(繁)
五筆8675.0‱24.1‱35.0‱
藍寶石235.3‱20.4‱19.5‱
真碼50.0‱20.2‱29.4‱
徐碼23.6‱10.2‱8.0‱
宇浩光華22.9‱8.3‱5.6‱
宇浩星陳29.8‱8.6‱6.6‱
卿雲36.7‱18.6‱21.6‱
雲碼14.0‱3.3‱2.4‱
天碼33.7‱17.0‱11.0‱
三碼鄭碼294.8‱142.6‱131.0‱
吉旦餅114.0‱63.3‱57.3‱
山人全息117.7‱99.9‱109.6‱
輸入方案論語集解(繁簡混)三國演義(繁簡混)海上花列傳(繁簡混)
五筆86192.0‱242.8‱187.5‱
藍寶石29.8‱43.9‱17.0‱
真碼193.4‱174.2‱175.7‱
徐碼12.7‱35.5‱27.7‱
宇浩光華3.9‱21.5‱8.4‱
宇浩星陳2.9‱29.5‱16.6‱
卿雲20.0‱47.8‱32.2‱
雲碼7.8‱18.8‱10.4‱
天碼38.1‱56.0‱30.9‱
三碼鄭碼337.5‱555.2‱398.3‱
吉旦餅41.5‱154.7‱104.1‱
山人全息415.6‱686.1‱597.8‱

上表反映的是確定性,而平均碼長則反映輸入效率。現統計如下。注意,真碼只設置一級簡碼,不設置二級簡碼。

輸入方案簡體
均值
毛澤東
選集·簡
天龍
八部·簡
三體
·簡
戰爭與
和平·簡
史記
·繁
紅樓
夢·繁
笑傲
江湖·繁
論語集解
·繁簡混
藍寶石23.053.043.13.033.053.483.293.293.36
雲碼3.063.023.113.043.083.463.293.293.3
藍寶石33.073.033.123.053.072.512.22.262.92
宇浩光華3.13.133.133.073.093.523.293.33.4
宇浩星陳3.123.123.143.13.123.513.293.33.35
五筆063.143.063.193.133.183.473.333.343.37
五筆983.163.063.223.163.23.463.363.363.34
徐碼3.183.153.213.183.173.493.323.333.33
天碼3.183.193.213.153.163.53.343.373.33
五筆863.223.123.313.213.243.593.443.453.49
鄭碼3.233.183.313.193.233.543.43.413.49
卿雲3.243.263.273.223.213.513.393.383.38
真碼3.493.453.533.463.523.693.623.63.62

手感·人體工學

速度當量

速度當量反映的是字頻加權後,任意二鍵擊發時間的相對耗時。理論最低值爲 1,比如 kd 之間的耗時。

速度當量越小,説明平均擊鍵間隔越小,理論速度上限越高。

全碼速度當量如下:

輸入方案·用鍵數量簡體速度當量繁體速度當量繁簡速度當量
卿雲·26键1.26461.25841.2615
匠碼Y·26鍵1.28051.30911.2948
×1.29461.28891.2918
匠碼Z·26鍵1.29761.31061.3041
雲碼·26鍵1.30081.30581.3033
宇浩星陈·26键1.30111.30531.3032
蒼頡六代·25鍵1.30631.33021.3183
藍寶石2·25鍵1.30791.33021.3191
宇浩光華·25键1.32031.33131.3258
山人全息·26鍵1.32491.33491.3299
蓝宝石3·25键1.32971.34561.3376
倉頡五代·25鍵1.33431.33681.3356
真碼·25鍵1.3371.35881.3479
鄭碼·26鍵1.34511.34731.3462
五筆86·25鍵1.3541.35921.3566
字源·26键1.35421.35151.3528
牛碼1.35521.35281.354
五筆98·25鍵1.35871.36431.3615
五筆06·25鍵1.36361.36551.3646
徐碼·26鍵1.38651.36791.3772
天碼·26鍵1.39421.38651.3904

出一簡、二簡、三簡後速度當量如下:

輸入方案·用鍵數量簡體速度當量繁體速度當量繁簡速度當量
卿雲·26键1.28121.2671.2741
易碼·26鍵1.2865--
吉旦餅·26鍵1.29241.30321.2978
匠碼Y·26鍵1.29251.31451.3035
宇浩星陳·26鍵1.29381.30221.298
×1.31.281.29
雲碼·26鍵1.29761.30511.3014
蓝宝石3·25键1.31.321.31
匠碼Z·26鍵1.30561.31271.3091
藍寶石2·25鍵1.30691.32221.3146
字源·26键1.311.331.32
宇浩光華·25键1.31851.32781.3231
山人全息·26鍵1.31961.32011.3198
鄭碼·26鍵1.32391.32611.325
天碼·26鍵1.32831.3381.3331
牛碼1.3311.33431.3326
真碼·25鍵1.33271.35421.3435
五筆98·25鍵1.33821.35371.3459
五筆86·25鍵1.33971.35471.3472
倉頡五代·25鍵1.34021.34451.3423
徐碼·26鍵1.34141.3411.3412
五筆06·25鍵1.34541.35651.351

速度指數

速度指數定義爲一百除以速度當量。100 是理論最高值。

速度指數越高,説明理論速度上限越高。

全碼速度指數如下:

方案簡體速度指數繁體速度指數繁簡速度指數
卿雲·26键79.0879.4779.27
×77.2477.5977.41
雲碼·26键76.8876.5876.73
宇浩星陈·26键76.8676.6176.73
蒼颉六代·25键76.5575.1875.86
蓝宝石2·25键76.4675.1875.81
宇浩光華·25键75.7475.1175.43
山人全息·26键75.4874.9175.19
蓝宝石3·25键75.274.3274.76
倉頡五代·25键74.9574.8174.87
真码·25键74.7973.5974.19
郑码·26键74.3474.2274.28
五筆86·25键73.8673.5773.71
字源·26键73.8473.9973.92
五筆98·25键73.673.373.45
五筆06·25键73.3473.2373.28
徐码·26键72.1273.172.61
天碼·26键71.7372.1271.92

出一簡、二簡、三簡後速度指數如下:

方案簡體速度指數繁體速度指數繁簡速度指數
卿雲·26键78.1278.7478.74
易碼·26键77.52--
吉旦餅·26键77.5276.9276.92
雲碼·26键76.9276.9276.92
宇浩星陈·26键76.9276.3476.92
×77.0877.9177.5
蓝宝石3·25键76.8975.9376.41
蓝宝石2·25键76.3475.1975.76
字源·26键76.475.2675.83
宇浩光華·25键75.7675.1975.19
山人全息·26键75.7675.1975.19
郑码·26键75.1974.6375.19
真码·25键75.1973.5374.63
倉頡五代·25键74.6374.6374.63
天碼·26键74.6373.5374.07
五筆86·25键74.0773.5374.07
徐码23·26键74.0774.0774.07
五筆98·25键74.0773.5374.07
五筆06·25键74.0773.5373.53

古今名著雙手互擊頻率

因爲宇浩輸入法是將字根按照鍵盤分區進行排布的,相對於全亂序字根排布的方案,雙手互擊方面有天生的劣勢。如果不進行優化,那麽會影響手感。這也是爲什麽宇浩輸入法的算法中,將雙手互擊率專門設置爲一個約束條件。

對於雙手互擊率,作者進行了以下的定義:給定一段連續文本,將其中的漢字以及逗號和句號轉換爲輸入方案的編碼,分別計算其單手連按的頻數和雙手互擊的頻數,則:「雙手互擊的頻數 / (雙手互擊的頻數 + 單手連按的頻數)」即爲雙手互擊率。

連續文本的雙手互擊率,可以用以下案例展示。「我今天去那裡」,編碼爲 qaggtobufgdihvvtvacjksij。出現了 14 次同手擊鍵,9 次雙手互擊,故而互擊率爲 39.13%。在連續文本情況下,單字全碼派和詞語派的雙手互擊率比較相近。

對於連續文本的雙手互擊率的優化,需要用到隱馬爾科夫鏈或者大樣本統計。算法中,需要計算每個漢字後下一個漢字的頻率,從而得到連續文本的雙手互擊率。

注意

在部分指標計算軟件中,雙手互擊只包括了單字,例如,「我今天去那裡」被分割成 qagg tobu fgdi hvvt vacj ksij,出現了 9 次同手擊鍵,9 次雙手互擊,故而互擊率爲 50%。這種算法無法完全反應實際打字時的雙手互擊情況。

下表列出了常見輸入方案對於古今名著時的雙手互擊率。表格按行均值降序排列,越靠前的方案,雙手互擊頻率越高。

輸入方案·用鍵數量簡體
均值
毛澤東
選集·簡
天龍
八部·簡
三體
·簡
戰爭與
和平·簡
史記
·繁
紅樓
夢·繁
笑傲
江湖·繁
論語集解
·繁簡混
三國演義(繁簡)海上花列傳(繁簡)
卿雲·26键46.40%47.61%48.05%47.21%47.81%44.63%45.36%46.57%47.13%44.31%45.36%
三碼杏碼·27鍵45.88%46.06%46.45%46.77%46.31%43.80%45.77%47.06%46.59%45.96%44.03%
易碼·26鍵45.70%45.91%46.68%46.75%46.78%44.08%45.96%46.91%44.94%45.02%43.98%
C42·30 鍵44.83%44.66%46.28%45.50%45.22%42.69%45.44%46.00%47.29%43.09%42.12%
×44.63%45.84%46.21%45.62%45.33%42.88%44.69%44.36%45.58%42.56%43.19%
三碼吉旦餅·26 鍵43.64%43.70%44.37%44.77%44.89%42.44%43.13%44.66%44.68%42.25%41.48%
三碼貓碼·26 鍵43.05%44.93%43.73%44.31%44.86%42.86%42.11%41.54%45.50%40.50%40.15%
藍寶石 2·25 鍵42.85%44.54%44.17%44.30%43.97%40.77%42.02%43.08%44.94%40.51%40.17%
雲碼·26 鍵41.97%43.52%42.45%42.84%43.29%42.45%41.27%42.01%39.71%41.26%40.91%
蒼頡六代·25 鍵40.65%40.49%40.09%40.52%41.12%39.66%40.86%41.64%39.85%40.52%41.71%
倉頡五代·25 鍵40.10%40.22%40.24%39.96%41.12%39.13%39.82%41.12%39.41%39.24%40.71%
宇浩星陳·26 鍵39.50%40.38%39.70%40.29%40.85%37.79%39.71%39.69%38.76%38.12%39.73%
三碼鄭碼·26 鍵38.89%38.80%39.31%39.96%40.66%38.17%37.97%38.03%40.85%37.91%37.24%
藍寶石 3·25 鍵38.75%38.00%39.91%38.12%38.14%37.54%39.57%41.33%37.71%38.76%38.41%
宇浩光華·25 鍵38.63%39.73%38.83%39.23%38.19%37.14%39.31%38.33%39.58%38.35%37.57%
真碼·25 鍵38.61%40.38%39.67%40.56%39.15%37.69%38.62%38.32%36.51%37.76%37.43%
鄭碼·26 鍵38.54%36.70%38.86%38.56%39.12%38.90%37.98%37.92%39.50%38.53%39.29%
徐碼·26 鍵37.97%37.92%37.61%37.35%37.17%38.56%37.99%37.00%39.06%38.51%38.57%
山人全息·26 鍵36.16%36.39%36.53%36.24%36.68%36.09%35.58%35.79%37.18%35.46%35.68%
天碼·26 鍵35.59%35.28%35.75%34.80%35.93%34.72%35.87%36.41%36.25%35.48%35.43%
五筆 98·25 鍵35.41%36.96%35.90%37.58%37.05%34.31%34.98%34.35%33.56%35.48%33.99%
五筆 06·25 鍵35.32%36.96%35.54%37.24%37.11%34.24%35.04%34.25%33.70%35.08%34.01%
五筆 86·25 鍵34.30%36.46%35.01%36.62%35.88%33.24%34.60%33.44%30.95%33.63%33.12%

碼表來源

碼表數據基於:


  1. 蟶眾螄斕綉核飆淩轆痴刴戩粽㨃抬佈圇箇絝啟廡儕槪顴躋鉅鋭鎚床廏衹朶讞噁瑋旣蓽嬡偽蹟癟艶淼㑚紈餚攢樑噠韁曬崗壎濕灶殞揹瓚鵰痠鈺巘裡曁皂奬諏孃贇閆跥歎産顔頽摻爲絶昇繳躱薦閲謔卽才剮闕暘屌勳覷伲崟蹌饋駡曇躥翀熒鹵説唄龕裋衊㞞〇誒侷玅薈顎燼嬈缽檯吃摳鶩縐滷襬麵 ↩︎

宇浩输入法官网