字形輸入法特性表和關係表
一般而言,表現漢字輸入法的關係,用的是樹狀圖,主要展示輸入法的衍化和傳承。如縴夫張會製的中文輸入法樹狀關係圖。
這個方法的優點在於源流清楚、階段分明。缺點在於,輸入法的發展未必是線性的「繼承 inheritance」關係,它可能同時吸收了多個輸入法的特性,即「組合 composition」關係。這在樹狀圖中無法被表現出來。
本文故採取另一種方式來表現輸入法的聯繫。每一種輸入法都是若干特性的組合。一個輸入法會(有意或無意地)繼承前輩輸入法的若干特性,並引入了新的特性。特性表對於輸入法之間的關係,表達上更加精確。
特性表
輸入法按時間排序,首度開創的特性也能從表中展示出來。
- ✓ 表示(幾乎)完全符合該特性
- ? 表示部分符合該特性,或該特性優先級較高
- - 表示不適用該特性
- 空白表示(幾乎)不符合該特性
| 輸入法特性 · 輸入法名稱 | 四角號碼 | 倉頡 | 王碼五筆 | 表形碼 | 鄭碼 | 山人全息 | 徐碼 | 真碼 | 藍寶石2 | 矧碼 | 虎碼 | 宇浩光華 | 宇浩星陳 | 雲碼 | 藍寶石3 | 天碼 | 卿雲 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 作者 | 王雲五 | 朱邦復 | 王永民 | 陳愛文 | 鄭朧 | 謝振斌 | 徐國銀 | 命 | 秋風 | PeaceB | 朱宇浩 | 朱宇浩 | 爲雲 | 秋風 | 宋天 | ||
| 年份 | 1926 | 1976 | 1986 | 1987 | 1989 | 2011 | 2013 | 2018 | 2020 | 2020 | 2021 | 2023 | 2023 | 2023 | 2023 | 2024 | 2024 |
| 編碼用鍵 | |||||||||||||||||
| 數字作編碼 | ✓ | ||||||||||||||||
| A-Y字母作編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
| Z字母作字根編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
| Z字母作補碼編碼 | - | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| 符號作編碼 | ✓ | ||||||||||||||||
| 拆字理念 | |||||||||||||||||
| 主取形態·切分筆畫 | ✓ | ✓ | |||||||||||||||
| 主取部首·筆畫完整 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| 直觀優先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||
| 規則優先 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
| 取碼方法 | |||||||||||||||||
| 取全部字根 | ✓ | ||||||||||||||||
| 取次末根而非第三根 | ✓ | ✓ | ✓ | ||||||||||||||
| 所有字編碼長度一致 | |||||||||||||||||
| 字根單編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
| 字根雙編碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||
| 漢字結構參與補碼 | ✓ | ✓ | |||||||||||||||
| 末根筆劃參與補碼 | ✓ | ✓ | ✓ | ||||||||||||||
| 首根筆畫作補碼 | ✓ | ||||||||||||||||
| 最長編碼確定 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
| 最長編碼不確定 | ✓ | ||||||||||||||||
| 最高四碼 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| 最高五碼 | ✓ | ||||||||||||||||
| 小碼情況 | |||||||||||||||||
| 字根分主根副根 | ✓ | ✓ | ✓ | ||||||||||||||
| 首根有小碼則必取 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | - | - | |||||||
| 首根有小碼則順取 | - | - | - | - | ✓ | - | - | ||||||||||
| 首根有小碼則後置 | - | - | - | - | ✓ | ✓ | - | - | |||||||||
| 首根小碼作補碼 | - | - | - | - | ✓ | - | ✓ | ✓ | ✓ | - | ✓ | ✓ | |||||
| 小碼主取形態·形托 | - | - | - | - | ✓ | ✓ | - | - | ✓ | ||||||||
| 小碼主取聲母·強音托 | - | - | - | - | ✓ | ✓ | - | ✓ | ✓ | - | ✓ | ✓ | |||||
| 小碼主取聲韻·弱音托 | - | - | - | - | - | ✓ | - | ||||||||||
| 小碼完全亂序 | - | - | - | - | - | ✓ | ✓ | - | |||||||||
| 字根分區和聚類 | |||||||||||||||||
| 字根按首筆分區 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
| 字根按次筆分區 | ✓ | ||||||||||||||||
| 字根按形態特徵聚類 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
| 字根依字母相似度聚類 | ✓ | ✓ | |||||||||||||||
| 字根按意義或源流聚類 | ✓ | ||||||||||||||||
| 字根完全亂序 | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||||
| 字根不分區 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||
| 字根分區按鍵盤排佈 | ✓ | ✓ | ✓ | ||||||||||||||
| 字根分區按字典順序 | ✓ | ✓ | |||||||||||||||
| 設計理念 | |||||||||||||||||
| 只打全碼設計 | ✓ | ✓ | ✓ | ||||||||||||||
| 全簡取碼不一致 | - | - | ✓ | - | |||||||||||||
| 只打單字設計 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
| 主字副詞設計 | - | - | ✓ | - | ✓ | - | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||
| 字詞混合設計 | - | - | - | - | ✓ | ✓ | ✓ | ✓ | |||||||||
| 字詞取碼不一致 | - | - | ✓ | - | - | ||||||||||||
| 繁簡字和生僻字處理 | |||||||||||||||||
| 繁簡字根刻意同鍵 | ✓ | ✓ | |||||||||||||||
| 繁簡字根刻意分離 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
| 繁簡字根自然分離 | ✓ | ✓ | ✓ | ✓ | |||||||||||||
| 官方提供GB2312碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| 官方提供至CJK碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
| 官方提供至擴B區碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||||||||||
| 官方提供至擴I區碼表 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |||||||||||
| 超集字延用常用字字根 | - | - | - | - | - | - | ✓ | - | - | ✓ | ✓ | ✓ | ✓ | - | ✓ | ✓ | |
| 爲超集字設置額外字根 | ✓ |
關係表
這裏展示的是輸入法之間的相似指數,使用了(未加權)餘弦相似度。
表格按輸入法發佈時間排序,可以更加有效地看出新輸入法借鑒老輸入法的情況。每行的最大值,基本和縴夫張會製的中文輸入法樹狀關係圖中顯示的繼承關係一致。
注意,由於特性未加權,故而只能反映輸入法之間的相對關係,真實情況會因使用者的主觀偏好而産生差異。
| 輸入法名稱 | 四角 | 倉頡 | 王碼 | 表形 | 鄭碼 | 山人 | 徐碼 | 真碼 | 藍2 | 矧碼 | 虎碼 | 宇光 | 宇星 | 雲碼 | 藍3 | 天碼 | 卿雲 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 四角號碼 | - | ||||||||||||||||
| 倉頡 | 75% | - | |||||||||||||||
| 王碼五筆 | 38% | 42% | - | ||||||||||||||
| 表形碼 | 52% | 57% | 60% | - | |||||||||||||
| 鄭碼 | 17% | 13% | 27% | 39% | - | ||||||||||||
| 山人全息 | 9% | 22% | 17% | 34% | 23% | - | |||||||||||
| 徐碼 | 9% | 4% | 30% | 34% | 62% | 31% | - | ||||||||||
| 真碼 | 32% | 27% | 40% | 23% | 61% | 14% | 41% | - | |||||||||
| 藍寶石2 | 33% | 38% | 73% | 51% | 10% | 21% | 22% | 19% | - | ||||||||
| 矧碼 | 30% | 43% | 43% | 63% | 32% | 38% | 33% | 25% | 51% | - | |||||||
| 虎碼 | 13% | 17% | 30% | 43% | 21% | 46% | 33% | 17% | 47% | 48% | - | ||||||
| 宇浩光華 | 13% | 17% | 55% | 34% | 32% | 8% | 56% | 49% | 39% | 41% | 41% | - | |||||
| 宇浩星陳 | 22% | 17% | 34% | 39% | 36% | 27% | 67% | 37% | 43% | 44% | 59% | 74% | - | ||||
| 雲碼 | 9% | 13% | 30% | 43% | 32% | 23% | 56% | 25% | 47% | 56% | 63% | 70% | 81% | - | |||
| 藍寶石3 | 33% | 38% | 60% | 56% | 14% | 21% | 10% | 19% | 78% | 47% | 43% | 26% | 30% | 34% | - | ||
| 天碼 | 17% | 22% | 30% | 59% | 36% | 27% | 52% | 29% | 30% | 37% | 59% | 59% | 78% | 74% | 26% | - | |
| 卿雲 | 13% | 17% | 34% | 39% | 28% | 27% | 59% | 29% | 51% | 44% | 67% | 74% | 93% | 89% | 39% | 78% | - |
