易碼
簡介
易碼是一個三碼定長、純字形、簡體專精、出簡不出全的輸入方案。本頁面討論本輸入方案,部分定義不同於官網,算是從另一個角度來探討。
規則
易碼共約 400 字根,歸類後約 250,在 26 鍵上亂序排布。
每個字根又有兩個固定屬性:
- 字根前兩筆。固定由一個字母代替。
- 字根末筆。固定由一個字母代替。
因此,字根可以認定爲單編或者三編:
- 單編碼 + 規則補碼。
- 或,直接認定爲三編碼:第一小碼爲字根前兩筆對應的字母,第二小碼爲字根末筆對應的字母。
以上兩者等價。
理解爲單編
假設我們理解易碼是單編+規則補碼,則規則爲:
- 依次取首、次、末根
- 不足三碼補末根前兩筆對應編碼
- 不足三碼補末根末筆對應編碼
理解爲三編
假設我們理解易碼爲三編。單字拆分成若干字根後,最多取三根。假設首次末編碼爲 A B Z,由設末根前兩筆對應字母爲 x,末根最後一筆對應字母爲 y。則單字編碼規則爲:
- 單字根字 Zxy
- 兩字根字 AZx
- 三字根及以上字 ABZ
我們可以進行單行定義:
- 如果是單字根字,則認定首、次根爲空值。
- 如果是雙字根字,則認定次根爲空置。
- 如果是三字根以上字,則認定爲首、次、末根非空值。
則,易碼的編碼規則爲:
ABZxy[:3]
簡碼
易碼全碼爲三碼,未設置一級簡碼(爲了兼容四二頂),因此二簡的設置在正常情況下不具有碼長優勢,它的作用主要是:
- 在四二頂狀態下節省碼長。
- 避重。因爲全碼狀態下重碼較多,因此在優化的時候,就對簡碼設置進行了優化。部分高頻字出簡,同時全碼後置,讓出三碼碼位給次頻字。
易碼未設置一級簡碼(爲了兼容四二頂),同時設置了676個二級簡碼。不是所有的二級簡碼都是避重簡碼。觀察到,字頻前3000的漢字,佔了日常使用頻率的 99.18%。因此,對於新手來説,我們只需要記憶「避重簡碼」。
避重問題的起源是:部分高頻二簡字 A 的全碼對應了另外一個次高頻字 B。在打全碼的狀態下,A 因爲後置,反而需要選重。因此,爲了流暢輸入,必須要對 A 的簡碼進行記憶。舉例:
「這」、「近」兩個字的全碼都是 oap,我們對「這」設置二級簡碼 oa,則全碼的排序爲 「近」「這」。如果想打「這」卻打了全碼 oap,我們反而要選重。
那麽,哪部分簡碼尤其需要注意呢?也就是滿足以下三個條件:
- 該全碼位設置了簡碼。
- 該全碼位讓簡碼字後,首選是前3000的漢字。
這樣的避重二簡字一共是 125 個,其二簡矩陣見文末。
排序
這裡給出一個碼表排序的思路:
- 二級簡碼字,及其簡碼
- 125 個避重二簡字對應的全碼次選字,及其全碼
- 125 個避重二級簡碼字,及其全碼(出簡的字全碼後置)
- 剩下的漢字按字頻排序
注意到,不是所有的二簡字都是在碼表中默認全碼後置的。原因在於這部分二簡字對應的全碼字字頻太低,記憶二簡的耗費太大,可以交給時間。到以後,等用戶對於二簡字都熟悉了,可以交由輸入平臺的全碼後置功能實現後置。
二簡矩陣
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
a | 五 | 及 | 帮 | 负 | 踪 | 费 | 习 | |||||||||||||||||||
b | 菲 | 穿 | 警 | 区 | ||||||||||||||||||||||
c | 堆 | 士 | 城 | 去 | 赤 | 增 | 境 | 墙 | 怎 | |||||||||||||||||
d | 确 | 外 | 被 | |||||||||||||||||||||||
e | 重 | 国 | 乎 | 集 | 回 | |||||||||||||||||||||
f | 开 | 先 | 正 | |||||||||||||||||||||||
g | 录 | 余 | ||||||||||||||||||||||||
h | 难 | 双 | 教 | 又 | ||||||||||||||||||||||
i | 还 | 普 | 道 | 其 | 关 | |||||||||||||||||||||
j | 候 | 他 | 便 | 体 | 什 | |||||||||||||||||||||
k | 过 | 走 | 陆 | 手 | ||||||||||||||||||||||
l | 微 | |||||||||||||||||||||||||
m | 退 | 推 | 操 | 护 | 势 | 即 | 接 | |||||||||||||||||||
n | 利 | 够 | 三 | 觉 | 和 | 副 | ||||||||||||||||||||
o | 这 | 火 | 顶 | 杀 | ||||||||||||||||||||||
p | 检 | 加 | 机 | |||||||||||||||||||||||
q | 原 | 层 | 冰 | 历 | ||||||||||||||||||||||
r | 速 | 旺 | 日 | 衣 | ||||||||||||||||||||||
s | 哎 | 取 | 嘛 | 员 | 鸣 | |||||||||||||||||||||
t | 遍 | 分 | 安 | 意 | ||||||||||||||||||||||
u | 进 | 己 | 少 | 攻 | 太 | 光 | 小 | 辩 | 金 | |||||||||||||||||
v | 说 | 认 | 许 | 闲 | ||||||||||||||||||||||
w | 龙 | 友 | 床 | |||||||||||||||||||||||
x | 虚 | 卫 | 夜 | 内 | 很 | 勒 | 乌 | 衰 | 狱 | 虑 | ||||||||||||||||
y | 女 | 雪 | 男 | 如 | 乱 | |||||||||||||||||||||
z | 情 | 母 | 慢 | 莫 | 草 |