日月输入法单字编码
学习了宇浩系列输入法的拆分规则后,我们可以将任何一个汉字拆成唯一的字根组合。现在,我们讨论如何把字根组合转为单字编码。
取最多四根
在日月输入法中,无论一个字能拆成几个字根,我们只关心其中的四个根,分别是:
- 第一根:首根
- 第二根:二根
- 第三根:三根
- 倒数第一根:末根
这同五笔字型相同,和郑码、徐码不同。如果一个字不满四根,则按首、末、二、三的优先级称呼它们,比如:
木可以拆为木一个字根,故而木是单根字,又称字根字。根可以拆为木艮两个字根,故而木是首根、艮是末根。它没有二、三根。想可以拆为木目心三个字根,故而木是首根、目是二根、心是末根。它没有三根。整可以拆为木口夂正四个字根,故而木是首根、口是次根、夂是三根、正是末根。籍可以拆为𥫗丰八龷日五个字根。我们只关注「首二三末」这四个字根,故而𥫗是首根、丰是次根、八是三根、日是末根。龷这个根我们不管它。
编码规则
接下来我们学习单字的编码规则,也就是如何把字根的编码转变为单字编码。
如果一个字本身就是字根,那么它的单字编码就是字根编码,不言而喻。
例
弋的编码就是对应的字根编码:Ki,其中K是大码、i是韵码。它是零声母,故而没有声码。木的编码就是对应的字根编码:Sme,其中S是大码、m是声码、e是韵码。骨的编码就是对应的字根编码:Jgu,其中J是大码、g是声码、u是韵码。
如果一个字是由多个字根组成的,即多根字,它的编码规则为:
- 取首根大码和声码。
- 取二、三字根的大码。
- 取末根的所有码。
- 最多取五码。
例
认字拆成讠人,只有两根,所以我们取全部根:首根讠、末根人。根据规则,我们取首根的大码 V 和声码(空),然后取末根的所有码 Wo,得到编码VWo。因此,认字的编码是VWo。
好字拆成女子,只有两根,所以我们取全部根:首根女、末根子。根据规则,我们取首根的大码 C 和声码 n,然后取末根的所有码 Lzi,得到编码CnLzi。因此,好字的编码是CnLzi。
但字拆成亻日一,只有三根,所以我们取全部根:首根亻、二根日、末根一。根据规则,我们取首根的大码 W 和声码(空),然后取二根的大码 J,最后取末根的所有码 Fi,得到编码WJFi。因此,但字的编码是WJFi。
算字拆成竹目卄,只有三根,所以我们取全部根:首根竹、二根目、末根廾。根据规则,我们取首根的大码 Y 和声码 s,然后取二根的大码 G,最后取末根的所有码 Mci,得到编码YsGMci。注意到,这超过了五码,而我们只取前五码YsGMc。因此,算字的编码是YsGMc。
织字拆成纟口八,只有三根,所以我们取全部根: 首根纟、二根口、末根八。根据规则,我们取首根的大码 K 和声码 s,然后取二根的大码 D,最后取末根的所有码 Kba,得到编码KsDKba。注意到,这超过了五码, 而我们只取前五码KsDKb。因此,织字的编码是KsDKb。
嫩字拆成女木口夂,分别对应了首根女、二根木、三根口、末根夂。根据规则,我们取首根的大码 C 和声码 n,然后取二根的大码 S,接着取三根的大码 D,最后取末根的所有码 Tpe,得到编码CnSDTpe。注意到,这超过了五码,而我们只取前五码CnSDT。因此,嫩字的编码是CnSDT。
籍字拆成𥫗丰八龷日,超过了四根,我们只取四根:首根𥫗、二根丰、三根八、末根日。根据规则,我们取首根的大码 Y 和声码 s,然后取二根的大码 J,接着取三根的大码 K,最后取末根的所有码 Ji,得到编码YsJKJi。注意到,这超过了五码,而我们只取前五码YsJKJ。因此,籍字的编码是YsJKJ。
你可能注意到了,在日月输入法中,每个汉字的编码不超过5个字母。更具体地,一个字可以是2码、3码、4码、或5码。
空格键的使用
在很多输入法软件中,空格键(以下用_表示)用来上屏没有达到最大长度的候选字。而在日月输入法中,空格键基本是不需要使用的。这归功于日月输入法的无空格输入设计。具体地说:
- 一个字的编码等于 5 时,已经是最大长度,无需按空格键上屏。只要继续输入下一个字的首码,这个字就会自动上屏。我们称之为六码顶屏(请参阅琼林撷英了解相关概念)。例如:我们打「整理」二字,「整」字的编码是
SmDTL。输入SmDTL后,我们直接输入「理」字的首码P,则「整」字会自动上屏。 - 一个字的编码低于 5 时,它一定是以
aoeiu五个字母结尾的。因此上,只要输入法软件见到这五个字母,就知道一个字已经输完,将它上屏。比如「认」字,编码是VWo,输入o的瞬间,「认」字就会自动上屏。
空格键只需在以下情况使用:
- 一个字虽然已经输完,但由于有其它候选,不能自动上屏,且后续没有其他字或标点需要输入,这时候需要按空格键(或数字1)上屏首选。
- 为输入效率考量,日月输入法设置了一些特殊简码,它们的编码不以
aoeiu结尾,这时候需要按空格键(或数字1)上屏首选。当然,这些简码字的使用是可选的,也可以将它们屏蔽。
