宇浩拆分禁手
拆分之「禁手」,指的是无论任何时候都不应当出现一些拆分情形。它高于一切拆分规则。一旦某一个拆分候选中出现了「禁手」,则直接淘汰。禁手包括:散件不分割、竖向不包夹、横间不穿心。
散件不分割
有一部分字根,本身存在离散的部件,比如戈字右上的点、犬字的右上的点、三字的三个横等等。为了保证拆字的直观,保证检字(尤其是大字集下)的便捷性,我们需要对字根的连续性做出要求,并将它认定为字根的内在属性。
字根的连续性定义如下:
非连续写成、且被全包围结构或半包围结构分割的部件,不视为一个字根。
例
为字的两点不可以被视为字根两点,因为它们非连续写成、且被半包围结构分割。
✅ ❌
卵字不拆卯⺀而拆成卯丶丶,因为卯字的两点非连续写成、且被半包围结构分割。
✅ ❌
竖向不包夹
不少字根中存在若干分散的部件。
例
二和三中的横画是分离的。
合分为了人 一 口三个部分。
儿分为了丿 乚两个部分。
这给了它们包夹其他字根的可能。如亘可看成二包夹日。
为了防止拆分不直观,我们做出规定,一个字根可以横向包夹,但不能纵向包夹。
例
卿 = 卯彐厶
✅ ❌
胤 = 儿幺月
✅ ❌
亘 = 一日一
✅ ❌
僵 = 亻一田一田一
✅ ❌
这是因为,汉字的左右对称多于上下对称。左右包夹是可预测的,但上下包夹往往不可预测,必须要观察到最下方。
如果设置了衣字根
某些输入法设置了衣下字根,但亠和𧘇的出现并不总是成对的,必须看到最下方才能正确判断。
横间不穿心
为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定:
工土士干千禾キ王壬龶丰末未生古矢缶早羊虫等字根不允许在一一间穿插其他字根。
这个规定在常用字中比较少用。
例
再不拆王冂,而拆一冂土
✅ ❌
垂不拆壬龷,而拆千龷一
✅ ❌
禹不拆丿虫冂,而拆丿口冂<丄丶>
✅ ❌
妻不拆 キコ女或龶乛女,而拆十彐女。
✅ ❌ ❌
