字根的内在属性
上面我们提到了宇浩输入法拆字规则的优先级。其实,在「字根最少」之上,还有一个隐藏的原则,也就是:字根的内在属性。
何为字根的内在属性?其实就是指某一个字根区别于另一个字根的内在特点。
例
吉
拆成士口
而不是土口
,周
拆成⺆土口
而不是⺆士口
,这是因为土
的下面一笔更长,而士
的下面一笔更短。这是区别两个字根的本质原因和内在属性。
「内在属性」可以解释为什么有些字这样拆而不是那样拆,有些字为什么看上去违反了「字根最少」的原则。
例
敝
拆为丷巾八攵
而非氺巾攵
,这看似违反了「字根最少」原则,但其实没有。注意到,敝
字左下的笔画是撇不是提;在氺
中,左下角的笔画是提不是撇。故而,敝
字里并不存在氺
字根。正因为如此,我们取四根丷巾八攵
而非三根氺巾攵
。
在这个章节,我们就详细讨论字根的内在属性,讨论某些字根在宇浩拆分中被分离或者被合并的原因,从而让某些字的拆分原因更加明确。
日曰之辨
不少输入法对与日
曰
两字的区分,比较复杂。大概有两种情况:
- 有些是基于形状的,凡是长大于高的都为
曰
,凡是长短于高的都为日
。但这个方法会跟随着字体的不同而不同,有时候不合字源,也不统一。例如:書
字源于聿者
,曹
古字为东东口
。 - 另外一种区分方法是基于字源。也就是说:凡是在古文中作
口
形,之后隶变为曰
形或甘
形的字,都作曰
。但这个方法对方一般的使用者难度太大,且分析字源会有疏漏之处,不应用于输入法。
我们必须注意到,在汉字中,存在日曰
对立的字形,只有三组,分别为:日曰
、汨汩
、曶㫚
。在其他的情况下,不存在对立,也就不存在混淆问题。
因此,我基于实用主义原则,对这两个字根不多加以区分,而采取更简单的方法。即:除了上述三组对立情况外,全部取日
根。换句话说,曰
根只需要在对立情况下才会使用,即:曰
汩
㫚
三个字。
这样一来,可以显著降低使用者的记忆和学习负担。
勹之辨
旬
的外框勹
,同敖
左下的勹
都是撇加横折钩。宇浩输入法不做区分。
点之辨
这里对含点字根的识别和归并作出解释。
含点字根
- 单点
丶
和捺乀
视为同一个字根。 - 相重叠的两点,即
头
冬
中的部分,和二
同码位。 - 左对点
冫
和右对点飞右
,和二
同码位。 - 下对点
八
为一个字根。 - 上对点
丷
䒑
リ
同大码。 - 左
⺦
为一个字根。 - 左三点
氵
都在一个大码。 - 上三点
ッ𠁼
都在一个大码。 - 所有四点
灬
都在一个大码。
为
卵
等字的两点和冬
下的两点不同,非连续笔画,且被半包围或全包围分割,故而不认定为「两点」。详「散件不分隔」禁手。
人八入之辨
人
八
入
三字易混,这里做出区分。
左撇右捺
凡左撇不低于右捺,视作
人
根。凡左撇低于右捺,视作
入
根。凡左撇右捺分离,视作
八
根。凡左撇右捺的中间被其他笔画隔开,视作
<丿乀>
根。宇码中,它和八
同大小码。
口中无整画
口(音kǒu
),囗(音wéi
)。这两个根如何区分?
答案是,如果方框里有完整的笔画,用囗
wéi
。否则一律用口
kǒu
。
例
国
字中,有完整的笔画,故而必须用囗
wéi
。 中
字中,虽然⼁
穿口
而过,但并未被完全包含在口
中。由于口
中没有完整的笔画,故而用口
kǒu
。
此规定也适用于另外几个包含口
的字根。
例
古
下的口
中如果包含完整的笔画,应该拆如十囗
。例如:鄙
左下方的口
中有口
,故而应该拆成口十囗口阝
。✅ ❌合
下的口
中如果包含完整的笔画,应该拆如人一囗
。例如:會
中间的口
中有小
,故而应该拆成人一日。✅ ❌