宇浩系列输入法
基本特点
宇浩系列输入法,是若干使用同一拆分的输入法的总称,包括光华输入法、星陈输入法、卿云输入法、日月大明输入法。它们都是纯字形的汉字输入方案:通过输入汉字的部首和笔画来输入汉字,而不依赖汉字的具体读音,也就是所谓「会写就会打」「看到即输入」。
这是如何做到的呢?答案是三个步骤:
- 第一步,也是宇浩输入法的核心:将每一个汉字拆成不超过四个部件(字根)。
- 第二步,是将这些部件转换成对应的英文字母。
- 第三步,将编码输入到电脑中,对应的汉字就会自动弹出来。
举个例子,韻
这个字用宇浩输入法怎么输入呢?
- 第一步:将
韻
直观地拆成四个部件:立
日
口
貝
。 - 第二步:找到这四个部件对应的字母,分别是:K J W I。
- 第三步:将这四个字母输入到电脑中,
韻
这个字就会显示出来。
宇浩输入法具有以下的优点:
- 字频加权后的选重率极低,基本上一字一码,码到字出,极其适合盲打。
- 繁简字码位分离,比如
简
簡
不同编码,繁体简体混在一起打也极少选重。 - 字形兼容大陆通规、大陆古籍通规[1]、台湾正体、香港繁体四套标准,方便检字。
- 设有简体、繁体两套词库,字形涵盖两岸三地三套标准 [2]。
- 全面覆盖 CJK 全字集 101984 个汉字(包括至扩展 J 区),生僻字一网打尽。
- 检字方便,翻页少。总共 101984 个汉字,任何编码候选项不超过 18 个。
- 采用大字根、拆法直观,不会将汉字拆得零碎。
- 字根为双编码,不分主副根,没有结构码。
- 拆分时取一、二、三、末字根。全简编码一致、字词编码一致。
- 拆字规范,规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。
- 兼顾手感,大码只使用 25 键。当量、互击率领先时代。
四大特点
繁简通打 动静低重 字根聚类 兼顾手感
宇浩系列输入法对比
宇浩系列的五个输入法,使用完全一致的拆分。但是字根排布、编码方案、输入体验等方面各有不同。
因为编码资源的有限性,每个输入法都有自己的设计目标和取舍。有优点的同时也会有缺点。大家需要根据自己的需求和偏好,选择其中最适合自己的那个输入方案。当然,作者在此有以下推荐:
作者推荐
- 对于第一次接触字形输入法的小伙伴,请务必从星陈输入法入门。这会让你的学习曲线更加平缓,减少挫败感。
- 对于有一定字形输入法基础,并且想要尝试理念更新、更加有趣的输入方案的小伙伴,可以选择日月输入法。这是世上第一款纯形前缀码,可以完全脱离空格键进行输入。
以下是这几个输入法在若干维度下的对比:
特点 | 光华 | 星陈 | 卿云 | 日月 | 吉旦饼 |
---|---|---|---|---|---|
使用最新版本宇浩拆分 | ✅ | ✅ | ✅ | ✅ | ✅ |
支持CJK全集 (包括ext-J) | ✅ | ✅ | ✅ | ✅ | (四码模式下) |
兼容台湾香港字形拆分 | ✅ | ✅ | ✅ | ✅ | ❌ |
繁简通打低极选重率 (<0.2%) | ✅ | ✅ | ✅ | ✅ | (四码模式下) |
字根双编码 | ✅ | ✅ | ✅ | ❌ | ✅ |
字根三编码 | ❌ | ❌ | ❌ | ✅ | ❌ |
定长方案 | ✅ | ✅ | ✅ | ✅ | ✅ |
前缀码方案 | ❌ | ❌ | ❌ | ✅ | ❌ |
顶功方案 | ❌ | ❌ | ❌ | ❌ | ❌ |
完全无空格输入 | ❌ | ❌ | ❌ | ✅ | ❌ |
三码方案 | ❌ | ❌ | ❌ | ❌ | ✅ |
四码方案 | ✅ | ✅ | ✅ | ❌ | (支持四码加 Tab 键输入) |
五码方案 | ❌ | ❌ | ❌ | ✅ | ❌ |
字根字重复小码 | ✅ | ✅ | ❌ | ❌ | ❌ |
两根字回取首根小码 | ✅ | ✅ | ❌ | ❌ | ❌ |
大码使用 Z 键 | ❌ | ❌ | ❌ | ❌ | ❌ |
小码使用 Z 键 | ❌ | ✅ | ✅ | ✅ | ✅ |
相似字形字根同分区聚类 | ✅ | ❌ | ❌ | ❌ | ❌ |
相似字形字根同大码聚类 | ❌ | ✅ | ❌ | (较少) | ❌ |
小码 85% 使用拼音首字母 | ❌ | ✅ | ✅ | ✅ | (频率前50字根乱序,其他音托) |
小码 99% 使用拼音首字母 | ❌ | ❌ | ✅ | ❌ | ❌ |
双手互击率 60% | ❌ | ✅ | ✅ | ✅ | ✅ |
严格优化键位分布 | ❌ | ✅ | ✅ | ✅ | ✅ |
Z 键反查 | ✅ | ✅ | ✅ | ✅ | ❌ |
简体和繁体
绝大多数输入法,简体字和对应的繁体字都占用相同的码位,导致输入繁体时需要选重。比如五笔字型中,簡
简
两个字的编码都是TUJf
。如果我想打繁体的「简」,需要按一下选重键。因此,大多数输入法在繁体文本下,不具备盲打的优势,除非重新对码表进行排序。
宇浩输入法繁简汉字分离,不存在共用码位现象,故而使用一张码表即可既打简又打繁,不用担心选重问题。你可以按照自己掌握每一个字的繁简状态,不需要软件转换,更不需要准备两套码表。可以像写字一样随心所欲。
比如,简
簡
这两个繁简汉字,在宇浩输入法中对应了不同的编码。这是因为宇浩输入法的门
門
字根繁简分离。在很多输入法中,由于繁简字根位于同一个按键,你需要从候选栏中选择繁体字还是简体字。
以下视频展示了使用宇浩单字全码输入繁简混合版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古汉语输入。
聚类和分区
宇浩输入法的核心是对于汉字的拆分,其次是对于字根排布的设计。字根一共有 200 多个,但字母只有 26 个,因此,每个按键上都会有大约 10 个左右的字根。字根如何排布,直接决定了它的学习难度、维护难度、手感、连贯度等等。大体上:
- 对相似字形进行聚类和分区的方案,比乱序排布的方案,学习更加便捷,维护成本更低。比如:「目且貝見」这些都有「目」形的字根,如果安排在一个按键上,那么我们只要记住了其中的一个,就能立刻记住剩下的字根。
- 乱序排布的方案,比对相似字形进行聚类和分区的方案,手感更优。这是因为字根排布的设计中,最大的限制条件就是聚类。解除了这个限制,排布就更加自由,就能在手感上做到更好。
- 三码的方案,比四码的方案,思维负担更小。这是因为四码方案需要取到字的第三根,这个字根往往深入字的中部,思考起来需要更多时间。
- 四码的方案,比三码的方案,重码更低。这一点不言而喻。
每个人都有自己的偏好。为了照顾不同人群的需求。宇浩输入法有两套官方字根排布设计。大家可根据自己的偏好和以前的输入习惯,选择其中一个学习。由于这些设计都基于「宇浩拆分」,因此就算后面想试试其他的设计,也只用几天就能适应。
鸣谢
本输入法的设计制作主要借鉴了三个前辈输入法的优点,在这里向他们的作者表示极大的敬意和感谢。它们包括:
- 郑码的大字根、双编码设计。通过「位码」而非「结构码」来挖掘首根的信息。
- 徐码对于繁简通打的支持,以及小码从拼音字母中选取的特点。使用音托不仅方便记忆,也可以达到更佳的离散。
- 五笔字型字根分区排布、不使用 Z 键的特征。分区排布方便对于字根的记忆,Z 键空出后利于手感,还能用于其他功能,方便各平台通用。
在输入法的制作过程中,不少伙伴提出了大量宝贵的意见和建议,帮助它不断优化进步。特此致以极大的谢意。
- 钱多多为输入法的推广作出大量的努力。还绘制了黑体的字根图、设计了输入法的 Logo 和 Android 上的定制方案。可谓「首席艺术委员」。
- 阿吉始终鼓励作者开发一款新的输入法,他的很多观点和设计哲学同作者不谋而合,也坚定了宇浩输入法讲客观、讲实用的理念。他为输入法的字根规律性和易学性提出了大量建议,使折区字根的排布上了一个台阶。可谓「首席哲学委员」。
- 宋天为输入法的规则的完善提出了大量意见和建议,找出了很多拆分上的不合理之处,尤其是在大字集的拆分上,他的建议至关重要,也使宇浩输入法在常用字集内拆分无二义、规则无矛盾。可谓「首席拆分委员」。
- 王牌饼干不仅设计了非常好用的「宇浩三码顶」方案,还为 RIME 方案编写了优秀的 Lua 代码。可谓「首席技术委员」。
还有不少朋友为输入法的优化提出了宝贵的意见和建议,此处不一一致谢。
有联为证:
汉字十万,岂宇浩独收八九? 字根两百,因诸君而改二三。