古籍通规繁体标准
介绍
中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021)中提及:
本文件适用于1911年以前历代传世古籍的印刷与出版,也适用于现代书刊的繁体版印刷。
故而本项目以《古籍印刷通用字规范字形表》和《辞源》采字为标准,定名古籍通规繁体标准,基于 OpenCC 项目 制作繁简转换对应表,适用于 OpenCC 引擎,配置名为 s2g.json。
同时,注意到本标准中规定的字形和 CJK 中 G 源(大陆提供字形)存在差异。在使用大陆字体时,会出现部分部首不一致的现象,如吳誤
碌彔
。因此,《古籍》字形的使用需要配合特殊字体。遗憾的是,此类字体未有问世。因此上,我基于《古籍印刷通用字规范字形表》和《通用规范汉字表》,以古籍为主,以通规为辅,生成调和大陆繁体标准,部首不一致的情况。配置名为 s2c.json。
关于「古籍通规繁体标准」
本标准的出台有利于解决繁体字出版时的标准混乱。无论它是否完美,有一个大陆标准,好过没有标准或多标准混合使用。但本表远非完美,甚至存在不少问题,需要不断修订。
以下逐条讨论,排名不分先后:
- 本表只是定义古籍汉字的字形,并非规定繁简汉字的对应关系。有时多个异体字都在表中,可以自由选择哪一个最为简化字的映射字。例如:
個
、箇
都在表中,并未强制使用個
作为个
的繁体。我们可基于意义分离原则,除箇中
外,都使用個
。 - 本表对部分异写字的字形作出了选择,但大体上同《辞源》选字相同。有讨论中说,本表收
峰
,《辞源》收峯
,两者不一致,我并不同意。理由是在《辞源》中峰
、峯
都有收录字头,且在注文中,也有用峰
不用峯
的情况,例如軍都
、冷泉
、六和塔
、胊山
等词条。同理,见群
、羣
。 - 本表中部分字形或存在不统一,如
卽
左,在鄉
及相关字中作即
左。 - 本表存在收字不全的问题。用本表收录的14250个汉字,竟无法写出本表的名字——《古籍印刷通用字规范字形表》。这是因为不少常用字未被收录。已发现的就有
蹦擼菇窝崗樑僱划剪古叼呆啪嘀嚐岩
等,这一点不影响繁简转换。
以下列出本标准对部分部首或部件字形的选择,排名不分先后:
古籍繁體 | 通規繁體 | 港臺繁體 | 字例 | 備註 |
---|---|---|---|---|
朶 | 朵 | 朵 | ||
殳 | 殳 | 〔勹又〕 | 沒歿 | |
彦 | 彦 | 彥 | 上方不作「文」 | |
産 | 産 | 產 | 文 | |
皀 | 〔即左〕 | 〔即左〕 | 卽旣 | 「鄉」及相關字除外 |
兑 | 兑 | 兌 | ||
内 | 内 | 內 | ||
虚 | 虚 | 虛 | ||
麽 | 麽 | 麼 | ||
册 | 册 | 冊 | 「扁」及相關字除外 | |
匀 | 匀 | 勻 | ||
衮 | 衮 | 袞 | ||
爲 | 爲 | 為 | ||
杀 | 杀 | 𣏂 | 刹弑殺 | 少一「點」 |
户 | 户 | 戶 | 房 | 「所」除外 |
秃 | 秃 | 禿 | 頽 | |
吳 | 吴 | 吳 | 誤娱 |
以下列出本标准对部分单字的选择,排名不分先后:
古籍繁體 | 通規繁體 | 港臺繁體 | 備註 |
---|---|---|---|
廈 | 厦〔廈〕 | 廈 | |
艶 | 艷〔豓豔〕 | 豔 | |
灔 | 灧 | 灩 | |
群 | 群〔羣〕 | 羣 | |
峰 | 峰〔峯〕 | 峯 | |
猫 | 猫〔貓〕 | 貓 | |
虱 | 虱〔蝨〕 | 蝨 | |
謚 | 謚〔諡〕 | 諡 | |
够 | 够〔夠〕 | 夠 | |
别 | 别 | 別 | |
絶 | 絶 | 絕 | |
撑 | 撑〔撐〕 | 撐 | |
囱 | 囱 | 囪 | |
秘 | 秘 | 祕 | |
并 | 并 | 幷 | |
咏 | 咏〔詠〕 | 詠 | |
奬 | 奬 | 獎 | 下爲「大」不是犬 |
盜 | 盗 | 盜 | |
莅 | 莅〔涖蒞〕 | 蒞 | |
耻 | 耻〔恥〕 | 恥 | |
抛 | 抛 | 拋 | 中間是「九」不是「尢」 |
荆 | 荆 | 荊 | |
毁 | 毁 | 毀 | |
駡 | 駡 | 罵 | |
粤 | 粤 | 粵 | |
囱 | 囱 | 囪 | |
丢 | 丢 | 丟 | |
脉 | 脉〔脈䘑衇〕 | 脈 |
以下异体字《古籍通规》兼收,本标准取字如下,排名不分先后:
調和繁體 | 《辭源》慣用字 | 通規繁體 | 其他繁體書籍慣用字 | 原因 |
---|---|---|---|---|
考 | 攷 | 考〔攷〕 | 考 | |
個 | 箇 | 個〔箇〕 | 個 | |
覈 | 核 | 核〔覈〕 | 覈 核 | 分離義象,「審覈」 |
針 | 鍼 | 針〔鍼〕 | 針 | |
註 | 注 >> 註 | 注〔註〕 | 註 | 分離義象 |
抬 | 擡 > 抬 | 抬 | 擡 | |
濕 | 濕 > 溼 | 濕〔溼〕 | 溼 |
关于「调和大陆繁体标准」
「调和大陆繁体标准」大致同「古籍通规繁体标准」,但部分字不依。
以下列出本标准不取古籍字形,而取通规的部首或部件字形,排名不分先后:
調和繁體 | 古籍繁體 | 通規繁體 | 港臺繁體 | 字例 | 備註 |
---|---|---|---|---|---|
朵 | 朶 | 朵〔朶〕 | 朵 | 部分字無獨立碼位 | |
吕 | 呂 | 吕 | 呂 | 侣營閭 | 「營閭」等字無獨立碼位 |
〔即左〕 | 皀 | 〔即左〕 | 〔即左〕 | 卽旣 | 「鄉」不一致 「節」無獨立碼位 |
录 | 彔 | 录 | 彔 | 綠淥剝錄祿 | 「碌箓」等字無獨立碼位 |
吴 | 吳 | 吴 | 吳 | 誤娱 | 「誤」等字無獨立碼位 |
以下列出本标准不取古籍字形,而取通规的单字,排名不分先后:
調和繁體 | 古籍繁體 | 通規繁體 | 港臺繁體 | 備註 |
---|---|---|---|---|
廈 | 厦 | 厦〔廈〕 | 廈 | 《辭源》慣用字 「厂」字頭不一致 |
艷 | 艶 | 艷〔豓豔〕 | 豔 | |
灧 | 灔 | 灧 | 灩 | |
況 | 况 | 况〔況〕 | 況 | 《辭源》慣用字 |
关于简化汉字到传统汉字转换
《古籍印刷通用字规范字形表》只规范字形,不规范用字。这点如《通用规范汉字表》只规范字形,但用字参照《新华字典》或《现代汉语词典》。因此,在繁简转换中,需要有一选取优先字的基准。《辞源》第三版体例中言及:「字头与行文的字形经过整理,一律采用古籍印刷通用字规范字形。」因此,可以将《辞源》中注释文字的实际用字作为取字的参考。
简化汉字到传统汉字的转换,可以大致遵循以下的取字原则:
- 如果两个字在《辞源》注释文字实际用字中分领不同含义,则用字分离。如同取
修理
、肉脩
。 - 异写字,只选取在本表中出现的。如取
説
不取說
,取裏
不取裡
,取峰
不取峯
,取簡
不取𥳑
。 - 异写字,如有两个及以上同时出现在本表中,优先取《通用规范汉字表》中的字形,再取《辞源》注释文字实际用字,如取
秘
不取祕
。 - 本表中不存在的常用字,加入本表。如
古
。 - 本表中不存在的字,如在《辞源》注释文字实际用字中分领不同含义,则依旧进行分离。如同
唸
不在本表中,但在词条開口跳
的注释中,依旧用了唸白
一词。故而加入本表,从而分离意义。