Skip to content

古籍通规繁体标准

知乎文章地址

项目仓库地址

介绍

中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021)中提及:

md
本文件适用于1911年以前历代传世古籍的印刷与出版,也适用于现代书刊的繁体版印刷。

故而本项目以《古籍印刷通用字规范字形表》和《辞源》采字为标准,定名古籍通规繁体标准,基于 OpenCC 项目 制作繁简转换对应表,适用于 OpenCC 引擎,配置名为 s2g.json。

同时,注意到本标准中规定的字形和 CJK 中 G 源(大陆提供字形)存在差异。在使用大陆字体时,会出现部分部首不一致的现象,如吳誤 碌彔。因此,《古籍》字形的使用需要配合特殊字体。遗憾的是,此类字体未有问世。因此上,我基于《古籍印刷通用字规范字形表》和《通用规范汉字表》,以古籍为主,以通规为辅,生成调和大陆繁体标准,部首不一致的情况。配置名为 s2c.json。

关于「古籍通规繁体标准」

本标准的出台有利于解决繁体字出版时的标准混乱。无论它是否完美,有一个大陆标准,好过没有标准或多标准混合使用。但本表远非完美,甚至存在不少问题,需要不断修订。

以下逐条讨论,排名不分先后:

  1. 本表只是定义古籍汉字的字形,并非规定繁简汉字的对应关系。有时多个异体字都在表中,可以自由选择哪一个最为简化字的映射字。例如:都在表中,并未强制使用作为的繁体。我们可基于意义分离原则,除箇中外,都使用
  2. 本表对部分异写字的字形作出了选择,但大体上同《辞源》选字相同。有讨论中说,本表收,《辞源》收,两者不一致,我并不同意。理由是在《辞源》中都有收录字头,且在注文中,也有用不用的情况,例如軍都冷泉六和塔胊山等词条。同理,见
  3. 本表中部分字形或存在不统一,如左,在及相关字中作左。
  4. 本表存在收字不全的问题。用本表收录的14250个汉字,竟无法写出本表的名字——《古籍印刷通用字规范字形表》。这是因为不少常用字未被收录。已发现的就有蹦擼菇窝崗樑僱划剪古叼呆啪嘀嚐岩等,这一点不影响繁简转换。

以下列出本标准对部分部首或部件字形的选择,排名不分先后:

古籍繁體通規繁體港臺繁體字例備註
〔勹又〕沒歿
上方不作「文」
〔即左〕〔即左〕卽旣「鄉」及相關字除外
「扁」及相關字除外
𣏂刹弑殺少一「點」
「所」除外
禿
誤娱

以下列出本标准对部分单字的选择,排名不分先后:

古籍繁體通規繁體港臺繁體備註
厦〔廈〕
艷〔豓豔〕
群〔羣〕
峰〔峯〕
猫〔貓〕
虱〔蝨〕
謚〔諡〕
够〔夠〕
撑〔撐〕
咏〔詠〕
下爲「大」不是犬
莅〔涖蒞〕
耻〔恥〕
中間是「九」不是「尢」
脉〔脈䘑衇〕

以下异体字《古籍通规》兼收,本标准取字如下,排名不分先后:

調和繁體《辭源》慣用字通規繁體其他繁體書籍慣用字原因
考〔攷〕
個〔箇〕
核〔覈〕覈 核分離義象,「審覈」
針〔鍼〕
注 >> 註注〔註〕分離義象
擡 > 抬
濕 > 溼濕〔溼〕

关于「调和大陆繁体标准」

「调和大陆繁体标准」大致同「古籍通规繁体标准」,但部分字不依。

以下列出本标准不取古籍字形,而取通规的部首或部件字形,排名不分先后:

調和繁體古籍繁體通規繁體港臺繁體字例備註
朵〔朶〕部分字無獨立碼位
侣營閭「營閭」等字無獨立碼位
〔即左〕〔即左〕〔即左〕卽旣「鄉」不一致
「節」無獨立碼位
綠淥剝錄祿「碌箓」等字無獨立碼位
誤娱「誤」等字無獨立碼位

以下列出本标准不取古籍字形,而取通规的单字,排名不分先后:

調和繁體古籍繁體通規繁體港臺繁體備註
厦〔廈〕《辭源》慣用字
「厂」字頭不一致
艷〔豓豔〕
况〔況〕《辭源》慣用字

关于简化汉字到传统汉字转换

《古籍印刷通用字规范字形表》只规范字形,不规范用字。这点如《通用规范汉字表》只规范字形,但用字参照《新华字典》或《现代汉语词典》。因此,在繁简转换中,需要有一选取优先字的基准。《辞源》第三版体例中言及:「字头与行文的字形经过整理,一律采用古籍印刷通用字规范字形。」因此,可以将《辞源》中注释文字的实际用字作为取字的参考。

简化汉字到传统汉字的转换,可以大致遵循以下的取字原则:

  • 如果两个字在《辞源》注释文字实际用字中分领不同含义,则用字分离。如同取修理肉脩
  • 异写字,只选取在本表中出现的。如取不取,取不取,取不取,取不取𥳑
  • 异写字,如有两个及以上同时出现在本表中,优先取《通用规范汉字表》中的字形,再取《辞源》注释文字实际用字,如取不取
  • 本表中不存在的常用字,加入本表。如
  • 本表中不存在的字,如在《辞源》注释文字实际用字中分领不同含义,则依旧进行分离。如同不在本表中,但在词条開口跳的注释中,依旧用了唸白一词。故而加入本表,从而分离意义。

宇浩输入法官网