字根组字

2022-06-20 17:57:44.0

分類: 字体技术

「字根组字」为开发的方式之一,顾名思义,即以「字根」为汉字的做小单位,设计出该款字体所需使用的「字根」后,在造字工具中将字根组合成汉字字符,这通称「字根组字」字型开发方式。



字根组字技术业界称为Radical-base,透过此技术开发出来的TrueType字型产品全名称做Radical-base TrueType,简称RTT,透过字根可以重复使用的特性,来大幅降低字型的档案大小,此种方式使用在简体中文具有27,533个大量汉字的GB18030字符集最具有效益,以下使用黑体、楷体为例,说明笔画组字技术与字根组字技术两者在字型档案量大小的差异:

  笔画组字 字根組字
黑体 7 MB 2.5 MB
楷体 18 MB 2.5 MB

注:黑体为文鼎UD晶熙黑体G30,楷体为文鼎楷体G30 /文鼎晶栩楷体G30

有别于笔画组字的字型产品,为何笔画组字技术与字根组字技术两者在字型档案量的大小上有如此大的差异呢?除了利用字根可共享、重复使用的特性外,在字型质量上也可以定义,以常用字的字符,开发质量达到近似于笔画组字高质量的水平,罕用字(大部分使用者一辈子几乎不会用到的字符)使用现有字根,不特别增加字根的方式来组成,虽然定义上质量稍差,但不影响辨别与使用。

近年,以文鼎字型与Dalton Maag承制的企业订制字体案件中,如为HP订制的HP Simplified、为Intel订制的Intel Clear客户就希望字型档案兼容嵌入式系统(embedded system)环境使用的低档案量以及印刷的高质量需求,透过内部技术评估后,即以字根组字方式开发多字重的字型档案交付客户使用。

除了字型档案量的大小外,一般使用者并不容易辨视字根组字的字型产品,目前,一般的使用者使用到透过字根组字技术所开发的产品的机会并不高,主要的原因在于此机制早期是针对嵌入式环境所设计的字体开发方式,现阶段的硬件环境相对于10年前成熟,硬件中的记忆空间容许容纳档案量较大的字型,因此,厂商们开发出来的字型档案都会是以通用的TrueType/OpenType字型为主。


Font Technology

文鼎UD晶熙黑體 TTC格式產品說明

TrueType Collections (TTC)允許將多個性質相近的字型合併為一個檔案,其目的是為了節省字型檔的資料量。以繁體中 文UD晶熙黑為例,針對43個常用全角符號做調和(Proporitional)設計,分別放在兩個不同的字體名稱上,使用者可以依 自己的喜好及需求,選擇常規的全角符號字型或是有標示P的常用全角符號調和設計產品。這兩套不同名稱的字體可以 合併成TTC,漢字和部分符號可共用,只要增加39個調和符號的資料量。合併後的TTC字檔和分開成兩個TTF字檔效果一 樣,卻可節省95%以上的資料量。

在我們對設計師的訪談中,我們聽到一個聲音,有設計師認為在進行長文排版時,全角位符號的字寬常常出現一些尷尬 的排版問題,如川流(river)、凸排等,影響著整體的閱讀感受。在理解設計師的困擾後,我們挑選了39個中文常用全角符 號,進行字寬調和(Proporitional)的設計,有此設計特點的產品,在字體名稱上都會多一個「P」,代表Proporitional的代 號。

以文鼎UD晶熙黑體E1HK字體為例,使用者在安裝字體後,在字體選單中會看到「文鼎UD晶熙黑體E1HK」與「文鼎UD晶 熙黑體PE1HK」兩個字體名稱,這是因為文鼎UD晶熙黑體E1HK字體檔案使用了上方描述的TrueType Collections (TTC) 的機制而呈現出來的結果。

 

下圖為文鼎UD晶熙黑體E1HK 產品使用常用全角符號及常用全角符號調和設計的排版示意圖,選用經過符號調和設計 的字體,排版後漢字、符號呈現出較佳的字寬比例,將有助於段落文字訊息閱讀的舒適性。

Font Technology

units per em

字體設計的工程規格中,有個較少被人提及的專有名詞「UPM」,UPM全名為units per em。Em為字體設計上的一個單位,傳統上,em指的是活字印刷鉛字字身的高度;在現今數位字體設計上,EM化身一個虛擬的數位畫布,依字體設計的精細度需要,畫分出一個座標系統網格,這個座標系統大小的設定值最常見的是1000或2048,這個設定值,就稱為units per em,它決定了字體座標網格的粒度大小。


關於UPM數值的設定,基於TrueType和OpenType TT的字體,UPM的設定值通常為2048,而OpenType PS字體UPM的設定值通常為1000,但是也有設為256或512的情況發生,這樣主要是為了達到降低字體檔案的資料量或在特殊情境所需要的設定。

這些UPM設定值的大小除了與字體應用情境搭配外,在字體品質會有差異嗎?

我們以下方的圖例做說明,我們若將這三個圖形視為「點」來看,右方的點是基於UPM 256的設計,而左方的點是以UPM 2048作設計,我們可以看出兩者都有達到一般所認知「點」的概念,但若前提是「圓點」、「正圓」,那麼就一定是左方UPM 2048所設計的圖形才能符合標準。

也就是說,UPM值設定的越高,可以獲得更多包含曲線、造型等的設計細節,反過來說,若我們想要設計一款具備高品質、有細膩曲線描繪的字體產品,在UPM就會需要相對較高的設定值。

以中文字體產品來說,無論是TrueType或OpenType PS的字體,目前大多數的UPM設定都以1000為主,這是一個在產品品質與檔案量大小可以取得平衡的設定。

Font Technology

精巧字數的繁體中文規格 Arphic Big-5 Miniset

在台灣,從使用的角度來看,我們長期觀察做為標題使用的display type後,總結出標題用的display type,使用到Big-5字集所有字的機會不大這樣的結論。

業界在進行繁體中文字體開發時,大多是以Big-5這個規格為標準,當中定義了多達一萬三千多個漢字及六百多個符號字元,因此,每一套新字的推出,都面臨開發期程太長、成本太高的挑戰。以此,在進行字體開發時,是不是可以只需要設計比較常用到的字、剔除較罕用的字,來縮小Big-5字集的規模呢?這樣的好處是可以用較快的時間、較少的成本來,快速的滿足市場上大部分的應用需求,因此文鼎字型訂立Big-5_Miniset這個文鼎自定義產品規格。

下圖是文鼎DC曼蒂手書體由插畫家曼蒂書寫的次常用字區數位字稿,文鼎字型與外部的書法家、設計師合作開發DC系列產品時,常常收到的回饋是:怎麼要寫那麼多字啊!這些字我都沒有看過噎!真的有人用到這些字嗎!確實,除了前述降低產品開發的成本考量外,不要為難設計師、浪費設計師的時間,回歸到讓設計師專注在常用字上,以相對較快、較高的品質設計出新的字型產品是文鼎字型訂立Big-5_Miniset的初衷。

繁體中文Big-5_Miniset這個規格收錄了7,374個中文漢字,當中包含了常用國字標準字體表、字頻總表等生活中常見的字、詞、詞頻,由此構成Big-5_Miniset這個精選字數。從產品名稱上如何辨識Big-5 Miniset規格的字體呢?以文鼎新上架的文鼎濃湯體為例,文鼎濃湯體是一款帶有濃厚寬度厚實感、滑順粗細交錯線條的產品,定位在display type標題字上的使用,從下圖來看,使用Big-5 Miniset規格開發的產品,在字體名稱會加入「Min」這個代碼做表示來與標準的Big-5字集規格的產品做區隔。

雖然是以精選小字集7,374個漢字的規格來開發產品,但在完整字體的開發策略上,仍保有擴充到完整Big-5的規劃與機制,文鼎濃湯體是文鼎字型第一款以Big-5_Miniset規格釋出的產品,歡迎設計師們在使用後給我們回饋與指教,如果想要了解Big-5_Miniset包含了哪些中文漢字,請點選下方圖像連結下載文鼎Big-5_Miniset字碼本。