字根組字

2022-06-20 17:57:44.0

分類: Font Technology

「字根組字」為開發的方式之一,顧名思義,即以「字根」為漢字的做小單位,設計出該款字體所需使用的「字根」後,在造字工具中將字根組合成漢字字元,這通稱「字根組字」字型開發方式。



字根組字技術業界稱為Radical-base,透過此技術開發出來的TrueType字型產品全名稱做Radical-base TrueType,簡稱RTT,透過字根可以重複使用的特性,來大幅降低字型的檔案大小,此種方式使用在簡體中文具有27,533個大量漢字的GB18030字符集最具有效益,以下使用黑體、楷體為例,說明筆畫組字技術與字根組字技術兩者在字型檔案量大小的差異:

  筆畫組字 字根組字
黑體 7 MB 2.5 MB
楷體 18 MB 2.5 MB

註:黑體為文鼎UD晶熙黑體G30,楷體為文鼎楷體G30 /文鼎晶栩楷體G30

有別於筆畫組字的字型產品,為何筆畫組字技術與字根組字技術兩者在字型檔案量的大小上有如此大的差異呢?除了利用字根可共用、重複使用的特性外,在字型品質上也可以定義,以常用字的字元,開發品質達到近似於筆畫組字高品質的水準,罕用字(大部分使用者一輩子幾乎不會用到的字元)使用現有字根,不特別增加字根的方式來組成,雖然定義上品質稍差,但不影響辨別與使用。

近年,以文鼎字型與Dalton Maag承製的企業訂製字體案件中,如為HP訂製的HP Simplified、為Intel訂製的Intel Clear客戶就希望字型檔案兼容嵌入式系統(embedded system)環境使用的低檔案量以及印刷的高品質需求,透過內部技術評估後,即以字根組字方式開發多字重的字型檔案交付客戶使用。

除了字型檔案量的大小外,一般使用者並不容易辨視字根組字的字型產品,目前,一般的使用者使用到透過字根組字技術所開發的產品的機會並不高,主要的原因在於此機制早期是針對嵌入式環境所設計的字體開發方式,現階段的硬體環境相對於10年前成熟,硬體中的記憶空間容許容納檔案量較大的字型,因此,廠商們開發出來的字型檔案都會是以通用的TrueType/OpenType字型為主。


Font Technology

因編碼造成缺漏字的解決方法_造字碼位

在前一篇文章「字符集:Big5與Unicode的差異」提到,我們在個人電腦上無法打出想要的字元或無法正確顯示字元,大多是因為使用的字型所支援的字符集涵蓋範圍的多寡而造成的缺字情況,這是設計師或一般使用者會遇到的缺字原因;還有一種是在公家機關或是企業的資訊系統中會遇到的缺字情況_因字型編碼相容的問題所造成的缺字。

很多公司企業財會單位使用的報表系統還是封閉型的系統環境,追求的是系統的安全性、正確性與穩定性,每一次系統的更新就需要一筆龐大的費用,因此,若無重大使用上的問題,在預算考量上往往會選擇沿用現有系統,而不耗費預算升級到新系統。在這樣的情況下,使用單位/公司有可能會因為報表系統比較老舊,只能支援Big5字集,以至於開發的系統軟體無法使用Unicode字集字型顯示,造成列印、輸出漏字或亂碼的情況,此時就會需要透過Big5造字碼位來進行造字。

什麼是造字碼位,由於現在的Windows系統內碼是使用Unicode編碼,但如果我們使用的應用軟體無法直接支援Unicode編碼,就必須要將Unicode資料轉換成Big5編碼的資料,在Big5編碼的碼區裡有定義四個區域可以用來存放使用者造字,我們可以把Big5字集不包含的Unicode編碼的字,依照我們的需求將其存放在這四個造字區內。如此一來,就可以像古代倉頡造字那樣,為自己的資訊系統環境添加一些造字,解決在Big5編碼範圍內,電腦環境中無法正確顯示Unicode編碼的字之困擾。

 

不過,因為每個機關所使用到造字的時機與難字不全然相同,所以同樣的造字碼位所存放的難字在A機關與B機關通常是不一樣,因此使用造字碼位所存放的資料是無法直接互相交換,需要透過另一個CNS11643資訊交換碼來串接交換,讓資訊在交換的過程中不會缺漏。

 

造字碼位範圍

可造字數

FA40-FEFE

785

8E40-A0FE

2041

8140-8DFE

2983

C6A1-C8FE

408

總計

6217

 

 

 

 

 

微軟雖有提供造字編輯程式,可以供使用者使用,以編輯點陣圖的方式造字,雖然介面較為簡易上手,但需要以畫格子的方式逐一將字元圖像點畫出來,在美感上不是那麼好看也較費時。

文鼎了解機關企業的造字需求,開發了更為便利的造字管理系統,以解決造字編輯美觀、便利性的問題,如此一來,就可以輕鬆解決缺字的問題。資訊交換的問題,文鼎也可以協助您。

Font Technology

units per em

字體設計的工程規格中,有個較少被人提及的專有名詞「UPM」,UPM全名為units per em。Em為字體設計上的一個單位,傳統上,em指的是活字印刷鉛字字身的高度;在現今數位字體設計上,EM化身一個虛擬的數位畫布,依字體設計的精細度需要,畫分出一個座標系統網格,這個座標系統大小的設定值最常見的是1000或2048,這個設定值,就稱為units per em,它決定了字體座標網格的粒度大小。


關於UPM數值的設定,基於TrueType和OpenType TT的字體,UPM的設定值通常為2048,而OpenType PS字體UPM的設定值通常為1000,但是也有設為256或512的情況發生,這樣主要是為了達到降低字體檔案的資料量或在特殊情境所需要的設定。

這些UPM設定值的大小除了與字體應用情境搭配外,在字體品質會有差異嗎?

我們以下方的圖例做說明,我們若將這三個圖形視為「點」來看,右方的點是基於UPM 256的設計,而左方的點是以UPM 2048作設計,我們可以看出兩者都有達到一般所認知「點」的概念,但若前提是「圓點」、「正圓」,那麼就一定是左方UPM 2048所設計的圖形才能符合標準。

也就是說,UPM值設定的越高,可以獲得更多包含曲線、造型等的設計細節,反過來說,若我們想要設計一款具備高品質、有細膩曲線描繪的字體產品,在UPM就會需要相對較高的設定值。

以中文字體產品來說,無論是TrueType或OpenType PS的字體,目前大多數的UPM設定都以1000為主,這是一個在產品品質與檔案量大小可以取得平衡的設定。

Font Technology

OpenType 1.9規格支援彩色漸變向量字型

OpenType規格上一次重大的變更是在2016年9月釋出的1.8版本,它加入了可變式字型(Variable Font)的規格,至今5年已有許多可變式字型推出上市,有些訂製字型專案客戶也會要求提供可變式字型,不過台灣的字體廠商只有文鼎有發行可變式字型產品。

2021年12月OpenType 規格再次重磅更新¬釋出1.9版本,其中最主要的是對彩色漸變向量字型的支援(縮寫為COLRv1)。以下為讀者做簡要的介紹:
(1) OpenType色彩定義表(COLR)內的顏色從原本的單一顏色擴充為可以有漸層的變化,以下範例可以很明顯地看出兩個規格版本的色彩差異:

COLRv0:

COLRv1:


(2) 另外,在COLR表的前一版COLRv0雖然也支援可變式字型(variable font),但只是字符外框可變,對於字符定義的顏色是不可以變更的;而COLRv1版本就有支援顏色可變的功能,可以在可變字體中加入調整顏色的變數軸。國外的underware字型設計公司已在2022年初發表了一組顏色可變的字體Plakato Color

由於此新的技術規格才剛發表,一般編輯軟體都尚未支援,截至此文編輯時,已支援COLRv1的應用軟體只有Chrome核心的瀏覽器,預期其他主流的瀏覽器及編輯軟體也會很快的支援這種炫彩的COLRv1彩色漸變向量字型。也可期待市場上會有更多的彩色向量字型,特別是Emoji表情符號,可以讓用戶選擇使用。
 

參考資訊: