消除繁體中文缺字的困擾

2022-03-15 09:32:07.0

分類: Font Technology

流行音樂創作歌手陶喆,常看到他的名字是用「陶吉吉」的方式顯示,而非直接寫出「喆」,為什麼有一些字型「喆」呈現不出來?必須用兩個吉來表示呢? 

繁體中文最常使用的字體規格為Big5-2003(大五碼),共收錄13,060個漢字。但是,身處數位時代的使用者,文字的使用大多透過輸入法的方式呈現在軟體上,有時候有可能是因為使用者輸入文字時,選字錯誤,積非成是,有時候也有可能是當下標新立異,選型不選字,取「意」不取「義」,透過輸入法輸入、貼文複製,而用到非Big5字集的字元,而造成缺字的情形。

為了降低使用者用字缺字的機率,文鼎字型以現有Big5-2003字集為基礎,參考教育部字頻總表、中研院現代漢語語料庫詞頻統計、網路流行用字以及行銷與客戶服務所累積的資訊,彙整389個漢字,整合成Big5_AR 2021規格。新增收錄於Big5_AR 2021規格的字元,包含塵蟎的「蟎」、擀麵的「擀」、尊稱神明的「祢」、峰的異體字「峯」以及双、堃、宝、峯、崐、彣、喆、雫、邨……。



文鼎字型已著手規劃,挑選經典、熱銷的字型產品逐步更新為Big5_AR 2021規格,目前已經更新至此規格的字型產品有:文鼎書苑宋體、文鼎書苑黑體、文鼎簽字筆體、文鼎DC蔡燊軒行書體; iFontCloud文鼎雲字庫字體租賃服務的客戶,已下載啟用這些字型的使用者,在租賃期間,字檔會透過字庫管理工具自動地做檔案更新,若您是第一次下載啟用,則會直接取得最新字型檔案。未來,文鼎字型所開發的新產品,也會依此規格做產品化。


Font Technology

因編碼造成缺漏字的解決方法_造字碼位

在前一篇文章「字符集:Big5與Unicode的差異」提到,我們在個人電腦上無法打出想要的字元或無法正確顯示字元,大多是因為使用的字型所支援的字符集涵蓋範圍的多寡而造成的缺字情況,這是設計師或一般使用者會遇到的缺字原因;還有一種是在公家機關或是企業的資訊系統中會遇到的缺字情況_因字型編碼相容的問題所造成的缺字。

很多公司企業財會單位使用的報表系統還是封閉型的系統環境,追求的是系統的安全性、正確性與穩定性,每一次系統的更新就需要一筆龐大的費用,因此,若無重大使用上的問題,在預算考量上往往會選擇沿用現有系統,而不耗費預算升級到新系統。在這樣的情況下,使用單位/公司有可能會因為報表系統比較老舊,只能支援Big5字集,以至於開發的系統軟體無法使用Unicode字集字型顯示,造成列印、輸出漏字或亂碼的情況,此時就會需要透過Big5造字碼位來進行造字。

什麼是造字碼位,由於現在的Windows系統內碼是使用Unicode編碼,但如果我們使用的應用軟體無法直接支援Unicode編碼,就必須要將Unicode資料轉換成Big5編碼的資料,在Big5編碼的碼區裡有定義四個區域可以用來存放使用者造字,我們可以把Big5字集不包含的Unicode編碼的字,依照我們的需求將其存放在這四個造字區內。如此一來,就可以像古代倉頡造字那樣,為自己的資訊系統環境添加一些造字,解決在Big5編碼範圍內,電腦環境中無法正確顯示Unicode編碼的字之困擾。

 

不過,因為每個機關所使用到造字的時機與難字不全然相同,所以同樣的造字碼位所存放的難字在A機關與B機關通常是不一樣,因此使用造字碼位所存放的資料是無法直接互相交換,需要透過另一個CNS11643資訊交換碼來串接交換,讓資訊在交換的過程中不會缺漏。

 

造字碼位範圍

可造字數

FA40-FEFE

785

8E40-A0FE

2041

8140-8DFE

2983

C6A1-C8FE

408

總計

6217

 

 

 

 

 

微軟雖有提供造字編輯程式,可以供使用者使用,以編輯點陣圖的方式造字,雖然介面較為簡易上手,但需要以畫格子的方式逐一將字元圖像點畫出來,在美感上不是那麼好看也較費時。

文鼎了解機關企業的造字需求,開發了更為便利的造字管理系統,以解決造字編輯美觀、便利性的問題,如此一來,就可以輕鬆解決缺字的問題。資訊交換的問題,文鼎也可以協助您。

Font Technology

字符集:Big5與Unicode的差異

我們在輸入文字的時候,有時候是不是會遇到字元無法顯示的缺字情形呢?缺字有可能是許多情況造成的,但最常見的情況是缺的這個字,沒有收錄在Big-5字符集裡,這時候,使用支援Unicode 2.0或3.0字符集的字型,大多可以解決缺字的情況。

 

什麼是Big-5

Big-5 又稱為大五碼,是最常使用的繁體中文字符集,共收錄13,060 個漢字,及441 個全角符號。Big-5 普遍使用於台灣、香港與澳門等地區,唯它並非當地的國家標準,只是業界標準,最新版本是Big5-2003。

 

什麼是Unicode

Unicode 是全球通用的字元編碼,收錄了世界上所有國家及地區的文字及符號,在1991 年首次發佈了The Unicode Standard,目前最新的版本為Unicode 13。而繁體中文普遍使用的Unicode 3.0共收錄27,484 個漢字,而2005 年發佈的Unicode 4.1 已收錄超過10萬字。

 

Big-5與Unicode的差異

很多人常常會把兩者相互比較,而到底兩個的差異在哪呢,簡單來說,我們可以用支援字數多、寡來做區隔,用一個比較簡單的方式來比喻,把Unicode想像成裝雞蛋的大籃子,Big-5則是大籃子中的小籃子,而這些字碼則是籃中的雞蛋。前面我們提到,Big5-包含有13,060個漢字,其包含在Unicode的大籃子中,因此,可以解釋成Big-5是Unicode的其中一部分。所以在一般Windows作業系統中常會有打不出來的字,或是出現亂碼,很大的原因是因為Big-5的範圍內沒有支援到Unicode的字,已經做超出小籃子的負荷了。

如果出現這樣的情況,通常選擇使用援Unicode 2.0或3.0字符集的中文字型,大多可以解決缺字的情況。要如何選擇、使用文鼎公司繁體中文有支援Unicode字符集產品呢?最簡易的方式就是在iFontCloud網站字型頁面上輸入「U30」這個關鍵字,就可以看到有支援Unicode 3.0這種大字符集的字型產品,目前共有25個字型檔案可以選擇使用。

 

在產品上,Big-5與Unicode這兩個字符集的產品要如何分別呢?以文鼎UD晶熙黑體為例,在字型名稱上若有看到U30,即表示這個字型產品是支援Unicode 3.0字符集的產品,若沒有看到標示,則為Big-5字符集的產品,如文鼎UD晶熙黑體U30與文鼎UD晶熙黑體U30。

 

Font Technology

微字型

文鼎公司關注到字型產品除了設計上創意的專注外,也考量到應用面用字的需求,如小字號文字閱讀的清晰度、辨識度。

一款字型產品是如何的被決策出來做量產的,首先要評估的是產品會被用在哪裡?決定了使用目的,依情境定義使用字號(font size),有了這些後,才會有後續的設計規格的延伸。回到設計師的字體應用情境,在執行設計案件時,字型對於設計師來說是眾多設計素材之一,但在資訊訊息呈現,字型一定是一個重要的選擇。文鼎公司關注到字型產品除了設計上創意的專注外,也考量到應用面用字的需求,我們看到了字型在設計上被使用在小字號的需要,也看到了閱讀上,小字號文字清晰度、辨識度上的重要性,因此在字體設計與造字工程上進行整合,開發出一系列專屬使用在小字號情境的微字型產品。

在鉛字印刷時代,每個字號鉛字有著固定的物理大小,我們以築地明潮體舉例,可以看到上方的那排是築地明朝初號到六號放大到一致大小的情況,下方是文鼎上海宋實際使用大小的示意圖,透過觀察,用於內文小字的六號字(8pt)與標題大字的二號字(21pt)兩者在筆畫細節處有著設計的差異,以筆尾末端的設計為例,因為二號字呈現的字號較小,因此需要稍微加重筆尾的厚度,使其在顯示時不至於虛掉、灰掉,而用於大字的二號字,是要清楚呈現明體的特徵,因此做較細緻的設計。這是早期鉛字在設計上考量實務用字大小所做的設計因應,但數位字體使用的媒介與情境與以往有很大的不同,特別是向量字可以任意縮放大小的特性,這絕對不是鉛字可以比擬的;然而若是使用在如六號字(8pt)的大小,字體是否還可以清晰地呈現呢?

以文鼎UD晶熙黑體為例,雖然晶熙黑在設計之初,已經考量印刷、螢幕顯示的使用,但因漢字筆畫多、寡的對比情況在極小字的使用情境下,仍然會有糊字影響到視覺效果,以下圖左右兩邊的對照來看,右方的微字型與左邊標準版的晶熙黑體,在閱讀視覺上所形成的跳躍,已經明顯的降低。

微字型產品是如何達到這樣的效果呢?關鍵是設計師將漢字由筆畫多寡由少至多作排序,透過設計師與工程師的合作,筆畫少的字元,不改變筆畫的粗細,筆畫多的字元,依視覺灰度做筆畫粗細漸進的調整,來達到小字顯示時降低糊字的情形,因此,微字型的產品特別適用在3-8P的環境,相對的,若是標題以上的大字號顯示,則建議選用標準版的產品。

下圖是由美可特品牌企劃設計應用文鼎UD晶熙黑體微字型所設計的面膜包裝,我們將重點放在背後的用字上,回到字型選擇應用面的考量,透過畫面,我們可以感受到這些字的使用size是很小的,如何在小字保有清晰的顯示,是這個案件選用微字型產品的要點。

 

目前已經開發完成的微字型產品,造型為經典的黑體與圓體,語言包含繁體中文、簡體中文,其中文鼎UD晶熙黑體微字型產品支援Unicode 3.0 及GB 18030大字集的規格,降低設計師在排版缺字的機率,提升使用感受。繁體中文晶熙黑體微字型也將長體字型納入,排版上有利於有空間限制的版面容納較多的文字資訊。微字型產品的推出獲得了設計師的肯定,未來也會持續開發將新的微字型產品,想要了解詳細文鼎微字型產品的支援情況,歡迎前往文鼎iFontCloud瀏覽。

 

點我前往>文鼎iFontCloud_微字型