GB18030中文編碼字符集

2021-10-27 10:18:46.0

分類: 字體產品與應用

GB18030是中國大陸規範的的漢字編碼字符集標準,GB 18030-2005共收錄漢字70,244個。

目前GB18030有GB18030-2000 及GB18030-2005兩個版本,2000年發佈的GB18030-2000,全名是《信息技術 漢字編碼字符集 基本集的擴充》。GB18030-2000僅規定了常用非漢字符號和27,533個漢字(包括部首、部件等)的編碼,GB18030-2000是一個強制性的標準,市場上銷售的產品用字必須符合其規範。而2005年發佈的GB18030-2005在GB18030-2000的基礎上增加了42,711個漢字和多種中國少數民族文字的編碼,增加的這些內容是推薦性質,無強制規範。

簡要來說,目前若提到GB18030規格的產品,其對應的標準為GB18030-2005,其中27,533個漢字為基本必要的強制規範範圍。

 

什麼時候需要使用到GB18030字集的字體/ GB18030字集的使用範圍

由於GB18030字集的字元數多達兩萬多字,一般來說,在簡體中文的使用情境,基本的GB2312規格已經足夠使用,但在需要顯示中文姓氏、人名、地名等情況時,由於中文漢字的特性,在上述情況可會出現罕用字的使用,這時候就需要使用GB18030字集的字體來做排版,避免出現缺漏字的情況。

2005年11月發佈的GB 18030-2005版本中文編碼字符集,已要求各種電腦作業系統、字型產品、輸入法、應用軟體、及內建嵌入式系統的3C電子、通信設備,如Smart Phone、Tablet、印表機等周邊設備,要支援GB 18030字集。

 

 

中國大陸編碼標準的演進

1980年頒佈了第一個漢字編碼字元集標準,為GB 2312-80《資訊交換用漢字編碼字符集基本集》。此標準總共定義8,836個碼位,收納了6,763個漢字及682個常用符號,總共有7,445個字元。此規格在早期幾乎是唯一的標準,即使到目前為止,在中國大陸也是電腦系統、軟體及各種設備使用最廣泛的中文編碼標準。

1995年中國全國信息技術標準化技術委員會公佈了【漢字內碼擴展規範(GBK)】, GBK(K是"擴展"的漢語拼音第一個字母),總共定義23,940個碼位,收錄了21,003個漢字與884個符號共21,887個字元。

2000年國際標準組織ISO又公佈了ISO 10646-1:2000(Unicode 3.0),主要是增加中日韓統一漢字Extension A的6,582個字元。大陸的GBK規格已無法容納新增的字元,因此GB18030-2000編碼標準就在原來的 GB2312-1980 編碼標準和 GBK 編碼標準的基礎上進行擴充。

 

字型產品與GB 18030的關係

中國政府對中文字型,尤其是簡體中文字型,訂定有國家檢測認證的標準,尤其是最常使用的4種造型字型:宋、仿、楷、黑,要求使用字型於產品顯示的3C通信、資訊、電子等廠商,必須使用政府認證的字型。一般常用的點陣字型(Bitmap Font),如12x12、16x16、32x32、 …等等,都有強制性標準。也就是說要向大陸官方購買取得公司使用授權,再將字型載入嵌入式系統產品上,如手機,電子字典、印表機等,這些產品才能銷售到大陸。

大陸對於向量字型的規範,採取審查核准使用的方式,簡體中文字體的認證,由中國政府的信標委及CESI (中國電子技術標準化研究所)負責,中國政府為避免各家字型公司,所開發的簡體字型品質不一,由中國官方特別指定的認證單位,訂定規範、製作、授權標準,針對在大陸地區使用之簡體字型之完整性、正確性、規範性、風格一致性、結構合理性等進行審核。因此,在中國所有使用於3C通信、資訊、電子等產品上之簡體中文字型,都必需是取得CESI認證的字型。因此對於採用TTF等向量字型的裝置設備,例如智慧手機、平板電腦、DTV/STB…等,就可以使用向量字型來取代需官方授權的點陣字型。

目前為止,文鼎已有11套字型取得CESI認證規範,分別是五套GB18030字集,六套GB2312字集,字型清單如下:

項次

字集

文鼎中文字型

1

GB18030

文鼎報宋二

2

文鼎中楷

3

文鼎晶栩楷體

4

文鼎晶栩

5

文鼎UD晶熙

6

GB2312

文鼎UD晶熙黑

7

文鼎粗黑

8

文鼎書林黑_L

9

文鼎書林黑_M

10

文鼎Mobile中黑

11

文鼎书苑黑体B

 

總結

在中國市場銷售3C電子、通信產品的國內外廠商,都已了解要進入中國市場,無論是軟體產品或硬體產品,必須採用中國政府標準規範的GB18030中文編碼字符集,及使用中國政府認證的中文字型產品才能順利做銷售。文鼎字型可以提供CESI認證的GB18030字型,授權給3C電子、通信廠商,做產品設計、製造及銷售,將字型內嵌於產品中,廠商不但不用擔心符合規範的問題,又可以取得功能上與成本上無可取代的優勢。

 

 
 
 
 
 
 
 
 

 

 


字體產品與應用

iFontCloud實體卡開卡介紹

在” 如何合法取得文鼎字型”中有提到的實體卡,可能會有很多人好奇,甚麼是實體卡,又要去哪裡購買,文鼎雲字庫除了透過iFontCloud網站上購買外,也可以透過經銷商展碁的通路購買文鼎雲字庫實體卡來使用字型。

如果購買實體卡的用戶不太清楚要如何開啟,今天這篇小文章就來帶大家一起透過實體卡,來啟用字型服務方案。

 

Step1實體卡上,將序號刮出會取得一組序號

Step2 開啟瀏覽器連線治 序號啟用網址https://ifontcloud.com/index/arphic_card.jsp

Step3 輸入序號成功後,如果有帳號即可立即登入,如果不是會員可先建立帳號

Step4驗證成功後會跳出輸入授權對像填寫畫面,請填寫完畢送出

Step5完成授權對像填寫後,可下載安裝字庫管理工具

Step6 完成字庫管理工具安裝後,登入帳號密碼

Step7 登入後,可到”訂單資訊”查看您的訂單並點擊啟用,即可完成訂單啟用

Step8 可到”我的字體”在想套用的字型”點擊安裝”即可套用字型

照著以上的步驟,大家是否對實體卡有更進一步的了解,如果在操作上有問題,歡迎大家詢問,文鼎專業的客服團隊,會為您做詳盡的答覆。

 

字體產品與應用

文鼎DC陳森田MORITA

文鼎DC陳森田MORITA是文鼎字型與插畫家_陳森田合作開發的手寫字型,所有字體的內容包含中文、英歐文、符號等,都是陳森田手寫繪製,再由文鼎字型作數位化產品設計,產品同時涵蓋繁體中文、簡體中文。

陳森田MORITA_B體將漢字定距字與調和字整合在一個字型檔案裡,讓,森田手寫字的手感、Q感及溫度可以呈現出來。使用者透過字型選單選擇適合情境的字型做應用。

 

本影片透過Adobe Illustrator來呈現文鼎DC陳森田體的使用方式,演示漢字定距與漢字調合設計排版上視覺的不同。

應用設計

字體產品與應用

字體在Adobe軟體字元面版中的呈現

工欲善其事,必先利其器,在設計師的職涯裡,Adobe軟體的使用一定是佔有一席之地,Adobe在推出Adobe Creative Cloud雲端軟體服務後,設計師們可以透過合理的價格,使用到Creative Cloud 完整應用程式裡20多款軟體,當中最常被使用到的Phothshop、InDesign、illustrator這三款軟體,我們來看看「字體」在這三款軟體的「字元」面版中呈現出哪些雷同與不雷同。

這三款軟體中,若要使用到字體,普遍上都會使用「字元」面版來查找合適風格、語言的字體做使用,但有沒有覺得使用上的體驗好像沒有不一樣,但又好像有哪裡一樣的感受呢?

據我們的觀察,確實,三款軟體對於字體在字元面版內容的呈現有以下些微的不同:

1. 字體語言的排序

2. 字體名稱的呈現

3. 可變式字體(變數字體/Variable Font)的呈現位置

「最近使用的字體」是字元面版下拉出來第一個出現的區塊,如上圖,我們就可以看到上述第二兩點所描述的不同處。InDesign在字體名稱的呈現與其他兩者不同在於繁體中文以外語言的字體,皆以英文字體名稱呈現,也就是說,今天我們若是在繁體中文作業系統使用繁體中文介面的InDesign,若排版文件需要使用到如簡體中文、日文等語言的字體,那我們可能就會辛苦一點,要去判讀此兩個語言的英文字體名稱來做字體的選用,還好Adobe在面版中,預設有字體造型sample的呈現,可以降低從英文字體名稱辨視字體的難度。

在常用字體區塊之後,基本上是依語言做字體順序的排序:

Phothshop:Emoji→繁體中文→拉丁→日文→韓文→複雜語言(Arabic, Hebrew, Devannagri, Thai…)簡體中文

InDesign:繁體中文→簡體中文→拉丁→日文→韓文→複雜語言(Arabic, Hebrew, Devannagri, Thai…) 

Illustrator:Variable Font→繁體中文→拉丁→日文→簡體中文→韓文→複雜語言(Arabic, Hebrew, Devannagri, Thai…) 

我們可以看到上方整理的資訊,Emoji與Variable Font排在語言使用之前,而Illustrator特別將Variable Font獨立出一個區塊,排在「最近使用的字體」之後的第二個順序做呈現,而Phothshop、InDesign則是把Variable Font和語言視為一個整體,混合在一起做排序。

 

這些都是使用上觀察而來的紀錄,而我們在這裡單純討論字體在字元面版上的呈現,UI設計不在探討範圍。