詞語解釋
GB2312,全稱GB2312-80《信息交換用漢字編碼字符集 基本集》,于1980年發(fā)布。該編碼字符集根據(jù)GB 2311《信息技術(shù) 字符代碼結(jié)構(gòu)與擴充技術(shù)》(ISO/IEC 2022)提供的擴充技術(shù),通過對GB 1988《信息技術(shù) 信息交換用ISO七位編碼字符集》(ISO 646,ASCII)所規(guī)定C0控制集和G0圖形字符集進行替換和擴充,形成雙字節(jié)編碼的新的編碼字符集。規(guī)定了6763個漢字和682個非漢字圖形。
按照GB 2311的規(guī)定,圖形字符在8位(或7位)代碼中應具有由1個或多個8位(或7位)位組(字節(jié))構(gòu)成的編碼表示,而由單個位組表示的每個字符所在的編碼圖形字符集應是94字符集(0x21~0x7E或0xA1~0xFE)或96字符集(0x20~0x7F或0xA0~0xFF)。如此,每個字符通過n個位組串列表示的編碼圖形字符集(n>1)應是94n字符集或96n字符集。通過轉(zhuǎn)義字符ESC加上一些參數(shù)構(gòu)成轉(zhuǎn)義序列來指明調(diào)用GB 2312漢字字符集,再通過移位功能調(diào)用GB 2312中的各個94字符集。(在這94個字符集中,每個漢字字符和非漢字字符各占一個字位,這就是"區(qū)位"的由來)。
GB2312規(guī)定的漢字為常用漢字,包括簡化漢字三千余個。由于我國漢字數(shù)量巨大(約10萬字),我國又陸續(xù)增加了六個輔助集。其中,基本集與第二、第四輔助集是簡化漢字集,第一(即GB 12345)、第三、第五輔助集是繁體集,且基本集與第一、第二與第三、第四與第五輔助集分別有簡、繁體字一一對應關(guān)系,(個別簡、繁關(guān)系為一對多的漢字除外)。第七輔助集漢字的來源是GB13000.1的CJK統(tǒng)一漢字部分,為日本、韓國和臺灣地區(qū)使用的漢字。七個字符集包含漢字共計約49,000字(簡化字和繁體字分別編碼)。
掃碼付費即可復制
X