[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:15135] Re: 英訳の校正をお願いできませんか



In message [debian-devel:15133], on Fri, 24 May 2002,
Tomohiro KUBOTA <tkubota@xxxxxxxxxxx> wrote:

> 「文字コード」は、「文字セット (符号化文字集合)」と「エンコーディング」
> のふたつのレイヤー (見方によると、それ以上) からできています。

「文字セット(文字集合、character set)」と「符号化文字集合(coded
character set)」は別の意味を持ちます。

(「見方によると、それ以上」というのはそういう意味?)

「符号化文字集合」とは、文字集合と、それぞれの文字とコードが対応
付けられた規則の集合です。

そして、そのコードを対応付ける方法のことを「エンコーディング」と
いいます。

    *

文字集合を定める規格では、通常、それぞれの文字にコードを割り当て
ています。つまり「文字集合」だけでなく「符号化文字集合」も規定し
ています。

しかし、複数の文字集合を組み合わせて用いる場合、それぞれの文字に
コードを対応付けるには、別のエンコーディングが必要になってきます。

たとえばJIS X 0208の附属書2では、規格本体とは別の符号化文字集合と
して、「RFC 1468符号化表現」を規定しています。この符号化文字集合
はISO-2022-JPと呼ばれているものです。

ISO-2022-JPでは、JIS X 0208本体で規定する漢字集合、JIS X 0201のラ
テン文字集合、ISO/IEC 646の国際基準版の文字集合について、シフト状
態に依存したエンコーディング(state-dependent encoding)を用いて、
コードを対応付けています。

なお符号化文字集合のことは、コードセット(codeset)とも呼ばれます。

-- 
木下達也