[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-devel:15133] Re: 英訳の校正をお願いできませんか



久保田です。

At Thu, 23 May 2002 08:47:50 +0900,
Tatsuki Sugiura wrote:

> org に持って行くためも兼ねて、 Unicode::Japanese の pod の英訳の修正を
> 引き受けて何とかやってみたのですが。どうにも私では巧く訳せない部分が多い&
> 自分の英語能力のが足らなくて、なかなかまともな訳に出来ずにいます。

おつかれさまです。

> NAME
>     Unicode::Japanese - Japanese Charset Converter

「文字コード」は、「文字セット (符号化文字集合)」と「エンコーディング」
のふたつのレイヤー (見方によると、それ以上) からできています。東アジア
の文字コードにおいてはこの両者は実際に異なるものですので、両者を区別
することが必要です。

たとえば、「文字セット」は JIS X 0201、JIS X 0208 などで、日本語の
「集合」が英語の「set」であることからわかるように、われわれがふだん
使用する文字コードそのものではなく、文字の集合を定めたものです。その
文字集合に含まれる文字には、コードが振られています。

一方、「エンコーディング」は、ひとつまたは複数の「文字セット」を
組み合わせて、われわれが実際に使う文字コードに仕立て上げたものです。
たとえば、EUC-JP、Shift_JIS、CP932、ISO-2022-JP (いわゆる JIS コード)、
などです。

「ひとつまたは複数」と書きましたが、「複数」になるのは東アジアの文字
コードのみです。「ひとつ」の場合には、ふつう、「文字セット」において
個々の文字に振られたコードがそのまま「エンコーディング」になります
ので、「文字セット」と「エンコーディング」は同一になります。

というわけで、この場合の「文字コード」は「エンコーディング」のほうです。
ので、「文字セット」を連想させる「charset」の使用は、避けたほうが
いいです。charset という言葉を避けたほうがいい理由には、「文字コード」
と「エンコーディング」の両方の意味で使われることがあるので混乱を招く、
ということもあります。

「エンコーディング」の英語はそのまま encoding または character
encoding とするのがいいでしょう。「符号化文字集合」は coded
character set です。あいまいに「文字コード」としたいのなら、
character code と直訳するのがいいと思います。


それから、「いわゆる JIS コード」と書きましたが、正しくは ISO-2022-JP
です。「JIS コード」だと、ISO-2022-JP のことか、または JIS X 0208
(あるいは、極端なことを言えば JIS X 0201、JIS X 0212、JIS X 0213、
JIS X 0221) のことか、区別がつきません。もちろん、ISO-2022-JP は
「エンコーディング」、JIS X 02xx は「文字セット」ですので、どの
レイヤーの話をしているのかさえ曖昧になってしまいます。ですので、
日本語では初出は「ISO-2022-JP (いわゆる JIS コード)」、2度目以降は
「ISO-2022-JP」、英語では「ISO-2022-JP (so-called JIS code)」、
2度目以降は「ISO-2022-JP」とするのがいいと思います。


>    * Consider SJIS as MS-CP932. (Shift_JIS on MS-Windows (MS-SJIS/MS-CP932)
>      differ from generic Shift_JIS charset.)

SJIS と CP932 の関係はとても複雑です。CP932 は SJIS の
「すなおな」拡張「のはず」なのですが、Unicode との変換において、
同じ文字が別の Unicode 文字に変換されるということが起こります。
たとえば http://www.debian.or.jp/~kubota/unicode-symbols-map2.html
とかを読んでください。(ただし、これを Unicode::Japanese の
和文や英文に反映させるのは、難しいかもしれません)。

---
久保田智広 Tomohiro KUBOTA <kubota@debian.org>
http://www.debian.or.jp/~kubota/
"Introduction to I18N"  http://www.debian.org/doc/manuals/intro-i18n/