ISO 10646の日本用サブセット
2006-05-13


ISO/IEC 10646 (Unicodeの国際規格) を管理しているJTC1/SC2/WG2のサイトに、N3091という文書が置いてあります。"Request For Collection Identifiers For Japanese Subsets of ISO/IEC 10646" というタイトルで、膨大なISO 10646の文字集合から日本でよく使うものをサブセットとして定義しようというものです。

そういうものがあっても良いかなとは思いますが、サブセットの定義にちょっと疑問を覚えます。特に、JIS X 0213に相当する文字集合を漢字と非漢字で分ける必然性がわかりません。

私の考えでは、基本的にJIS X 0213相当の集合があれば良い。これにはJIS X 0201、JIS X 0208の文字が全て含まれます (X0208にはX0201の文字全ては含まれていないことに注意)。ただし、まだX0213に対応していない環境を救済するために、X0208相当のサブセットも用意しておく。

N3091の提案にある、JIS X 0212相当の集合とベンダー外字相当の集合は、必要性を再考した方が良い。特に、名称として「common」や「supplement」といった、あまり特徴のない一般的な語を使うのは、ほかのサブセットと区別がつきにくく混乱の元になる恐れがあるでしょう。

JIS X 0213は既にEUC-JISX0213やShift_JISX0213の符号化方式で運用されているわけですが、このサブセットができればUnicodeの符号化方式しか使えない環境でもJIS X 0213相当の文字レパートリーが使えるようになるかも知れませんね。

[ISO 10646/Unicode]

コメント(全136件)


記事を書く
powered by ASAHIネット