文字コード事情 (2)

おー。citrus すげいです。あるコードページ内の文字集合がどういう要素からできているのか、とか人に説明できるほどの知識と理解がなかったのですが、こういう風に並べられるとだいぶわかってくるような。なるほど…。

ついでに「煕」についても CDRA の表で確認してみたのですが、IBM-932 と IBM-942 では X'E086'⇔U+7199、X'EAA4'⇔U+7155 という対応になっていました。IBM-943 は完全に逆でした。おそらく Sun の JavaIBM の CDRA 変換コード表をそのまま使っているものと思われます。(UCS-2 相手の相互変換に関する限り、CDRA の IBM-932 と IBM-942 の表は完全に一致していました。diff ってもコメント部分しか違いがなかった…*1

それにしても GNU の libiconv はどうしよう…

*1:OS/2 の UCONV では、CDRA 準拠のホンマモン IBM-932 は "IBM-932X" で指定可能(なんか錯綜している…)。"IBM-942" には実体もエイリアスも用意されていない。実は修正パッケージ JR12961 に IBM942 の変換表が含まれているが、アップデータが微妙にバグってて IBM942 の実ファイルが所定の位置にコピーされないのでありました。
(2008-12-10追記)確認したらいろいろ間違っていたWarp V4 だと IBM-942 は IBM-943 にエイリアスされていた(えー)。ついでに Warp V3 最終 fix 版と eCS 1.2 のデモ CD を確認したらこちらは IBM-942 の実体アリ&IBM932X が実体/エイリアス共に存在しない。IBM932X って鬼ッ子すぎね?