今日やっつけた本 - 『Unicode標準入門』

2009/11/15

Unicode標準入門 トニー グラハム 翔泳社 2001年

所用で Unicode に少し首を突っ込むことになったので,実装方法を中心にやりなおしています。

やろうとしていることは,それほど厄介なことではなくて,とりあえず文字コードの変換ライブラリを作りましょう,とかいった話。この頃は,日本語も JIS 第四水準までサポートした JIS X 0213:2004(いわゆる JIS2004)が OS レベルでサポートされるようになったこともあって,周辺のアプリケーションもこれに対応する必要がそれなりに出てきました。今から作るなら,JIS X 0213:2004 は Unicode で実装するのが近道なんですけれど,これまでの JIS X 0208 を実装していた符号体系(CP932 とか EUC-JP とか)とも歩調をあわせる必要が出てきたので,ギャップを埋めるライブラリが欲しいね,ということになったのでした。

ここら辺の話,オープンソース界隈では,iconv を使えばいいんですけれど,GPL(LGPL)縛りがあるので,使い勝手がよくありません。できれば自前で欲しいとこ。車輪の再発明と言えばそうなんだけれども。

文字コードを変換する場合,基本は UCS-4 のような文字セットに移してから,任意の文字コードに変換するのが効率的だったりします。iconv の場合はもう少し工夫していて, JIS X 0208 の文字セットを扱う文字コード間で,ひとつの符号にまとめることで(ISO-2022-JP だったかな),変換テーブルのメモリ領域を有効に使っているようです。

いずれにしても,Unicode や UCS といった符号体系は,I18N を考える上で軸(pivot)となる重要な体系というわけ。改めて言うまでもないんですが。

で,本書なんですけれど,Unicode の構造や体系を詳細にわたって紹介したもので,この手の仕事をするにはまず必携の書籍です。有名なので,改めて紹介する必要もないくらい。もっとも,Unicode 規格の説明なので,実装(プログラミング)の話や他の文字コードとの関係についての記載はほとんどありません。あくまでも,Unicode の本です。また,少し情報が古いところがあるので,それは適宜他のリソースで補う必要がありそうです。

ただこの本,監修者の注記がウザったくて参りました(口調変えます)。

監修は、以下のように心がけて行った。

原著者は、批判すべき点は批判しつつも、基本的には Unicode を肯定的に見ているようである。肯定的な議論の多くは納得できるものだが、中には"贔屓の引き倒し"のような議論もあり、私としては納得できない部分もあった。本書は翻訳であるから、そのような場合にも、原著者の意見をそのまま訳しているが、どうしても我慢できなかった部分について、いくつか「監修者注」として反論や私の見解を記入させていただいた。

[2] Unicode標準入門. トニー グラハム. 翔泳社. 2001年. p v.

てめえの著書じゃねぇだろ……。自分の意見はてめえの単著で書け。

この注記,役立つものならそれでもいいんですけれど,本当にしょーもないもんがあって参ります。例えば,次のような注記。

私には、どうしても UTF-7 が"大部分のアプリケーション"がサポートする符号化方式とは思えません。"インターネットでは UTF-8 が一番"は間違いないとして、次に普及しているのは UTF-16 だと思います。とはいえ、原著者も私も、統計データを持っているわけではなく、感覚的なものですが。

[3] Unicode標準入門. トニー グラハム. 翔泳社. 2001年. p210.

「感覚的な」個人的見解を,他人の著書(の訳本)にもぐりこませるこの感覚は,どこから来るのだろう。こんな(少なくともあたしから見る限り)どうでもいいことが「どうしても我慢できなかった部分」なのだろうか。そうだとするなら,監修者は,もう少し我慢を覚えた方がいい。

本書が出版された当初は,まだ Unicode も普及期で,純粋な技術論を説明するのと同時に,政治的な「アピール活動」を行う必要があったのだと思います。しかし,それを差っぴいてもなあ……口出し杉。

監修者の注記については,「あー……また言ってるよ」と思ってやり過ごしつつ,必要なところだけ読み取っていく必要があるんだと思います。やれやれ。

Site Navigation
SNS Accounts (@aian)

普段はここら辺に住んでいます.