本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
2010年に開催されたデジタル出版の3省懇談会(通称)において、電子出版における外字・異体字対応の問題が提起された。その後、 解決に向けた第一歩として実態調査事業が行われた。
電子出版における外字・異体字対応は多くの問題点や課題を抱えており、簡単に解決することはできない。2010年に開催されたデジタル出版の3省懇談会(通称)において提起された外字・異体字問題に対し、解決に向けた第一歩として実態調査事業が行われた。
テキスト&グラフィックス研究会では、凸版印刷の田原恭二氏に事業の報告と今後の課題について伺った。
■デジタル出版の外字・異体字調査
紙の本を制作する際、印刷所では文字は無ければ作れば良いという感覚であった。印刷全体でそのコストを吸収するため、問題とはならなかった。ところが、デジタルになると、端末やビューアの制約がある。紙を使わないと、そのコストをどうするのかという問題もある。
平成22年度「デジタル・ネットワーク社会における出版物の外字・異体字利用環境整備」という事業が行われた。出版物の外字・異体字問題の対応策の調査研究である。経産省が公募し、凸版印刷が受託した。
ここでは、印刷・出版業界における外字の現状、今までの外字・異体字問題に対する動き、電子出版の問題点や今後の対応策をまとめる調査分析を行った。
■調査分析の経過
実際の外字・異体字対応として、凸版・大日本印刷の状況と文字集合拡張の取組みを調査した。
凸版印刷では2007年に「漢字出現頻度数調査」を行っている。一般の出版物800冊分、漢字でいうと約5000万文字で漢字の出現頻度を調査した。その結果、AJ1-6(アドビの文字セット)でカバーできない文字数は0.4%、字形は983種類であった。
大日本印刷で製作している岩波書店の「広辞苑」で使用されている文字は、ほとんどがJISの第1~第4水準である。その他にユーザー外字が6.4%、1,200文字である。大日本印刷によると、このユーザー外字は「広辞苑」でしか使われていない字が多いとのことである。
電子取次のモバイルブック・ジェーピーには、電子書籍の外字・異体字対応を聞いた。配信先の環境がシフトJISであれば、それ以外は外字になってしまう。外字やグラフィックは、スマートフォンなど端末によって不自然に表示されることが多く、問題となっていると言う。
符号化文字集合を拡張する動きとしては、「文字鏡」、「インデックスフォント研究会」、「GT明朝(東大)」、「京大のCHISE」、「漢字データベース」、「グリフウィキ」、「IPAの文字情報基盤」などがある。
■外字・異体字の共有基盤構築
使用したい(必要な)文字が従来の符号化文字集合に含まれるものか外字・異体字なのかを判断し、共有の外字異体字を新たに製作するには、まず、例字・属性情報や字形判定基準を公開して、参照できる環境が必要である。
また、最終的にタブレットなどの電子デバイス環境がターゲットとなるため、日本の独自仕様は考えられない。つまり、国際標準であるUnicode環境との整合性を図ることも必要である。
具体的には、AJ1-6(Adobe Japan 1-6)の約23,000文字を基準にした文字の背番号テーブルを構築する。個々の漢字の例字字形、読みや画数などの属性、AJ1-6、UCS、IVS、凸版、大日本、文字鏡、大漢和のコードが含まれる。漢字を特定する情報とそれが使われている文字集合での位置が参照できる。
このテーブルに含まれていない文字で共有すべき文字は、外字異体字として新たに登録する必要がある。つまり、AJ1-6を基準にして、不足する文字を追加していく方法を取る。
AJ1-6は、国内で最も多く使われている文字セットであり、頻度調査でも99.6%をカバーしていることから妥当と判断できる。例字字形(字形サンプル)は128×128のビットマップで字体差とデザイン差が分りやすいように複数並列する。
このような外字・異体字の共有基盤は、将来的に専門の運営組織を設置して運用する必要がある。
■今後の対応
次のステップとして、これらの仕組み・構想が良いかどうか、実証実験を行う。
背番号テーブルは本番で使えるミニマムセットを構築する。入力・検索ツールのプロトタイプ版を作成し、検証を行う。また、背番号テーブルに外字を追加するための運用ルールや運営組織を検討する。