本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
電子出版や電子書籍ビジネスが注目され、国会図書館では有料ネット配信事業を推進することが発表されている。このような動きの中で、著作権が消滅した復刻本の電子化やネット利用の現状、および技術的な解決策について、岸和孝氏に話を伺った。
現在、Web上で公開されているデジタル復刻本(digital replica)は、JPEG、PDF、DjVuなどの形式で表されている。欧米のサイト(アメリカ図書館、生物多様性遺産図書館など)では、版面の画像とテキストが対になったPDF形式やDjVu形式が大半である。一方、国内のサイト(国立国会図書館、東京大学総合研究博物館、京都大学電子図書館など)ではJPEG画像だけのデジタル復刻本が大半である。画像だけのデジタル復刻本では、テキスト検索ができないため、その利用価値は半減している。わが国の公的図書館でデジタル復刻本が画像だけにとどまっているのは、テキスト化予算の少なさと光学的文字認識(OCR)の技術的問題のためであろう。
DjVu関連ツールは、PDFと同様にマルチ・プラットフォーム対応のビューアや作成・編集ツールが揃っている。DjVu形式は圧縮率が高く、PDFに比べて文書の蓄積や伝送の面において優位であるため、欧米の図書館においてPDF形式とともに利用されている。
2006年以降、XMLボキャブラリーについて調査・研究を行う中で、DTPソリューションの一つとしてDjVu形式が存在するが、国内の公的図書館サイトでは画像だけのデジタル化にとどまっていることを知った。そこで国会図書館の画像と「青空文庫」のテキストを組み合わせ、デジタル復刻本のサンプルを制作することで、普及の一助としたいと考えた。
具体的には、一般のユーザーにデジタル復刻本の制作を可能にするための支援ツール「MyDjVu ver0.9」を開発し、2009年2月にJAGATサイトで公開した。MyDjVu 0.9では、Webサイトから取得した画像と、対応するテキストを読み込んで、DjVu形式の文書を自動的に生成するものである。
その後、当該ユーザーだけが閲覧でき、第三者は閲覧できないという仕組みのMyDjVu ver1.0も作成し、公開した。
現在までに数多くのMyDjVuによるデジタル復刻本を作成した。例えば、英日対訳の『種之起原』をMyViewerで閲覧すると、テキストの並行表示が指定されている場合、英文の段落にマウスを近づけるだけで、それに対応する和訳文が重ねて表示される。また、MyViewerでは、表示された目次から関心のあるページへ移動できる。さらに、適当なページを閲覧している際に、指定した文字列をテキスト検索すると、該当する段落の枠が強調表示される。
MyDjVuが、デジタル復刻本出版のビジネスモデルとして成立するかどうかは不明だが、管理サーバによって、読者に対して新刊情報をリアルタイムで提供することもできる。
デジタル復刻本の出版を促進する上で、「青空文庫」のようなボランティアの力は極めて大きい。今後、多くの方々がシナリオ制作に携わることで、わが国のデジタル復刻本が充実していくことに期待したい。筆者としてもシナリオの種類を増やし、さらにMyDjVuの機能を充実させていく予定である。
(「Jagat info」2010年5月号)