本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

国立公文書館のデジタルアーカイブとその利用

国立公文書館デジタルアーカイブ

アジア歴史資料センターのコンセプトをさらに進めたのが国立公文書館デジタルアーカイブである.5年前にセンターをデザインした時には使えなかったいろいろな技術を組み込んで,最先端の技術で公開している.

国立公文書館デジタルアーカイブの特徴は,国際標準画像フォーマットのJPEG2000を採用したことである.また,検索に関する情報の記述方式は,EAD/XMLである.EAD(Encoded Archival Description)とは,公文書館や図書館の目録記述方法をもとにして作られた機械で可読,検索できるメタデータ方式である.単に公文書館だけの資料を検索するのではなく,他の公文書館や図書館の目録を横断的に検索可能とする通信プロトコルZ39.50も実装している.

デジタルアーカイブは,「デジタルアーカイブ・システム」と「デジタル・ギャラリー」の2つのサービスを提供している.デジタルアーカイブ・システムは,歴史資料を検索して見るサービスである.公文書と図書の違いは,公文書資料は個々の資料が独立して意味を持つのではなく資料がある関連性を持って全体として意味を持ってくる所にある.例えば,一件の文書には,訂正の朱が入った文書から最終的に決済された文書まで含まれている場合がある.さらに個々の文書は,関係ある政策ごとに纏められたり,それらを作成した組織で整理されたりする.ちょうど,コンピュータでファイルやフォルダを管理するツリー(階層)構造を思い浮かべてもらうと分かりやすい.キーワードで検索された資料のみを見るだけでなく,ツリー(階層)構造を展開しながら関連資料にたどり着くことができる.これをシステム的に可能にしたのがEADである.例えば,アーカイブ・システムトップページの右フレーム「資料群階層表示」にある「公文書」を「内閣・総理府」→「太政官・内閣」→「御署名原本」と展開すると資料リストにたどり着く.「御署名原本」とは憲法や法律,天皇の詔書などの原本で,天皇の御名御璽がある.これまではマイクロフィルムでしか見ることができなかった日本国憲法の原本を今ではインターネットで,しかもカラーで見ることができる.

デジタルアーカイブでは公文書館が現在所蔵する資料約230万件の件名目録を公開している.全ての資料が閲覧できるわけではないが閲覧できないものも件名は公開し「要審査」や「非公開」と明示してある.さらに一部では資料のデジタル化も進められている.

デジタル・ギャラリーのほうは,国立公文書館所蔵の重要文化財クラスの国絵図や巻物をインターネットで提供している.画像フォーマットとしてのJPEG2000採用については,一部反対意見も出た.一部業者は国絵図や絵巻物のデジタル化にビジネス機会があると判断し,インターネットで誰でも見られるようになっては困るという意見であった.しかし,データはパブリックドメインでありビジネス利用を妨げるものではない.デジタルデータを元に原寸大の複製や付加価値を付けた提供をすれば良いわけで,むしろビジネス活用の機会は増えたと考えるべきであろう.

現在,全国82地域の国絵図がインターネットに上がっている.現在の広島県をほぼカバーする「安芸の国」を例に取ると,地図自体は3.5m×3.5mの大判で広げても全体を見ることができない.そこで,一度カラー写真に分割して撮影し,個々の写真をデジタル化してつなぎ合わせ,1本のデジタル画像データにしている.データ量は5ギガ程度で,データが重くインターネットでの提供には無理がある.そこでデータ量を画像の劣化が肉眼で確認できない30分の1に圧縮して提供している.それでもコンピュータの画面の全体像では点でしかない厳島神社が画像を拡大することで詳細に見ることができる.

絵巻物には,「桜町殿行幸図」がある.長さ20メートルを超え,これまでのJPEGフォーマットでは画像を一度に見ることはできなかった.JPEG2000では全体をスクロールして見たり部分を拡大したりすることが簡単である.

JPEG2000の技術的な特長は,大量のデータを必要なデータのみ相互通信しながら受け取ることである.配信受信双方のコンピュータの負荷を押さえて大量のデータを提供するwww.の利点を最大限生かした画像フォーマットである.しかし,国や一部の組織でプラグインソフトのダウンロードを管理者以外に認めていないところが増えているため,この特長を活かすことができない場合がある.またファイアウォールの設定によっては相互通信がうまく行かない場合が確認されている.そこでそのような制限に影響を受けないJPEG版も提供している.JPEG版は,JPEG2000と比較すると操作性が落ちるがセキュリティが優先されている現状では避けられない方法である.

国立公文書館が提供するデジタルアーカイブは最先端の技術で歴史的な公文書だけでなく,将来公文書館への移管が想定される電子的に作成された公文書(電子公文書)も提供できるように考えられた本来的な意味でも電子文書館「デジタルアーカイブ」である.

 その1 | その2 | その3

2005年5月26日通信&メディア研究会拡大ミーティング「コンテンツの流通と保護」より

2005/07/21 00:00:00


公益社団法人日本印刷技術協会