デジタル時代になって、データは溜まる一方である。WEBも過去のデータをそのまま持ち続けられる点でも、画期的なものであった。どんなデータでも、また使うことがあるかもしれないと考えて、消さずに置いておく傾向にあるが、まだデータの再利用が盛んになったわけではない。それは過去のデータから意味のあるデータを探すことが困難だからである。
テキストファイルでもデータベースでも、それらだけから十分に意味を引き出すことは困難で、いつ、どこで、誰が、何のために、など5W1H的な情報が必要になる。これらはコンテンツの内側にあるとは限らないで、コンテンツの外側に明示的につけなければならない。このようなデータのためのデータをメタデータという。要するに今まではメタデータを添付する習慣がなかったから、データの活用が難しかったのである。
データにはすべてメタデータをつけて管理するとなると、例え1行しかないテキストでも、その何倍ものメタデータをつける作業が必要になる。それを人手でやることは非現実的だから行われなかったのであるから、データの発生時点で自動・半自動でメタデータも生成できるような環境を作っておかなければならない。
つまり、いつ、どこで、誰が、何のために、何をするのかという、作業の予定自身をコンピュータで管理しておいて、その管理下で作業者がログインして、文章を書くなり、入力するなり、画像をアップロードするような、グループウェア的ワークフローツールが存在することがメタデータ管理の前提となる。
はっきりとした目的や予定がある企業内のシステムは、このような管理方式はなじみ易いだろうが、小人数で自由に作業しているようなSOHO的なところでは、「先ず管理ありき」の方法は取り入れられ難いようだ。電子出版分野でも新聞や学術ジャーナルはSGML・XML対応がみられるが、娯楽誌や書籍の世界はなかなかコンテンツの使いまわしが機敏にいかないのはこのような理由もあるだろう。
コンテンツの使いまわしによって出版商品が増やせるのかと考える人もいるかもしれないが、辞書がインターネットで広告モデルのビジネスに変身したように、メタデータの活用は全く新しい用途を切り開いていくものであるだろう。電子出版に相当の野心がないと、デジタル化の次ステップには行けないのではないだろうか。
■出典:通信&メディア研究会 会報「VEHICLE」160号(巻頭言)
2002/07/22 00:00:00