Webは既に存在していたものだと考えている人は多い。しかし,Webは少しずつ作り上げられていった技術である。Semantic Webは、現在まだ完成していない技術である。
Semantic Webを見たいとか、Semantic Webはどこにあるのか、Semantic Webはどのくらい大きいのか、Semantic Webのページが何枚あるかとかいう質問もあろうが、そういう議論はまだ早過ぎる。
流行っているからSemantic Webを利用してみようと考えている人が多いと思うが、現時点ではSemantic Webについてはテクノロジーを中心に考えたほうがいい。技術があって、その技術をどういうふうに使えればいいのか、自分なりに試してみたほうが良いだろう。
全てのメタデータを,Semantic WebのRDFに移すよりは、研究と実装を何回か重ね、小さいプロジェクトから応用する。その経験を経て次のステップに行くという方法を個人的には勧めたい。いきなり全部Semantic Webにしようというのは行き過ぎだと思う。
RDF(Resource Description Framework)におけるResourceはWebページや本などであり、DescriptionはそのResourceに対しての説明である。つまり,Resource Descriptionはメタデータそのものである。フレームワークは枠組みなので,RDFはメタデータ用の枠組みと考えていい。
図で,RDFモデルの見方として(1)triples,(2)graph,(3)XML,(4)Notation3という4種類をあらわした。このうち1つでも少しわかれば、Semantic Webへの第一歩ができたと思っていい。この4つには同じ内容が書かれている。
Subjectに記述されているURLは,本日の講演資料のアドレスである。これについて、何かのメタデータを記述したいとする。
これはどういうことか。Predicateに書かれたURLはDoublin Coreバージョン1.1のタイトルのアドレスである。Predicateにタイトルだけを書いても、何のタイトルだかわからない。URLで書くことにより,ダブリンコアのタイトルであることがわかる。Objectには,Metadata and the Semantic Webと書かれている。これは今回発表のタイトルである。つまり,「今日の発表のDublin Coreのタイトルは,Metadata and the Semantic Webである」ということが記述されてある。
graphでは同じ内容を図で表現している。講演資料のURLが楕円で囲まれていて,矢印の上にタイトルがある。「Metadata and the Semantic Web」が四角い枠で囲まれている。表で見ると1個1個並んでいるが、図で見るとそれぞれのつながりが表現されるので,全体の関係がよくわかる。
XML representationはRDFをXMLに変換した記述である。主にデータ交換用に使うことができる。あまり読みやすくはない。Name Spaceを利用する。
XMLは標準化されているが、それとは別にNotation 3と呼ばれるものがある。Notation 3はTimBerners-Leeが自分用に開発した、大変コンパクトな記述方法で,標準化はされていない。文章をそのままで書いて,途中に何も無駄なものが入らない。最初にDublin Coreのprefixを定義したら,この発表のDublin CoreのタイトルはMetadata and the Semantic Webであるということを簡単に記述する。Notation 3は場合によっては結構読みやすい。
なぜメタデータにSemantic Webの技術を使うのか。Webページにメタデータを付ける時,Semantic Webは非常に適している。第1の理由は,URIを使っているので、関連づけることができる。第2の理由は、rdfschemaやOntologyの記述により、メタデータのスキーマにおいて、属性などの記述ができる。他のメタデータとどのような関係があるのかということも記述できる。これにより,様々な種類のメタデータを組み合わせて使えることが期待できる。
Semantic Webにおける標準化を進める理由として,データを交換する場合には,標準が欠かせないということがあげられる。現在データを交換する必要がなくても,将来的には交換する可能性もある。オープンな標準を採用しておいたほうが、長期的に見ると有利である。メタデータも普通のデータ同様に,データを作る費用は高いが、それを交換や公開するのは安いので、積極的に行ってほしい。
■W3C http://www.w3.org/
■関連セミナー 「コンテンツ高度利用のためのメタデータ」2002/05/30 00:00:00