本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
日本語解析や意味処理が、何を変えるのだろうか。なぜこの数年「セマンティック」というキーワードを見かけるのだろう。
セマンティック技術、セマンティックWeb、という言葉に馴染みのない方に向けて、少し解説しておく。
セマンティックとはWikipediaによると、「ウェブページの意味を扱うことを可能とする標準やツール群の開発によってWorld Wide Webの利便性を向上させるプロジェクト」ということである。
セマンティック・ウェブ - Wikipedia
正直なところ、少しとっつきにくい解説である。IT用語辞典のほうでは、もう少し具体的に記述されており、「コンピュータが効率よく情報を収集・解釈できるようにする構想。インターネットを単なるデータの集合から知識のデータベースに進化させようという試みがセマンティックWebである」とある。
セマンティックWebとは - IT用語辞典
それでも、馴染みのない方にはわかりにくい表現かもしれない。
ここから少し深堀りしようとすると「メタデータ」「オントロジー」などの言葉も出てくる。
そもそも、これが何の役に立つのかをイメージしにくいのではないだろうか。
インターネットに情報があふれていることは、誰もが理解できることだろうと思う。様々なWebページが存在し、その中には企業が発信した情報もあれば個人が発信する日記のようなものもあり、ECサイトやオークションの情報、SNSの発言、果ては既に消滅したサイトのページを収集するArchive.orgまで、我々が検索により探してくる情報は、どこかのWebサイトやページに記述してあり、つまりはどこかのサーバのデータベースに入った情報ということだ。
それらは、検索すれば見つかる。というより、見つかるかもしれない。なぜなら、検索キーワードのセンス(コツ)が問われるのが現状だからである。
とにかく情報があふれている現状では、効率よく得たい情報を得ることは難しいのではないだろか。
電車で表参道ヒルズから六本木ヒルズに行きたいときに、脳内で「表参道駅から六本木駅」と変換し、どこかしらのサイトの路線検索で調べる場合がほとんどだろう。もしくは、ナビに特化したサービスを利用するか、もしくはあきらめてタクシーに乗るかだ。Google検索にも様々なオプションが用意されていて、「表参道から六本木」で検索すればGoogleトランジットを呼び出せることも知られていることではあるが、「表参道ヒルズから六本木ヒルズ」で検索しても出てこない。
Googleの特殊な検索機能
これは考えてみれば奇妙な話で、検索窓に「表参道ヒルズから六本木ヒルズに電車で行く」などと入力すれば、即座に(検索結果など表示せず)有力な経路情報を出せばいい話である。むしろ検索窓に打ち込むわけでもなく、知りたいことを口にすれば回答が耳に聞こえてきたり目の前の空間に表示されたりしていいわけである。ところが現実はそうならずに「表参道ヒルズから 六本木ヒルズ」と検索すると、その文言自体が含まれているWebページが検索上位にヒットする仕組みになっている。
(続く)
クロスメディア研究会11月拡大ミーティング
セマンティック活用のヒントを学ぶ ~日本におけるセマンティック技術の現在と未来~