ブロードバンドの普及により,音声や動画像を含むマルチメディアデータを様々に利用しようという動きが活発化している。コンテンツの量は多様で膨大なため,生成・流通・消費を効率よく安全に配信することが求められる。そこで,コンテンツの内容を表すメタデータの技術が重要となる。メタデータはコンテンツに対して付与されるデータで,誰がいつ作ったかなど,さまざまな観点からの内容が付与される。
特に映像のようなコンテンツは再生しないと,その中身を知ることができないため,題名や概要など内容を表す情報をつけて利用したほうが効率的である。また,メタデータにより新たなコンテンツの視聴サービスや付加価値の高いサービスを効率的に提供できる。
動画のメタデータは,映像圧縮符号化の標準化を推進するMPEG-7で検討されるようになった。さらにコンテンツの制作や配送,商取引などを通した相互運用を目指したMPEG-21の検討が行われている。MPEG-21では内容記述にくわえ,権利や著作権保護,コンテンツ識別子などコンテンツ流通に必要なメタデータを統合したものとなっている。
視聴者側のサービスをより充実した規格として,TV-Anytimeが検討されている。TV-Anytimeは放送と通信の融合の時代に,好きな番組を好きな時間に好きな所で視聴する,映像のユビキタス化の実現を目指している。TV-Anytimeは視聴履歴,趣向,コンテンツアクセスを実現するCRID(Content Reference Identifier),著作権管理を行うメタデータなどの記述が決められている。ハードウエアの急激な進歩により,近い将来家庭でも大容量の蓄積装置PDR(Personal Digital Recorder)を利用したサーバ型放送が一般的になるだろう。TV-Anytimeはこのような時代に,ユーザ側が映像を編集したり,または視聴者の好みにあわせた広告を配信するなどのサービスが実現できるよう,規格の検討を進めている。
メタデータの課題は付与作業である。メタデータは人手で付与することが多く,コストが大きな問題となる。特に,映像や画像のようなデータは,人間の感性や感覚に頼らないと正確なメタデータを作成できない。このためコンテンツの内容を表現するメタデータについては,効率的で正確な作成技術の普及が求められている。最近では人口知能や認識処理などの技術を利用し,精度の高いメタデータを自動的に付与する研究が行われている。
2004年5月に行われたNHK技術研究所の一般公開では,メタデータの自動抽出技術が展示された。画像認識技術を利用し,画面に映った人物を顔の特徴でシーンを分類する。音声認識技術では,アナウンサーの声を解析して,内容からキーワードを抽出する。歓声が盛り上がった場面を抽出してハイライトシーンをメタデータとして収集できる。
ブロードバンド化やコンピュータの性能の向上により,映像はTVだけでなく,今後ますますWebや携帯電話に広がるだろう。制作作業を効率化し,コンテンツに付加価値をつけるためには動画関連のメタデータの動向は目が離せない。
■関連セミナー:
メタデータによる検索,編集,配信の効率化(10月6日開催)
■内容:セマンティックWebが実現する次世代Web,新しいコンテンツ,環境を実現するTV-Anytime,XMPが制作フローに与えるインパクト,素材の有効利用を実現するNewsML,など
2004/09/21 00:00:00