テキスト&グラフィックス研究会の11月のミーティングは,毎日新聞社総合メディア事業局の小野寺尚希氏をお招きして同社の制作システムやコンテンツ管理についてうかがったが,今回はその中からとくにNewsMLに関するお話をピックアップして報告する。
毎日新聞社では,このような多メディア展開を前提とした制作フローの構築やコンテンツ管理を行なうにあたって,NewsMLを次世代フォーマットと位置付けて対応を進めている。記者による記事入稿などあらゆるデータについてNewsMLによる素材管理を行い,編集作業を行なって各メディアのコンテンツとして出力する。
一方,日本新聞協会(NSK)でもNewsMLが世界的な標準として普及するとみて,2000年にNewsML検討チームを発足させた。2001年2月には共同通信社が次期配信フォーマットとしてNewsMLの採用を決め,2001年8月には日本新聞協会がNSK NewsMLレベル1をリリースした。
毎日新聞社はすでにNewsMLに対応しており,これをコンバージョンするかたちでNSK NewsMLレベル1に準拠してそのソースを公開した。ソースを公開したのは,ソフトウェアやシステムのメーカー/ベンダーがNewsMLに対応するときには必ずサンプルが必要になるはずだが,それにいちいち対応していたのでは手続きにも開発にも時間もかかる。毎日新聞のデータをサンプルとして使ってもらって開発を進めてほしいという意図からである。
XMLでは要素の値を規定できないのでXMLスキーマが必要になるが,NewsMLではTopicという仕組みによって,文書内で使用する要素や属性値とその意味などを規定する。実際にはTopicをまとめたTopicSetというファイルが使われ,その中身をボキャブラリと呼ぶ。共通ボキャブラリー群は外部のURLやURNで定めても構わない。
NewsML文書に関する情報をNewsEnvelope,あるいはNewsItemという。これは宅急便の伝票のようなもので,情報を入れる箱のラベルを標準化したものと考えればよい。共通ボキャブラリー群は,この箱の中で使われる用語を標準化したものである。
NewsMLで情報の構造化が標準がされても,文書で使われている文字や値の情報が標準化されていなければ,ほんとうの標準としては使えない。これをうまく実現したのがTopicSetであり,Topicは,NewsMLの「キモ」といってもよい重要な部分である。
NewsMLが標準として普及すれば,プロバイダ・新聞社・通信社などが扱う情報の構造は同じになる。また,そこで使われているボキャブラリーはグローバルでもローカルでも,ボキャブラリー群を置いて参照する。このように構造とボキャブラリーが標準化されることが本当の意味での標準交換フォーマットだと考えられる。
また,NewsMLによる標準化はニュースの品質管理という意味もあり,これによって,逆にニュースをそのコンテンツにおいて差別化できる可能性がある。つまり,タグを見ればどういうデータが入っているかわかるから,タグを見ただけで内容の優劣がわかってしまうのである。そうなるとコンテンツの質の競争が起き,コンテンツの質が最重要課題になるだろう。さらに,NewsMLを標準フォーマットとして採用して集配信システムに情報を集約するようになればワークフローの再構築も促されることになる。
情報の入れ物としてのフォーマットが標準化されればコンテンツも標準化せざるを得なくなる。はじめは毎日仕様,読売仕様,朝日仕様,共同仕様,・・・という具合で各社それぞれの仕様が出てくるだろうが,いずれ収斂していくのではないか。そのとき各社の自社フォーマットがどういう位置にあるかが問題だが,しかし,それもそんなに大きな差はないはずで,その後は組版ソフトも標準化されていくことになるのではないだろうか。
毎日新聞社では,素材管理はNewsMLで行なうようになったが,webそのものはまだHTML変換を行なっている。いずれはこれもNewsMLでダイレクトに展開しようと考えている。とにかく標準としてのNewsMLの利用を進め,またXMLの利点を生かすよう対応を推進していきたい。
Mainichi INTERACTIVE http://www.mainichi.co.jp
日本新聞協会,NSK NewsML http://www.pressnet.or.jp
IPTC http://www.iptc.org
【関連情報】PAGE2002コンファレンス「XMLトラック」
(テキスト&グラフィックス研究会)
2002/01/06 00:00:00