NewsML - 毎日新聞の取り組み

本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会（JAGAT）サイトをご確認ください。

NewsML - 毎日新聞の取り組み

テキスト&グラフィックス研究会の11月のミーティングは，毎日新聞社総合メディア事業局の小野寺尚希氏をお招きして同社の制作システムやコンテンツ管理についてうかがったが，今回はその中からとくにNewsMLに関するお話をピックアップして報告する。

毎日新聞社のメディアミックス

毎日新聞はMainichi INTERACTIVEと総称するメディア展開を行なっている。これは毎日新聞本紙や小中学生新聞などの新聞，ニュース，毎日インタラクティブメール，モバイルや携帯などwebを含めたオンライン展開，およびエコノミストやサンデー毎日などの週刊誌や出版などさまざまなメディアによるコンテンツの形態である。

毎日新聞社では，このような多メディア展開を前提とした制作フローの構築やコンテンツ管理を行なうにあたって，NewsMLを次世代フォーマットと位置付けて対応を進めている。記者による記事入稿などあらゆるデータについてNewsMLによる素材管理を行い，編集作業を行なって各メディアのコンテンツとして出力する。

NewsML開発の経緯

NewsMLはロイターが自社のコンテンツを多メディア展開するために1998年に開発したものである。ロイターの収益の多くを担う金融情報や企業情報およびニュース情報をどのように扱えばマルチメディア対応できるかと考えて開発したのがNewsMLである。ロイターはこれを標準化すべく，1999年にIPTC（The International Press Telecommunications Council＝国際新聞電気通信評議会）に提案，IPTCはこれを受けて2000年にNewsML ver1.0をリリースした。これはロイターが最初に作ったNewsMLとは異なるものだが，ロイターは2001年中には全面的にIPTCのNewsMLに切り替えるということである。

一方，日本新聞協会（NSK）でもNewsMLが世界的な標準として普及するとみて，2000年にNewsML検討チームを発足させた。2001年2月には共同通信社が次期配信フォーマットとしてNewsMLの採用を決め，2001年8月には日本新聞協会がNSK NewsMLレベル1をリリースした。

毎日新聞社はすでにNewsMLに対応しており，これをコンバージョンするかたちでNSK NewsMLレベル1に準拠してそのソースを公開した。ソースを公開したのは，ソフトウェアやシステムのメーカー／ベンダーがNewsMLに対応するときには必ずサンプルが必要になるはずだが，それにいちいち対応していたのでは手続きにも開発にも時間もかかる。毎日新聞のデータをサンプルとして使ってもらって開発を進めてほしいという意図からである。

NewsMLとは

NewsMLはニュースに構造化の枠組を提供して拡張性や柔軟性を持たせ，ニュースアイテムの内容やニュースアイテム相互の関係の表現をメタデータとしてサポートするものである。もともとニュースの交換のために開発されたフォーマットだが，ニュースの作成・編集・管理・発行のためにも使われる。具体的には，価値情報，属性情報，編成情報，リンク情報，著作権情報，リビジョン情報，ステータス公開禁止情報などニュースに付随するさまざまな情報をメタデータとして扱えるようにタグを用意し，グルーピングして持たせている。また，これはXMLの特徴でもあるが，メディアに依存しないため，いろいろなメディアへの展開が容易である。なお，NewsMLではNewsML DTDが定められており，NewsML文書はこのDTDに従ったものでなければならない。

XMLでは要素の値を規定できないのでXMLスキーマが必要になるが，NewsMLではTopicという仕組みによって，文書内で使用する要素や属性値とその意味などを規定する。実際にはTopicをまとめたTopicSetというファイルが使われ，その中身をボキャブラリと呼ぶ。共通ボキャブラリー群は外部のURLやURNで定めても構わない。

NewsML文書に関する情報をNewsEnvelope，あるいはNewsItemという。これは宅急便の伝票のようなもので，情報を入れる箱のラベルを標準化したものと考えればよい。共通ボキャブラリー群は，この箱の中で使われる用語を標準化したものである。

NewsMLで情報の構造化が標準がされても，文書で使われている文字や値の情報が標準化されていなければ，ほんとうの標準としては使えない。これをうまく実現したのがTopicSetであり，Topicは，NewsMLの「キモ」といってもよい重要な部分である。

NewsMLが標準として普及すれば，プロバイダ・新聞社・通信社などが扱う情報の構造は同じになる。また，そこで使われているボキャブラリーはグローバルでもローカルでも，ボキャブラリー群を置いて参照する。このように構造とボキャブラリーが標準化されることが本当の意味での標準交換フォーマットだと考えられる。

NewsMLによるメリット

NewsMLを使えばニュースの処理も標準化され，新聞社／通信社間のデータのやりとりが可能になる。標準フォーマットだからプログラム処理でもすぐに対応できるし，アプリケーション開発も容易である。メールでもFTPでも受け取れる。そういう意味でニュースの処理が標準化されるわけである。

また，NewsMLによる標準化はニュースの品質管理という意味もあり，これによって，逆にニュースをそのコンテンツにおいて差別化できる可能性がある。つまり，タグを見ればどういうデータが入っているかわかるから，タグを見ただけで内容の優劣がわかってしまうのである。そうなるとコンテンツの質の競争が起き，コンテンツの質が最重要課題になるだろう。さらに，NewsMLを標準フォーマットとして採用して集配信システムに情報を集約するようになればワークフローの再構築も促されることになる。

情報の入れ物としてのフォーマットが標準化されればコンテンツも標準化せざるを得なくなる。はじめは毎日仕様，読売仕様，朝日仕様，共同仕様，・・・という具合で各社それぞれの仕様が出てくるだろうが，いずれ収斂していくのではないか。そのとき各社の自社フォーマットがどういう位置にあるかが問題だが，しかし，それもそんなに大きな差はないはずで，その後は組版ソフトも標準化されていくことになるのではないだろうか。

※　※　※

毎日新聞社では，素材管理はNewsMLで行なうようになったが，webそのものはまだHTML変換を行なっている。いずれはこれもNewsMLでダイレクトに展開しようと考えている。とにかく標準としてのNewsMLの利用を進め，またXMLの利点を生かすよう対応を推進していきたい。

Mainichi INTERACTIVE　http://www.mainichi.co.jp
日本新聞協会，NSK NewsML　http://www.pressnet.or.jp
IPTC　http://www.iptc.org

【関連情報】PAGE2002コンファレンス「XMLトラック」

　　　　　　　PAGE2002セミナー「XML Dayトラック」

（テキスト＆グラフィックス研究会）

2002/01/06 00:00:00

公益社団法人日本印刷技術協会