本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XML化に取り組む出版社とサポートする印刷会社

電子辞書の急速な普及や小説やコミックの電子配信サービスの急成長など、出版分野におけるWebやデジタルメディア利用が本格化しつつある。印刷物製作と同時にWeb・携帯サイト配信や電子書籍製作を行うには、XML形式でのコンテンツ保管とパブリッシングが有効である。
一部の出版社では、既にコンテンツのXML化に積極的に取り組んでいる。大手印刷会社でも、出版社に対するXMLデータベース化、編集・加工など積極的なサポートをおこなっている。

PAGE2008「出版分野のXML活用」セッションでは、コンテンツのXML化に取り組む出版社の立場、およびそれをサポートする印刷会社の立場から、今後の展開と課題について議論をおこなった。


書籍製造における「XML直しシステム」の開発

凸版印刷株式会社 ソリューション開発部 課長 田原 恭二 氏

凸版印刷は、Adobe InDesignに独自の組版プラグインを搭載したバッチ型自動組版システム(次世代DTPシステム)を開発し、2006年から稼動している。特徴の1つにXML活用によるクロスメディア対応がある。

InDesignドキュメントから、オリジナルスキーマによるXML書き出しをおこなう。
このスキーマは、入力のXMLと同じスキーマである。InDesign上でインタラクティブに修正した最新データを同じフォーマットで取り出すことが出来る。これを、循環型ワークフローと呼んでいる。
この方法により、InDesignの校了データからさまざまなデジタルメディアへの展開、データベースへの書き戻し、ユーザのInDesignデータをXML化、ボーンデジタルからの印刷物製作が可能となる。

しかし、赤字修正は通常のDTPと同様にオペレータが画面で組版データを確認しながらやっており、ボトルネックとなっていた。サイクルの短い週刊誌や月刊誌では、人海戦術での修正が必要となる。
そのために、専用の「XML直しシステム」を開発した。 InDesignドキュメントをXMLに書き出し、これをバラバラにする。100ページあるなら20ページずつにばらし、5人で一斉に修正し、直し終わったらまた1つのドキュメントに戻すという仕組みである。データ修正には、ロココと共同開発した専用のXMLエディタを使用する。
何ページの何段何行を簡単に表示し、修正することができる。修正箇所や修正履歴も、簡単に確認することができる。XMLを意識せずに、直感的な操作がレスポンスよくできる。
この「直しシステム」により、XMLでの修正作業の大幅な効率化を実現した。

図書印刷におけるクロスメディア展開

図書印刷株式会社 デジタルビジネス開発本部 宮本 崇 氏

図書印刷でも、書籍のデータからさまざまな電子媒体・電子辞書などへデータ変換する業務をおこなっている。

見出し項目が5万件、1,000ページ程度の国語辞典から、電子辞書用データを出版社に納める業務があった。
国語辞典の各項目には、品詞情報や活用・用法などが記述されている。また、データ中には特殊な約物や印刷標準字体も含まれている。電子辞書は、コード体系がJIS X 0208となっており、その範囲内の文字しか使えない。そのような問題を解決しながら、自社独自形式のCTSデータからXMLに変換した。
外字は、画像ファイルに外字コードを割り当てて処理するものと、JISの文字に置換えたものもあった。
参照項目のリンクは、XLinkなどの機能は使わず、各項目に内部的なIDを振って参照している。このデータを作成するために、人手を使って対応しているところもあった。

書籍のデータそのものを、アプリケーションにした事例がある。行政省庁の告示を収集したデータがあり、パソコン上でキーワード入力すると、該当する告示を表示するというアプリケーションである。
標準技術を使用して開発負荷を減らそうと、XMLからXSLTを使用してHTMLに変換し、テスト用の画面表示をおこなうようにした。データ作成は、IEを使用して表示確認をおこないながら進行した。アプリケーション開発では、IEのHTMLコンポーネントを組み込んで表示させるという方法をおこなった。

今後の課題として、コンテンツを迅速にWebやさまざまなデジタルメディアに対応させることが求められている。そのためには、コンテンツ部分だけを抽出し、一元管理できる仕組みが必要である。

XML法令自動更新システムの構築

新日本法規出版株式会社 データ管理局 副部長 山田 祐司 氏

新日本法規出版は法律関係の書籍がメインの出版社であり、法令改正や法令にしたがって書籍の内容を更新している。
従来は、官報の記事を読んで手作業で赤字を入れるという作業を社内でしていた。

2001年頃、現在の独立行政法人国立印刷局が官報情報サービスというサイトを立ち上げ、官報のデータをHTMLで表示し、閲覧できるようにした。そのデータを使って法令改正を自動処理できないだろうかと考え、共同印刷に開発を依頼した。

現在、法令自動更新システムとデータベースを構築している。法令の更新データを蓄積し、ある時点で施行される法令の内容を抽出することができる。
社内では、400種類の加除式書籍を扱っている。そのデータを社内のパソコンで担当者が自由に閲覧することができ、XMLデータとして印刷会社に提供している。

今後は、法令データだけでなく告示や通達・通知についても、同様な仕組みやサービス提供を実現したい。また、法令以外の一般書籍のXMLデータ化も実現したい。

印刷会社におけるXMLの取り組み

共同印刷株式会社 中部事業部 システム企画課 課長 藤森 良成 氏

法律の場合、例えば道路交通法の一部を改正する法律というのが出る。1年ほどして、また道路交通法の一部を改正する法律が出る。しかし、法律には公布日と施行日というものがあり、必ずしも、出た順に有効になるとは限らない。
法律そのものが新しい内容に置き換わるのではなく、もともとあった法律を少しずつ変えていくというのが法律の変わり方である。データの持ち方も、法律と同じように一番古い法律を一つ持っていて、どこがどう変わるかというデータを持つべきである。これが、新日本法規出版の法令データベースの基本的な考え方である。

法令自動更新システムを構築する上で留意した点として、以下の3点が挙げられる。
法律データの自動更新をおこなうため、厳密にデータ構造を決める仕組みが必要なため、Valid型をサポートできるデータベースを採用した。
法令情報を検索する場合、データベースの検索方法を使う場合と、印刷物やアウトプットをつくる場合で変えていく必要がある。そのため、DOMとSAXを使い分けている。
ワンソース・マルチユースを出来るだけ実現する。さまざまな媒体への変換には、変換プログラムをその都度作るのではなく、XSLTを使用する。

印刷会社はCTSなどでパンチ入力の経験があり、XMLも得意としている。XMLの変換など、SIベンダーでは対応できない知識や経験がある。
今後は、生保、損保などの規約約款、商品情報や商品コードなど、XMLを使ったさまざまなソリューションを手掛けて行きたい。


最後に、パネラー相互によるディスカッションをおこなった

「今後のコンテンツ管理は、XMLで大丈夫なのか?」
・XMLという規格ではなく、ツリー構造、入れ子構造でデータを管理する考え方は、普遍的であり、直感的に判りやすいため、残っていく。
・メタ情報がついているデータとして、コンテンツを蓄積することは有効であり、XMLは有力である。
・タグはついているがプレーンなテキストでもあり、一番シンプルである。特別なツールが必要ない、既に汎用ツールがあるという面で有用である。

「RDBとXMLデータベースの違い、棲み分けはどうなるか?」
・実際には、RDBを主力として使用している。将来的に可変なデータに対応するには、XMLが有効だろう。
・一長一短があり、答えは出せない。出版印刷関連ではRDBのほうが使用されている。

「本と同時に電子ブックを発売したい、という話が増えている。印刷会社の対応策は?」
・印刷物をつくる工程から派生して、Webや他のメディアをつくるという考え方では無理である。企画の段階で計画しなければならない。

出版分野では、大手印刷が出版社をサポートするために、コンテンツのXML化、XMLから印刷物製作およびWebやデジタルメディア制作を着実に実現していることがうかがえた。現状では出版物の電子化が急速に進展しており、今後もこの方向で進んでいくことが予想される。

(JAGAT 研究調査部 副参事 千葉 弘幸)

(2008年3月)

2008/03/23 00:00:00


公益社団法人日本印刷技術協会