本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XMLパブリッシングと高度な日本語組版の実現

印刷物製作と同時にWeb・携帯サイト配信や電子書籍製作を行うには、XML形式でコンテンツ保管を行い、XMLから印刷データやWebデータを生成する方法が効果的である。

例えば、国内ではXML データを一旦DTP組版アプリケーションに読み込み、スタイル情報を付加することで、印刷データを生成する方法が普及している。この方法は、複雑な組版にも柔軟に対応可能である。しかし、実現する機能がアプリケーションに依存すること、XMLデータと組版データという保存データの二重化が避けられないこと、Web用データの生成は別システムとなること、といった問題がある。さらに、アプリケーション依存のため、将来のバージョンアップや対応OSなどの影響を受けることとなる。

一方、CSSやXSLなどのXML標準のスタイルシート技術を利用することで、組版アプリケーションに依存しない印刷データ生成が可能になる。保存データの一元化やWeb用データの同時生成も可能である。しかし、現在のスタイルシート技術は、複雑な日本語組版を考慮されておらず、実用的なレベルではない。
日本語組版に対応したスタイルシートの国際標準を開発することで、アプリケーションに依存しないXMLパブリッシングと高度な日本語組版を実現することが可能となる。

PAGE2007コンファレンス D6セッションでは、このような観点からXMLパブリッシングによってコンテンツの有効利用と高度な日本語組版を実現する取り組みを発表していただき、今後の可能性と課題について議論をおこなった。


凸版印刷の次世代CTSとクロスメディア展開
<InDesignを利用したバッチ処理組版システム>

凸版印刷 情報・出版事業本部 ソリューション開発部 課長 田原 恭二 氏

凸版印刷は1970年代から自社内の書籍・雑誌・辞書製作向けに、コンピュータを使った自動組版システム、CTS(Computerized Typesetting System)を開発・運用してきた。
2000年以降、凸版のCTSは、定期出版物や辞書印刷の縮小などにより減少傾向にあった。その要因として、出版社によるDTPの内製化やコンテンツ再利用を重視する傾向、XMLなどのオープン技術志向があった。レガシーシステムである凸版のCTSは、敬遠されるようになった。
そこで、InDesignやXMLといったオープン技術の枠組み上でCTS技術の自動化コンセプトを実現しコンテンツをクロスメディア展開したいというニーズに応える、として次世代CTSを開発することとなった。

次世代CTSとは、InDesignと凸版CTS技術を合体させたInDesign版CTSである。通常のInDesignでは、画像を配置する際にオペレータが手作業で行間を調整する必要がある。次世代CTSの独自コンポーザでは、そのような場合も自動で配置することができる。
また、プログラムで何らかの条件に適合した時に、組み方を変更する判断組みの機能がある。例えば、テキストボックスの中に、会社名や人名が入りきらない場合、「巻末」という表現に変え、入らない人は巻末に掲載するということをプログラムで判断し、自動的に仕上げる。
これまでの凸版印刷のコンピュータ文字組版ノウハウを、オリジナルコンポーザとして開発し、これをInDesignに組み込むことで、完全自動化ができるようにした。コンポーザとは、組版演算を行うエンジンであり、紙面の中で文字をどこに置くかという座標計算をするプログラムである。

クロスメディア展開のために、InDesignの入力データ・出力データにXML形式を使用している。オリジナルのXMLスキーマを作り、入力と出力で同じ形式のものとなっている。最新の情報がXMLで取り出せ、かつ、取り出したデータを、またInDesignに入力することもできる。これを循環型ワークフローと呼んでいる。

InDesignで本を製作し、そのデータを即座にXMLとして取り出すことができる。例えば、携帯電話やWebなどにも最新の情報を反映することが出来る。また、DTP上で校了になった最終データをデータベースに戻すときも、最新データをXMLで取り出し、必要な部分だけをDBに返すことが可能である。このようにクロスメディア展開の汎用化を実現した。

XSL-FOを用いたXMLインスタンス活用

ベネッセコーポレーション 購買物流部 桑野 和行 氏

ベネッセコーポレーションでは、たいへん多くの教材や書籍を製作、発行している。従来、これらはDTPアプリケーションを用い人手で制作していた。そのため、工期・コストは「従量制」であり、データはインフラ(DTPソフト・フォント・OS・ハード)に強く依存し、さらにデータは印刷会社の所有物という状態であった。

そこで、データ形式としてXMLを採用することで、コンテンツを社内に残し、コンテンツの改訂・流用を可能にすること、PDF・HTMLなど媒体をまたいで利用すること、自動組版によってコスト・工期圧縮が可能と考えた。
XSL-FOは、スキーマからユーザが設計できるW3C規格である。特定のアプリケーションに依存せず、アプリケーションのバージョンアップに振り回されない、組版自由度が高いというメリットがある。

実際にXSL-FOを使った印刷データ製作をおこなった。450ページの大学学科カタログや大学別学部学科一覧、高校生用教材、単行本などを手がけた。製作コストや工期面で劇的な削減効果があったことに加え、コンテンツを蓄積することができた。これらのコンテンツは、将来の再利用や、別の媒体での利用も可能となる。既にコンテンツを流用した製作も多数おこなっている。

コスト削減のため、中国の大連にて人海戦術でXMLインスタンス化をおこなっている。新規原稿の場合は入力フォームを利用し、執筆者は「XML」を意識することなく原稿入力することができる。
XSL-FOにはXSL1.0の機能が貧弱というデメリットもある。XSL Formatterでは、XSLの不足機能が拡張されているが、それを使うほど、標準規格(XSL)から離れていく矛盾をはらんでいる。XMLスキーマの作り込みは、社内でおこなっている。誌面企画やコンテンツのタイプ別に文書構造を考えている。誌面体裁については、割り切るべきは割り切ることにしている。
今後の課題として、適用案件の拡大、XMLインスタンスの再利用推進、HTML変換の利用、体制強化、スタイルシート作成の外注化などがある。

XSLによる自動組版 「XSL Formatter」

アンテナハウス 石野 恵一郎 氏

XSL(Extensible Stylesheet Language)とは、W3C勧告となった標準技術で、ページメディアへのXML自動組版の仕様である。XSL-FO (Formatting Object) とも呼ばれている。
DTPの場合はレイアウトは自由だが、専用アプリケーションと専門スキルのあるオペレータが各ページを作っていく作業が必要となる。XMLで自動組版(バッチ処理)をおこなう場合はXMLをXSLに変換するスタイルシートの開発が必要となるが、専用オペレータは不要で大量処理が可能、また同一原稿の再利用も容易である。データがXMLのため、アプリケーションにも依存しない。

XSLでは、縦書きなどの基本的な組版は可能だが、日本語専用仕様とはなっていない。そのため、XSL Formatterでは、日本語のための仕様拡張をおこなっている。禁則、和欧間空白、詰めやぶら下げ、段間罫、トンボなどの機能を拡張している。XSL Formatterによるワークフローとして、XML文書とXSLスタイルシートからXSL-FOに変換する。XSL Formatterは、XSL-FOを読み込んで組版し、その結果をPDF/SVG/Printerに出力する。
XSL Formatterは、雑誌・書籍の組版や多言語を必要とするマニュアル作成、PDFやSVG形式でのWebや携帯端末への配信システムに利用されている。

XML標準のスタイルシートに日本語組版を反映

ジャストシステム 社長室 主任研究員 大野 邦夫 氏

2006年の10月に、W3CのXSLワーキンググループの会議がドイツのハイデルベルグでおこなわれた。その際に、Requirements for Japanese Document Layoutとして、日本語組版に必要な要件の概要を発表し、W3Cとして正式な検討をおこなうことを提案した。

2006.4よりJAGATを中心とした任意メンバーが集まり、CSSやXSLといったスタイルシート技術にJIS X 4051(日本語組版)を反映するための要件について検討を始めた。その概要部分を紹介し、日本語組版機能をスタイルシートに反映する必要性を訴えた。
禁則処理や脚注、割注、圏点などに関する細かい質問もあり、大いに参加メンバーの関心を集めることができた。
プレゼンテーションの結果は上々で、検討項目として取り上げたいという意見が多く表明された。

●(説明した機能)
Japanese Manuscript Paper Layout(原稿用紙)
Unit(単位)
Kerning(カーニング:約物処理)
Hang(ぶら下げ)
Space between Japanese words and words in Latin script(和欧間)
Ruby(ルビ)
Warichu(割注)
Tate-chu-yoko(縦中横)
Furi-wake(振分け)
Emphasizing Mark (圏点)
Underline(下線)
Superscript/Subscript (添え字)
Tab(タブ)
Column(段組)
Footnote、Head-note、Side-note(脚注、頭注、傍注)
Line-space adjustment(均等割り)
Figures and Pictures Positioning(図版位置)
Guide Mark (トンボ)

標準化に取り組むW3C

W3C 国際化活動・Webサービス活動担当 佐々木 フェリクス 氏

W3C(World Wide Web Consortium)は、WebプロトコルとWebアプリケーションの標準化活動をおこなっている国際的なコンソーシアムである。日本の慶應義塾大学、ヨーロッパのERCIM、アメリカのMITの各ホストにより運営されており、現在は約400会員がいる。
W3Cの標準化活動は、会員が方向を決めることになっている。また、標準案を「Working Draft」としてまとめ、会員、スタッフ、一般の方々一体になってレビューする。最終的には、「Recommendation」(勧告)として、Web標準を策定している。

Print関連技術に関するW3Cの標準として以下のものがある。

●XSL-FO 1.1(勧告)
XMLデータの組版を目的としたスタイルシート技術
●SVG 1.1(勧告)
ベクター画像を記述するXMLであり、縦組み、グリフ変化にも対応している
●CSS3(草案)
HTML、およびXMLデータを対象としたスタイルシート技術であり、主にWebブラウザによって利用される。日本語組版にも、一部は対応することが可能である。

JIS X 4051:1998(日本語組版)は、XSL-FOの必要条件文書として引用されたが、反映はされていなかった。
W3Cでは、先般の提案を受けて、新たに「スタイルシートに必要な日本語組版の要件定義」を、タスクフォースとしておこなうこととなった。W3Cの中のCSS、SVG、XSL、i18n(国際化)ワーキングループのメンバーの他、JIS X 4051策定メンバーにも参加してもらう予定である。
将来的には、Web組版の国際化をさらに進めていきたい。日本語組版だけでなくアジアのWeb組版、インドの組版などにも取り組んで行きたい。

まとめ

ベネッセコーポレーションと凸版印刷の独自組版システムへの取り組みは、アプローチは正反対であるが、XML技術によるコンテンツ活用を中核とした戦略であることでは一致している。

ベネッセは、再利用が容易なXMLとしてコンテンツを蓄積することを目指し、社内にXMLスタイルシートを利用した組版をおこなう体制を作っている。
凸版印刷では、コンテンツの再利用を望む出版社の要望に応じるため、XML形式でデータ保存する新しい組版システムを構築している。

また、W3Cメンバーでもあるジャストシステム・アンテナハウスとW3Cは、スタイルシート技術にJIS X4051(日本語組版)を反映させるための活動を進めており、将来的にWebの標準技術として日本語組版が実現するかもしれない。

2007/03/21 00:00:00


公益社団法人日本印刷技術協会