本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
DITAコンソーシアムジャパンは、DITAの普及を目的として設立された非営利団体である。DITAコンソーシアムの中には幾つか部会がある。例えば翻訳関係を中心に研究する部会、海外で出版されているDITA関連の書籍を翻訳して日本で出版する部会、またDITAの仕様そのものを研究する部会など、固定的メンバーが、あるテーマに時間をかけて取り組んでいくケースが多い。
その中にパンデミック部会がある。これは他の部会と少し異なり、おもしろそうなテーマを見つけて、それに興味があるメンバーが集まる。そして、比較的短時間で研究し、何らかの成果を出して、次のテーマにすぐ乗り換えていく。比較的フットワークが軽い部会である。
このパンデミック部会の中に、2010年後半、EPUBプロジェクトが立ち上がった。DITAとはもともとマニュアルを作るための仕様である。
それに対してEPUBは、マニュアルよりも一般的な小説など、文書系のコンテンツ用の仕様である。一見、この両者の仕様はつながりがあまりないような印象があるが、敢えてDITAとEPUBを結びつけたら一体どういうことが可能になるかを研究しようと立ち上がったプロジェクトである。
今日は、まずDITAとは何か、EPUBの特徴、DITAのデータを入力するのはどういう方法があるか。また、マニュアルなので当然多言語展開の話が出てくるが、その翻訳するための手法や実際にDITAで作られたデータを自動的にEPUBに変換するには、どういう手法があるかなどを紹介していただく。
■DITA(ディタ)とは
DITAには言葉として、トピック、マップ、特殊化、再利用、自動組版、Open Toolkitなどが出てくるが、それらを総合してDITAなのか、それとも自動組版のことなのか、構造化XMLなのか。DITAについてなかなか認識しづらく印象に残らないのが現実である。
DITAとは、Darwin Information Typing Architectureの略である。XMLベースの技術文書の生成及び管理仕様の形で、2005年5月3日に国際標準化団体のOASIS標準規格として承認されている。
DITAは、簡単に言えばトピック(情報)とマップ(構造)から構成される。これは通常のテクニカルマニュアルでも成り立っているが、DITAになると、これまでDTPソフトなどを利用して作成してきたテクニカルマニュアルとはまた少し変わってくる。
実際にDITAで作成したPDFファイルの成果物から、トピックとマップはどの部分に当たるのかを認識してもらいたい。
図の左側の枠で囲われた部分がマップに相当する。この中にある栞1つ1つがトピックである。(図1)
右側のレイアウト画面に、「特殊化とは」の見出しがあり、それに対する説明文がある。さらにその下に関連リンクが張られているが、これをDITAではトピックと名付けている。
これがファイル1つで存在するということである。これまでInDesignやFrameMakerなどのページレイアウトソフトでDTP作業していた人は、「ファイルをそんなに短く1つ1つ細分化するのか」と驚くようなファイル単位になっている。
トピックには4種類の型があり、内容に応じて使い分ける。例えば「録音ボタンを押すと録画が始まる」「停止ボタンを押すと録画が止まる」という手順を書くときには、Task型の定義のもとでライティングしていく。つまり、文章に対して必ず定義があり、その種類を必ず分けた上で文章を書く。(図2)
マップはInDesignやFrameMakerのBookファイルのイメージで、ファイルを自由に並べ替えて、その後にPDFを生成する部分になる。ただし、DITAには4つの型があるので、内容に応じた情報タイプを必ず指定して文章を書かなくてはいけない。(図3)
これまでのDTPの文章では、例えば携帯電話のマニュアルを作る場合、最上位モデルと簡易モデルの場合で、全く同じ内容でも、基本操作やカメラ機能など、同量のInDesignファイルを用意して、それをBookでまとめPDFに出して印刷する手順であった。したがって、共通部分に変更が入ると、このモデル2つ分に対して修正が必要になる。(図4)
しかし、DITAの場合は情報が細分化されている。この細分化されたファイルをCMSに集めて、今回のモデルに必要な機能、それに対して記述してある文章だけを抜粋し、InDesignやFramemakerのBookファイルでファイルを並び替えて、そこからPDFに書き出したりHTMLファイルに書き出したりする。(図5)
■DITAのトピックとワークフロー
トピックは1つのファイルで意味を成すものとして管理する。例えば「特殊化とは」の見出しが付いていたら、それに対する答がその本文になくてはいけない。これまでのDTPで書かれたライティングとの大きな違いは、本文中にリンクを書かないことである。最下部に関連するリンクまとめて記述する場所がある。
ショート・デスクリプション部分にはトピックの概要を記載する。より細かい内容のものも、ここに書き込む。それは、何が書かれているか、後に検索する際、とても有効になる。
例えばInDesignやFrameMakerのファイルで、さまざまな分野に分けて多くの記述をする。そして、InDesignのファイルタイトル名を「ブルーレイの録画予約の手順について」としても、それだけではどこまでの手順がそのファイルに書かれているかわからない。
それがDITAのトピックでは、ショート・デスクリプション枠があり、この文章さえ読めば、ファイルの記述内容や手順、どんな結果が得られるかまでわかる。
DITAのトピックの基本は、本文中にリンクを書けないことである。「詳細はこのページへ」「別冊、別製品の参考資料に飛んでください」とは書かない。1ファイルだけで絶対完結するのが基本である。
それを踏まえて、DITAのワークフローがこれまでとどう変わるのか。
まず最初に、この製品にはどんな機能が必要なのか、マニュアルを作る上でどんな順序ですすめるのかなど、構成設計を行う。最初のライティングをする段階の設計段階で、DITAマップを書き起こす。そして、構成設計者が、例えば「基本操作、カメラ機能、動画機能」などの構成を書き、そこで構成が決まったらライターへ引き渡す。
基本操作を指示されたライターはそのトピックを、カメラ機能について指示されたライターはそのトピックを、それぞれの機能に振り分けられたライターがライティングしていく。こういった同時進行の分業が可能になる。
それぞれのトピックがCMS、データベースに集まり、最後にまたトピックの構成、マップが出てくる。今回発売する製品に対しての機能の仕分けをして、それぞれのモデルのマニュアルを自動組版で生成する。
DITAはワンソースマルチユースであり、HTML、PDF、さらにEPUBなど多様な出力が可能である。
トピックレベルの再利用性が高いことは、DITAのメリットである。分散作業と情報の再利用で、効率化の実現が可能になる。(図6)(図7)
■EPUBプロジェクトの活動内容
EPUBは米国の電子出版関連団体であるIDPFが制定した、電子書籍のファイルフォーマットの規格である。既にiPadなどで採用されており、小説や絵があるものもEPUBフォーマットで配布されている。XHTMLやCSSなどのコンテンツをZIP形式で圧縮し、zipファイル拡張子を「.EPUB」に変更したものである。
EPUBは以下の3つの仕様がある。
(1)OPS(Open Publication Structure):コンテンツの構造を定義する仕様
(2)OPF(Open Packaging Format):EPUBの構成要素やメタデータを定義する仕様
(3)OCF(OEBPS Container Format)ファイルの圧縮方法を定義する仕様
EPUBファイルの特徴は、まずリフローである。媒体に左右されずレイアウトできるところが最大の特徴になっている。ベースとなっている仕様はXHTMLとCSSで、Webサイトなどのコーティング関連の知識があれば比較的その仕様が理解しやすい。閲覧環境はiPadをはじめとする電子書籍を閲覧するタブレット型PCである。
EPUBプロジェクトでは、新たなファイルフォーマットの一つとして、DITAコンテンツからEPUBフォーマットを出力する仕組みやその周辺技術、適用市場を調査し、また実証実験などを行っている。DITAからEPUBへの出力は、オープンソースの「DITA for Publishers」を使っている。プロジェクトでのEPUBに対する検証は、以下の3つの項目で行った。
まず、ユーザが電子書籍を閲覧する環境としてどのようなものがあるのかを検証した。
2番目に、現在あるEPUB化されたマニュアルの閲覧で、どのEPUBビューアが適しているかを考察した。
3番目に、テクニカルドキュメント(マニュアル)をEPUB化してみたらどうなるのか、またそのときにどのようなメリット、可能性があるのかを検証した。
■電子書籍を閲覧する環境
iPadなどの電子書籍端末とPCが存在する。どちらの端末でも閲覧は可能だが、主要用途としてはiPad、Kindle、Reader、ガラパゴスなどで閲覧するのが普通と思われる。
コンテンツの種類によっても、利用場面が少し変わってくる。私的に読むもの、例えば、漫画、小説などのストーリー系コンテンツや雑誌、新聞などは家でくつろいだ状態で読んだり、通勤の移動中に読んだりするものになる。
仕事で参照するものは、リファレンス系コンテンツで、例えば、技術情報やテクニカルマニュアル、または営業が自社製品を説明するために、セールスマニュアルをiPadなどにインストールして出先に持っていくことが想像できる。DITAはテクニカルマニュアルを作ることが名目になっており、仕事で参照するもののカテゴリーになる。
EPUBマニュアルの利用場面と端末の適性について、職場に限定して考えてみる。
コンテンツは技術書やマニュアルが考えられるが、職場のデスクならPCがあるので、わざわざ手に持ってiPadで見ることはあまりない。だから、これはそれほど適していない。
ただし、iPadは持ち運びが簡単なので、例えば少し事務所から離れたところにある大型機械を操作するときなどは、分厚い紙マニュアルを持っていくよりもiPadにマニュアルを入れ、目的の機械の目の前でそれを閲覧しながら操作する形が、一番利用場面として適切ではないか。
これは職場に限らず、家庭内での周辺機器の利用も考えられる。例えばリビングに必ずあるテレビ、DVD、ブルーレイ・レコーダーなど身近な製品も、タブレットPCにインストールされたマニュアルで見るのは非常に利便性が高いと思う。
電子マニュアルをiPadで閲覧するとき、これまでのPDFはどう見えるか。PDFは固定レイアウトなので、サイズによってはiPadには向かないものもある。しかし、これまでの紙マニュアルを忠実に電子化したものなので、全データを持つ辞書的な位置付けになるのではないか。
HTML、HTMLヘルプに関しては、最も環境を選ばない手軽なマニュアルと言える。HTMLヘルプだと、IDの属性などで、例えばWordなどで今自分が困っている操作に対してヘルプボタンを押したとき、それに関連した情報が立ち上がるメリットがある。
それではEPUBはどうなのか。EPUBの特徴はリフローなので、画面サイズに合わせてコンテンツが流動するリフロー機能がある。タブレットPCもいろいろな種類が出てきたが、それぞれインチサイズが違う。それらに対してリフローするので、それなりのレイアウトで見ることができるメリットがある。
その反面、リフローするので、フォントサイズの変更などにより、ページの切れ目がその都度変わる。今までのDTPで作成したPDFの全く逆を行くようなファイルフォーマットになっている。
■各種EPUBビューアの評価
無償で入手できる4つのEPUBビューアを調査対象として検証した。当然、iPadにインストールされているiBooks、そしてStanza、Adobeが提供しているAdobe Digital Editions、FirefoxのWebブラウザのpluginとして入っているEPUBReaderである。
調査内容は、機能面と表示面の差異を調査した。表示面に関しては、EPUBの仕様がXHTMLとCSSであるため、これを生成したEPUBから変更してみて、その結果がどうなるかを検証した。
調査結果は、かなり綿密な調査をして膨大なExcelファイルになったが、簡単にまとめた。
特徴として、文字を読みやすくするための機能があるのか、読者に役に立つ機能があるのか、一般ユーザが思いつきそうな特徴、疑問を並べて、それに対してプロジェクトメンバーがそれぞれ実行してみた。
使用しづらい、読みづらいものはほとんどなかったが、厳密に調査すると、現状ではAppleのiBooksが、とてもフォントの見え方がきれいで、電子書籍らしさを実現している。指でのページめくりなども含めてiPadが一番見やすい仕様になっていた。
ここでの結論は、現時点ではiBooksが最も適している。ただ、EPUBビューアが世に出てからまだそれほど期間が経っていないので、これからの機能向上により、どのような見せ方、機能が追加されるのかは、とても楽しみなところである。(図8)(図9)
■テクニカルドキュメントをEPUB化するメリット
DITAにはOpen Toolkitが用意されている。さらに、その拡張プラグインとしてDITA for Publishersが提供されている。共にオープンソースである。DITA for Publishersを追加するだけで、EPUB形式のマニュアルを簡単に書き出すことができる。
リフローの最大のメリットは、画面サイズに合わせてコンテンツが流動することである。その反面、フォントサイズの変更などにより、ページの切れ目がその都度変わってしまう。そのため、ページ単位でレイアウトしてきたDTPオペレータたちにとっては、かなり受け入れがたいものになっている。場合によっては図表の閲覧が非常に難しくなる。
そこで、リフローの利点と欠点について検証してみた。利点は画面のサイズに合わせてコンテンツが流動することである。フォントサイズも自由に変更できる。PDFだとレイアウトが固定されているので、例えば、A3サイズより大きな紙でのマニュアルを見るとき閲覧しづらい。
また、リフローの欠点はPDFの逆で、紙と同じように読みたいという意味では再現性は低くなる。ページの切れ目がその都度変わる、図表の扱いに問題があるなどである。
その図表の問題について検証してみる。リフロー表示のテクニカルマニュアルでまず浮かぶ問題は、イラストの扱いである。タブレットPCは縦と横のプレビューの特徴があるが、横にして見るイラストを縦にすると、右側のキャプションに対するボリュームの説明などが読めなくなってしまう。逆にフィットで100%表示すると、キャプションの文字が小さすぎて読めない欠点がある。
そこで、これは完全なる解決策ではないが、キャプションに対しては番号表示に徹底する案がある。これ自体は既に当たり前な手法ではあるが、引き出し番号で図示して、該当する番号の説明を別記に表記する。この表記を通常の本文と同じような扱いで記載することで、縦に表示したとき、キャプションの説明が画面で折り返されて全部読めるようになる。
もちろん、キャプションが何十個もあった場合にはスクロールしないと読めないが、紙のマニュアルでも、業務用の精密機械や大型機械であれば、大きなイラストに対してのキャプションは30個、40個あり、よく2、3ページまたがるので、こういったアイデア1つで十分EPUBでのマニュアルの利点は出せるのではないか。
リフローの特徴をDITAで活かすなら、操作手順書に限ると考えるのは、私の個人的な意見が強く、プロジェクト全体でまとまった意見ではない。が、例えばブルーレイ・レコーダーやテレビのリモコンは、パネル全体の図でなく、トリミングした状態の図で説明が可能である。順を追って読んでいくだけで、イラストと文章がページ切れで大きく離れることは、かなり軽減できる。
逆に、大型機械、精密機械などで縮小表示が意味をなさない大きなイラストがある。それらは、EPUB、タブレットPCで全部確認するのは向いていない。
つまり、EPUB形式のマニュアルは、これまでのPDFのマニュアル、HTMLファイルとは全く別次元のものと認識してもらいたい。
タブレットPCは今後ますます普及していくと思われる。それは普段、我々の日常生活の身近な部分で使われるものである。
その中の1つの機能として、テクニカルマニュアルはEPUB形式のマニュアルとして活用され、我々の生活に役立つファイル形式なのではないか。
現状、iPhone、iPadでも、身近な家庭のリモコンにさえなっている。そこで簡単にEPUB形式のマニュアルが立ち上がって読めるのは、非常に利便性がある。
最大のメリットは、タブレットPCは持ち運びができることである。目的の機器の前で電子マニュアルを閲覧することができる。例えばキッチンでも、最近の電子レンジやオーブンは非常に細かい設定がある。複雑な料理をするための手順書で、操作も多少なり複雑な手順を追わないとできなかったりする。
そういうとき、ノートPCで操作するのはなかなか現実的ではない。片手で簡単に持てるiPadなどで、確認しながら目的の機器を操作する。それが今後のタブレットPCとEPUBフォーマットの最適な姿ではないかと思っている。(図10)(図11)(図12)(図13)