本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XMLによる教材コンテンツ管理システム

ある学習参考書出版社では学習塾向けに問題を販売している。以前は,印刷物で提供していたが,近年はWord形式のデータを要望されている。そのため,将来を見越して問題集をXMLデータベース化することにした。
システム構築に携わっているコトブキ企画の蔭山典雄氏に,XMLによる教材コンテンツ管理システムの現状と今後について話を伺った。

コトブキ企画のXMLへの取り組み

コトブキ企画は,カタログ,パンフレットの制作・印刷,Webサイトの企画開発,印刷関連のシステム開発の3事業を中心に行っている。また,3年前から加陽印刷,創基とともにXMLアライアンスグループ(XML-AG)を結成し,月1回程度の情報交換,人材交流を実施している。
今後,インターネットを利用するアプリケーションは,すべてXML対応になると考えている。また,顧客がもつデータを印刷物製作だけでなく,さまざまな形で活用可能な資産とするためのサービスを提供したいと考えている。その結果,XMLを重要な開発テーマとして取り組んでいる。

教材コンテンツ配信管理システム

この出版社では,自社の資産である問題集を1問ずつデータ化することを検討していた。その際,アプリケーションに依存しないデータ形式であり,陳腐化しないことと,Webブラウザから操作可能であることを望んでいた。アウトプットとして,Word,HTML,DTPなどさまざまな媒体を想定していた。結果的に,将来のeラーニング構想も含めて,発展可能なデータ形式であるXMLを選択することとなった。このシステム構築をコトブキ企画が担当した。

科目は英語,数学,理科,社会となっている。数学に大きな特徴がある。数式はDTP作業でも画像として扱うことが一般的だが,このシステムではMathMLとして扱っている。また,データベース化により,問題自体に難易度などの付加情報を保持することができる。
この出版社の顧客は学習塾だが,どの学習塾にどの問題を何回販売したのかといった販売履歴も付加して管理している。

データベースサーバのOSはWindows2000 Server,データベースはSQL Server 2000,XMLパーサーはMSXML4を使用している。
初期入力はコトブキ企画で受託したが,メンテナンスは出版社のイントラネット環境で,問題集の修正,削除,追加などをしてもらう。ユーザのクライアント環境の条件は,ブラウザとしてIE5.0以上,WordはWord2000をターゲットにしている。

教材コンテンツ配信管理システムのフローには,大別すると本文と数式がある。本文とは,英語,数学,社会,理科の各科目共通である。入力したものをXMLデータに変換し,それをデータベースに登録する。本文XMLにスタイルシートを適用することで,HTML書き出しやWord書き出しが行える。

XMLデータベースの中は,目次XMLと本文XMLとがある。教材ごとに目次があり,目次項目と問題のIDが含まれている。数学の教材であれば,「数と式」や「平方根」という項目の下にID番号が振られた問題がある。本文のXMLデータには,問題文,回答,解説,およびその他の管理情報や目次XMLとのリンク情報が含まれている。

メニュー上で「目次読み込み」を指示すると,目次XMLが表示される。エクスプローラのような形式で,中の状態が表示される。さらにクリックすると,1問ずつの問題と回答・解説のデータが色分けして表示される。必要な問題を選択し,「一覧表示」の操作を行うと,チェックされた問題だけを抽出し,ID順に並べて表示される。この時点では,内部のXMLデータをHTMLデータに変換して表示している。さらに,「Wordの文書作成」という操作を行うと,データをWord形式や書き出すことができる。また,XMLやCSVに書き出すことも可能である。

数式の入力・表示とデータ形式

数式は,独自に開発したMathML対応の数式専用エディタを使って入力する。このエディタは,数式データをMathMLとGIFの2種類のデータを同時に書き出し,データベースに登録する。
数学以外のものは,本文XMLにスタイルシートを適用することで,HTMLへの書き出しやWordへの書き出しが可能だが,数式をWebブラウザに表示するには,GIF画像として扱う必要がある。
学習塾のパソコンには,必ずしも適正なバージョンのWordと数式データを表示するMathTypeプラグインが入っているわけではない。環境に依存せず,だれでもWebブラウザさえあれば見ることができるように,GIF方式を採用した。

Wordデータを書き出す際には,MathMLのデータをXSLTでWordのデータに変換している。Wordには,「数式3.0」というオプション機能が付属しており,その形式に変換して書き出す。従って,データを受け取った塾では,Wordさえあれば数式データを編集加工することができる。
この数式対応の部分が,出版社や大手予備校のシステム管理者からも高い評価を受けている。

数式入力ソフトは,オープンソースであるOpenOffice.orgのソフトウエアをベースに,コトブキ企画がGUIから数式を簡単に作れるツールとして開発した。

教材コンテンツ配信管理システムのメリット

塾へのWord形式の配信・販売を実現したことのほかに,さまざまなメリットがある。データをXML化したことにより,マルチアウト展開が可能である。今はWordとHTML,XMLの書き出しだけの対応だが,今後はDTPを含めていくことを想定し,並行して協議している。

データベース化したことにより問題コンテンツの一元管理を実現したことも非常に大きなメリットである。さらに,検索とメンテナンスがブラウザ上で可能になり,作業を大幅に効率化することができた。データ化されているので,紙でやり取りする必要もなく,非常にスムーズに更新作業をすることができる。
さらに,1問ごとの抽出履歴管理により,問題の利用度が明確になり,どの問題に人気があるかなども把握できるようになった。

その他,自社以外の問題配信サイトへのデータ提供時に,DTDとXMLを提供することで,スムーズにコンバートできるようになった。従来は,印刷物に指示を書き込み,でき上がったデータを校正していたが,今は必要な問題のみを抽出,XML書き出しし,それと一緒にDTDを渡す。受け取ったサービスサイトは,スタイルシートを作り,簡単に変換し自社のコンテンツとして販売している。

今後の課題

システム納入から約1年だが,データ化されていない部分が大きいことが最大の課題である。問題集の量は膨大であり,優先順位の高いものからデータ化している。やむを得ず従来どおりのDTP制作も並行して行われている。
また,XMLを意識することなしに,WordとXMLの双方向変換を実現したい。Word上で数式をクリックすると,専用エディタを起動し編集・加工することで,そのような方法も可能である。

現時点では,DTPアプリケーションへの書き出しに対応していない。InDesignやその他のアプリケーションに対する書き出しのうち,数式部分が未対応である。現在,組版ソフトメーカーと仕様について協議している。

(JAGAT Info 2006年1月号より転載)

2006/01/31 00:00:00


公益社団法人日本印刷技術協会