PAGE2001コンファレンスのD1セッション「画像処理環境とツール」では、印刷やインターネットに関係する新たな画像フォーマットやデータ圧縮方式が紹介された。
1.オリエンテーション
モデレータの東京工芸大学工学部 画像工学科 小野 文孝 教授には、最近の動向や各フォーマットを概観いただいた。
今後の課題として、圧縮(高圧縮,高速実行性、ロバストネス)、処理(解像度変換,量子化、画像の部分アクセス、認識技術の適用)、活用の便宜性(標準化、特許問題、ツールの提供)の3つを挙げられている(プレゼン資料はこちら)。
(講演から)
画像のデジタル化は「2値画像→多値画像→動画」の順番に行われてきた。2値画像はオフィス文書や印刷など、非常に大きなマーケットになっている
表現形式には、「bitmap、raster graphics、vector graphics、object」というhierarchiesがある。
量子化のレベルでは、一番単純なものから「2値それから多値」である。これは記録とも関係しているし、表現形式、圧縮にも大きく関係してくる。
量子化レベルと解像度のトレードオフというか、バーターというか、量子化レベルを下げておいて解像度を上げるとか、量子化レベルを上げておいて解像度を下げるとか、その辺のいろいろなやりとりも画像処理のうえでは重要である。
領域の単位の基本は「画素→タイル→ページ→文書」である。文書は複数のページの集合なので、ページ間情報を管理することで圧縮率の向上やハンドリングの便利さなどが出てくる。
RGB、CMYK、LABといろいろなカラー空間があるが、コンポーネント間の相関、カラーマッチング、色空間どうしの相互変換など、話題になっている。
こういう画像の上位情報、あるいは付帯情報を表現するものが画像フォーマットになる。
JBIGという規格は、2値のファクシミリから始まる画像圧縮規格の第3世代にあたる。第1世代はMH、MR、MMRなど、G3やG4のファックスでなじみの符号化の方式である。JBIGは、文字とラインアートに加えて、ハーフトーンの符号化について非常にブレイクスルーがあった。ハーフトーンはMH、MR、MMR符号化では、圧縮をかけても元データより大きくなってしまうことがあったが、JBIG2はその学習型で、Markov-model符号化で統計的学習により、ハーフトーンでも圧縮できる
JBIG2は95年からスタートして、特徴は文字のコード的表現で、objectとしての認識にあたる。すでに送った文字を記憶し例えば、「J」という字が最初に送られまた「J」が出てきたとき、こビットパターンを送るのではなく、何番目に送った文字であるというものを送る。大事なことはmulti-pageの概念で、辞書はmulti-pageで持つ。圧縮の技術としてはかなり最終的なところに行っている。
原理的にはとにかく解像度にディペンドしないことが、JBIG2の大きな特長である。ディクショナリーの方は文字のディクショナリーとハーフトーンのディクショナリーを持っている。
PNG(Portable Network Graphics)はlosslessの圧縮で、インデックスカラー256レベル、グレースケール16ビット、カラー48ビットを符号化できる。基本的にテキストの圧縮と同じなので、非常に高速で、ハードウェアも小さくて済む。一番大事なことは活用の便宜性である。標準化になるといっても、特許の問題があるので、必ずしも無料とはかぎらない。なるべく特許問題のないようなものを標準化することが、標準化団体や標準化の委員に課せられた役割である。
2.TIFFとMRG
NTTプリンテック(株) 品質管理本部 技術部 松木 様にはTIFF 系ラスター画像フォーマットの、TIFF/IT、TIFF/FX、MCRを解説いただいた。プレゼン資料では多岐に渡るTIFFが分かりやすく図解されている(プレゼン資料はこちら)。
特に、ページ構造付のMRGは、RIPとCTPをつなく1bitTIFFのMMRより数倍効率よく圧縮できるなど、興味ある内容であった。
(講演から)
TIFFとMRC(Mixed Raster Content)のようなラスター画像フォーマットは、あとでの再加工などはできないが、少なくとも再現はしてくれる。
TIFFは基本的には2値、グレースケール、パレットカラー、RGB画像、そして拡張として、ファックス用、タイリング、CMYK、YCbCr、CIELabの画像、それからJPEG圧縮まで含まれている。TIFF/ITのITはImaging Technologyという意味で、Graphic Art用である。
TIFF/ITの方は色空間やICCプロファイルの取り込みや符号化の話で、今、拡張が進められようとしている。インターネットファックス用のTIFFファイルであるTIFF/FXについても、JPEG2000やJBIG2を入れていくということでの拡張が今、進められようとしている。
PDFを新聞広告の伝送などに利用すやすいようにと、PDF/X-1、PDF/X-2が考えられていて再現性を確保するために、いろいろな制限を設けている。しかし、米国が進めていたX-1は、いざDIS投票になったところで米国自身が反対して否決されている。この後どうなるか、予断を許さないところである。拡張の予定としては色空間の追加。デジタルカメラに対応するために、RGB、CIELABを入れるという話がある。それから、ICCプロファイルの追加、JPEG、DEFLATE符号化の追加もある。
TIFF/FXは蓄積転送型のインターネットファックスで、イメージファイルディレクトリを複数個使うことによって、複数ページをサポートする。
MRC(ミクストラスターコンテント)は1ページのドキュメントで写真部分と文字部分、(文字を含む)の混在画像を効率的に圧縮するために3レイヤの構造に分けて、最適な符号化をかけたり、処理量を削減するためにストライプ化する方法である。
TIFF/FXとMRCの関係は、TIFF/ITはファイナルページというファイルと、それ以外に参照するものがコンティニュアストーンとラインワーク、ハイリゾリューションのコンティニュアストーンのファイルが1個ずつになる。
それに対してMRCは、プライマリーなIFDが1ページに対応するが、その下側にマスクレイヤが入る。そのほかにchild IFDを用意しておいて、そこに1つ1つのイメージのAや、フォアグラウンドの赤や、バックグラウンドのイメージのB、それからフォアグラウンドのgraphicsのCと、こういうものを入れていくようなかたちになる。
例えばCTPのデコーダとRIPの間をつなぐときに、1bitTIFFが用いられるがデータ圧縮にはMMR符号化が使われてて圧縮率はあまり上がらない。しかしMMRで圧縮率が6ぐらいだったものが、MCRを使えば17分の1ぐらいまで落ちる。
3.JPEG2000とFlashpix
キヤノン(株)国際標準企画センター 石井 克己 様にはJPEG2000とFlashpixについて紹介していただいた。
(講演から)
JPEG2000はさまざまな自然画(2値でも多値でも)、その他のカラー画像あるいは医療用の画像や文書画像、コンピュータグラフィックスなどまでもカバーしようというものである。
JPEG2000と一口で言っても、今のところパートが7つ用意されている。低ビットレートでのすぐれた符号化・圧縮性能ということで、JPEGよりも低解像度のときに非常に圧縮率がよくなる設計となっており、2値、多値の両方を圧縮できる。また、可逆・非可逆の両方、ロスレスとロッシーの両方をサポートするようなかたちになっている。
JP2という基本フォーマットはsRGBだけをサポートし、一応ICCプロファイルもサポートしているが、制限つきICCプロファイルになっている。これはなぜかというと、JP2という基本フォーマットは、例えばエクスプローラーなどをダブルクリックすることで、だれでも表示できるようにしたい。ネットワークでやりとりしても、どんなブラウザでも表示できるように非常にシンプルにしたい。ICCプロファイルはCMYKなどをサポートできるが、JPEG2000では要求していない。
また、アニメーションもサポートしている。Motion JPEG2000との違いは、JPEG2000はあくまでもアニメーションなので、音声もないし、非常にシンプルなシンタックスで、本当に簡単なことしかできない。
他にもいろいろな付加情報を定義している。例えば画像生成情報、デジタルカメラで生成した、あるいはスキャナで読み込んだ生成情報や、被写体の情報、いつ、だれが、どこで撮ったといった情報、付加情報の履歴、あるいは著作権情報も標準の中に規定されている。これらはXMLで記述するかたちになっており、DTDも定義されている。
Flashpixは96年の春にコダック、HP、マイクロソフト、ライブピクチャの4社で規格化された画像フォーマットである。現在は主にオンライン上、ネットワーク上で使われているというのが一番簡単な答えである。
バーチャルショールームやeコマース用の商品紹介、美術館のオンライン画像閲覧といったところで、ズーム、パンなどにより特定領域だけのデータを伝送して、拡大表示させることができる。このために、画像をタイル分割しており、64×64のタイルのサイズに限定している。一方、JPEG2000の場合は大きさを自由に変えられ、画像全体も1つのタイルのような位置づけになる。Flashpixは、基本的には内部でJPEG圧縮をするので、物理的に階層構造を作っている。最終的には各倍率の画像データを持っているので、データ容量は元の1.3倍の大きさになってしまう。
色空間に関しては、sRGBとフォトICCとICCプロファイル。圧縮方式としては、ほとんどJPEG圧縮をしていると思ってまちがいない。
IIP(Internet Imaging Protocol)は、HP、ライブピクチャ、コダックの3社より提案されたFlashpixの特長をネットワーク上で最大限に生かすためのプロトコルもあり、Java版のレファレンスツールによりネットワーク経由で高解像度、あるいは巨大画像の縮小画像を閲覧できたり、ズーム、パンといった特定領域の拡大表示ができる。ただし、JPEG2000の登場によって、たぶんこれも取って代わられてしまうだろう。JPEG2000も全く同じことが言える。
2001/04/02 00:00:00