本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

DTP豆知識(199911)

本コーナーでは,DTPエキスパートを目指すうえで理解しておきたいことを模擬試験形式で解説します。JAGAT認証DTPエキスパート 福原節寿氏に,問題のポイントや重要点を解説していただきます。試験勉強のご参考に,またはDTPに必要な知識の確認にご活用ください。
次回,第13期DTPエキスパート認証試験は2000年3月12日に行われます。詳細はDTPエキスパートのページをご覧ください。



問1 JIS X 0208の漢字

 次の文の[ ]の中の正しいものを選びなさい。

 JIS X 0208制定時の漢字の選定は,政令文字である[A:(1)通産省 (2)労働省 (3)文部省 (4)総務庁]管轄の「常用漢字」および法務省管轄の「人名用漢字」に,地名人名やほかの日常使用文字を加えて行われた。

 1946年に内閣告示された「常用漢字」は1850字で,1951年には「人名漢字別表」が追加され,これらを含めていわゆる78JISであるJIS C 6226が[B:(1)1958 (2)1968 (3)1978 (4)1988]年に制定された。
 その後1981年に「当用漢字」が「常用漢字」となり,さらに法務省から,戸籍処理や住民情報処理の指針である「人名用漢字」に166字が追加された。

 「人名用漢字」は法律に関わるため,同じ字でも字画の違いを区別し,字体の「ゆれ」を認めない傾向がある。
 JIS制定時にもこのような判断が入り,[C:(1)外字登録機関を設けた (2)剣の異字体が4字入っている (3)包摂基準を設けた]。

 一方「常用漢字」は字体の「ゆれ」を認めた常用漢字表を示している。
 JIS X 0208の第1水準漢字は常用漢字をベースに,ほとんど[D:(1)俗字 (2)新字 (3)旧字 (4)正字]体で表現されている。
 ところが,第2水準漢字は旧字で,異体字あるいは字典体で例示されている。

 いわゆる83JISでは,「常用漢字」に追随する字体統一の考えを反映して,100字近い字の追加と,300字近い例字の変更を行ったが,そのため,同じテキストでも,扱うコンピュータが実装しているJISの年版の差によって[E:(1)字形 (2)字体 (3)書体 (4)字種]が異なることが起こるようになった。
 JISは本来,字体を規定するものではなく,規格票(規格を出版したもの)に例字を示すだけであったが,規格の混乱と受け取られたので,いわゆる90JISでは,規格票を平成明朝体で印刷して収拾を図った。
 1997年には字形の包摂に関する考え方も示され,「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」と名称も変わった。



    【関連項目】
     文字とコンピュータが,やり取りするためには,1対1に対応する表,数値が必要で,文字(字体)に番号を割り振ったものが「文字コード」である。
     異なる文字コード間で,テキストデータをやり取りした場合に起こるフォントのトラブルが,「文字化け」である。
     文字コードの基準となっているものに「JIS(日本工業規格)コード」がある。
     実際には,JISの文字セットをベースに,マイクロソフト社がエンコーディング方式を変えた「シフトJISコード」が,パソコン業界では多く使われている。
     このほかにも,後の問題にあるUnicodeなど,いくつかのコードがある。


    【出題のポイント】
     JIS X 0208の成り立ち,改訂を問うもの。
     その過程には字体(俗字,新字,旧字,正字など),もしくは字形,字体,書体,字種などの選択もあるので,その意味を理解しておきたい。
     また,これらに関連してJIS X 0208の構造,コードの切り替え,文字の同異などの出題もある。


    【問題解説】
     漢字の制定については,1946年以降の文部省国語審議会の「当用漢字表」「常用漢字表」などがある。JISコードは78年に初めて制定され,かな,数字,アルファベット,記号などの非漢字文字を453字,漢字は6349字(第1水準:2965字,第2水準:3384字)を選定した。
     78年に制定されたものが「旧JIS」「78JIS」と呼ばれている。漢字の選定では,これらの政令文字と人名,地名などの政令以外の文字があり,Aはその政令文字の管轄省庁の問いで,「常用漢字」は文部省となる。

     Bは,初めて制定された年であるが,前記もしくは問題文中の「78JIS」がヒントで78年となる。
     漢字の字体で,わずかな字画の相違(ゆれ)で同一の漢字と認識できるものを区別せずに,それらに同一の区点位置(コード)を与えることを包摂という。
     Cは人名用漢字に関しては,こうした包摂基準を決めるのが困難であり,一部異体字が併記されることなどから,2が適切。

     Dでは,字体の種類(概念)を理解しておくこと。
     ここでは,政令文字である常用漢字の表現なので新字が適切。詳細については図1の字体の種類(概念)を参照。

     83年に改訂があり,「新JIS」「83JIS」と呼ばれている。
     主な変更点には,300近い文字の字体が変わったこと,いくつかの漢字コードの変更,「壺」と「壷」のような異体字が第1水準と第2水準の間で入れ替わったことなどがある。
     文字セットとエンコーディングが同時に変わってしまったので,78JISで作ったテキストを83JISで開くと,文字が変わってしまうトラブルが発生した。
     Eでは,コードの指す実体なので字体が適切。
     さらに90年にも改訂が行われ,コードの文字が平成明朝体で規格票によって例示され,225字の字形変更やJIS X 0212(補助漢字)が制定された。97年の改訂では,字体,字形の変更は行わず,名称を「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」に定めた。

     まとめとして,図2のJISコードの改訂を参照。



    図1 字体の種類(概念)



    図2 JISコードの改訂


    【模範解答】
    A.(3),B.(3),C.(2),D.(2),E.(2)


    【キーワード】
    文字コード,JIS X 0208,字体およびその種類,字形




問2 JIS X 0221とUnicode

 次の文の[ ]の中の正しいものを選びなさい。

 国際符号化文字集合JIS X 0221は「ISO/IEC 10646-I Universal Multiple-Octet Coded Character Set」に対応し,[A:(1)UCS (2)UMOCCS (3)Unicode (4)世界コード]とも呼ぶ。
 その全体構造は将来の拡張を考えた[B:(1)2オクテット (2)4バイト (3)8バイト (4)16ビット]コードだが,2バイトで1文字を表すUCS-2だけが決まっている。
 全体では,上位から1バイトずつをそれぞれ群,面,区,点と表すが,このうち群と面がともに00hの面,すなわち区と点だけを使って表すものをUCS-2という。
 この面は基本多言語面([C:(1)BMP (2)CAE (3)CSG (4)KS])ともいい,[D:(1)ASCII (2)シフトJIS (3)EUC (4)Unicode]と対応して開発された。

 基本多言語面は,それだけで各国の文字を包含する目的で,アルファベットと記号類が約[E:(1)1000 (2)1万 (3)2万 (4)5万]字,漢字は[F:(1)JIS (2)UCS統合 (3)CJK統合 (4)康煕字典]漢字が約2万字含まれている。
 JIS X 0208と異なり,制御文字のエリアにも漢字を割り当てている。

 UCS-2では1つのコードが1つのグリフを表しているわけではなく,中国,台湾,日本,韓国のそれぞれの国の規格の差である字体の「ゆれ」を許している。
 従って,実装面でどの文字を使うかを指定する仕組みが必要になる。
 例えば,Windowsでは,[G:(1)GDI (2)ロケール (3)LE (4)WorldScript]という機能で,日本語や中国語という指定を切り替えて表示するようになる。

 CJK漢字のJ欄にはX 0208とX 0212(補助漢字)の文字が[H:(1)一部 (2)半分 (3)全部]含まれ,その並び方は[I:(1)同じである (2)シフトしている (3)全く異なる (3)逆順になっている]。

 UnicodeのエンコーディングはJAVAや[J:(1)Windows (2)CP/M (3)DOS (4)System7]で採用されているが,アプリケーションが対応していないと使えない。


    【関連項目】
     世界中の文字には,なじみの深いラテン文字,漢字以外にもアラビア文字,アムハラ文字など数多くの文字がある。
     これらをひとつのコード体系に盛り込んだものにUnicodeがある。
     Unicodeは,16バイトで定義し,約6万の割り振りのなかで,各国の文字を1つの文字セットに入れて,文字コードを扱えるようにしたものである。国際規格にも採用され,JIS X 208と0212も含まれている。
     もともとは西海岸のコンピュータが作ったもの。
     多くの文字は,ラテン文字のように1バイト=256もあれば表現できるので問題ないが,漢字に対しては約2万の割り振りなので困難な面もある。
     ちなみに各国の漢字コードには,JISのほかに中国が約1万6000余(GBコード),台湾が約1万9000余(BIG5),韓国は漢字約7000余・ハングル約2000余(KSコード)が存在する。
     余談であるが,これらには全く互換性がないので,JISコードを含めてひとつに統一するのは,問題があるかもしれない。


    【出題のポイント】
     JIS X 0221とUnicodeの概要について理解しておくこと。



    【問題解説】
     Unicodeが85年に提唱され,さらに拡張されたものとして,93年にISO(国際標準化機構)とIEC(国際電気標準会議)によってISO/IEC 10646-Iの万国統一の文字コードが規格化された。
     日本では,JIS X 0221(国際符号化文字集合)に対応するものである。

     Aは,このISO/IEC 10646-Iのことで,文中にもあるようにUniversal Multiple-Octet Coded Chracter Setの頭文字をとったUSCコードとなる。
    UCSには,UCS-2とUCS-4がある。
     UCS-4の全体は4バイト構造からなり,一方,その一部の構成要素である群が実際に決まっている2バイト形式がUCS-2である。
     UCS-2はUnicodeに相当する。よってBは4バイトで,DはUnicodeとなる。

     Cについては,このUCS-2(1つの群)は,256の面(1面:256×256)から構成され,この1つの面が基本多言語面(BMP:Basic Multilingual Plane)と称される。
      Eに関しては,この基本多言語面は,アルファベット,記号類の約2万字,中国,日本,韓国の漢字,約2万字を統一したコードで管理する。
     Fでは,これらの国々の頭文字をとってCJK(Chinese,Japanese,Korean)統合の漢字となる。

     実際には,3国の同じ漢字に1つのコードをつけているため,正確な漢字が使用できない場合があり,1対1に対応した変換テーブルが必要になる。
     G はその一例で,Windowsでは言語の切り替えをロケールの機能で表示させている。
     ロケールは,言語環境のほかに,使用環境の国の日付,時刻,通貨単位の表記も扱う。
     参考までに,補足としてGDIはWindowsの描画インタフェイス,OLEはWindowsのアプリ間の連携機能,WorldScriptはMacintoshの多言語対応機能である。

     H,Iについては,このCJK漢字のなかにはJIS X 0208とJIS X 0212の漢字はすべて含まれているが,当然そのエンコーディングは全く異なるものである。

     UnicodeはJavaの標準文字コード,Windows NTの内部文字コードとして採用され,Macintoshでも採用予定である。
     また,Windows95は内部的にUnicodeであり,キーボードの入力時にはシフトJISとUnicodeの対応表で動作する。よってJは,Windowsとなる。




    【模範解答】
    A.(1),B.(2),C.(1),D.(4),E.(3),F.(3),G.(2),H.(3),I.(3),J.(1)


    【キーワード】
    JIS x 0221,Unicode,UCS,CJK統合漢字




(出典:月刊プリンターズサークル連載 1999年11月号記事より)

1999/11/19 00:00:00


公益社団法人日本印刷技術協会