第3・第4水準漢字の扱い方 |
「Windows
95」「Mac OS 〜9.x」「一部の
Unix」のような古いPC環境では、素の状態(PCを購入したまま)であれば第3・第4水準漢字などを含むフォント(※)は入っていません
→ Mac OS 8.5〜9.xを使用されている方はこちらのページをご覧下さい 第3・第4水準漢字などを含むフォントが入っていない古い環境では、第3・第4水準漢字などは文字抜け(半角の空白などに置き換わる)してしまうので読解不能な文章となってしまいます 「第1・第2水準実装外漢字」をネット上で扱う場合には、
・・・などの配慮を必ずして下さい(※1)
|
しかし、上記のような古いPC環境であっても、Microsoft や Apple などが Unicodeにおける第3・第4水準漢字などを含むフォント(※1)を無償配布していますので、それらをダウンロードしてくる(※2)事で、第1・第2水準実装外漢字が扱えるようになります
※1 第3・第4水準漢字だけではなく、世界中の主要言語の文字の包括した数万文字の文字集合を実装していますので、最新のPC環境を使用している方も、ぜひダウンロードしておきましょう
■ Unicode の種類について |
現在、おおまかに分類して4種類(と、その亜種が数種類)が制定されていますが、一般的に広く使用されているUnicodeエンコード方式は2種類だけです
主にネットワーク上で扱われているエンコード方式は、
「UTF-7」(7bit可変長code)
「Unicode 〜2.x」までしかサポートしておらず、もともと英語圏でのパソコン通信伝送路用に設定された特殊方式であるので、日本で用いられる事はまずありません
メールの場合については「半角英数がJIS(iso-2022-jp)互換のUTF-7の方が良いのでは?」と思われる方もいるかも知れませんが、Mac OS X の標準装備メールソフト(Mail.app)では「第1・第2水準実装外漢字」を含んだメール文章は自動的に「UTF-8」として処理され、「Netscape Mail & Newsgroups 7.x」でも「アクティブな文字コード」から「UTF-7」はディフォルト状態で除外されており、安易に「UTF-7」が使用されないようになっています
「UTF-8」(8bit(1オクテット)可変長code)
ホームページやメールでは、「Unicode(UTF-8)」を用います
半角英数はShift_JIS互換の8bit(1オクテット)、英語以外の欧州系文字などは16bit(2オクテット)、その他(ひらがな・カタカナ・漢字など)は24bit(3オクテット)で処理
・・・の2種類が存在しています
OSやアプリケーションで実装されるエンコード方式は、
「UTF-16」(16bit(2オクテット)可変長code)
Windows、Mac OS 〜9.x/Mac OS X ともにOS標準として採用しており、PC上で扱うUnicodeテキストファイルは、基本的に「Unicode(UTF-16)」を用います
(ただ単に「Unicode」と表記されている場合には、それは「Unicode(UTF-16)」を指します)半角英数も、ひらがな・カタカナ・漢字も、基本的には16bit(2オクテット)の実装水準「第00面」で処理、後から拡張された「使用頻度が低い記号類・漢字」や「少数民族文字」などは32bit(4オクテット)の実装水準「第01面」〜「第16面」で処理
「UTF-32」(32bit(4オクテット)固定長codec)
現時点では Sun Microsystems の「Solaris」のみがOS標準として採用しています
(「Solaris」以外のOSではほとんど用いられる事はありません)・・・の2種類が存在しています
■ 対応「日本語入力かな漢字変換辞書」 |
「第1・第2水準実装外漢字」を「 弓道辞書 」の力によって Unicodeエンコード文章上へダイレクトに変換出来る「日本語入力かな漢字変換辞書システム」は下記の種類に限られます
Microsoft IME | ATOK | ことえり | ||||||||
97・98 | 2000 | 2002 | Windows | Macintosh | Linux | 1・2 | 3・4 | |||
「通常版」での インストール時 |
「エキスパート版」での インストール時 |
11 | 12〜15 | 16 | ||||||
× | × | ○(※1) | ◎(※2) | ○(※1) | × | ○(※1) | ◎(※3) | ○(※1) | × | ◎(※3) |
※1 Unicodeの実装領域「第00面」のみ対応
※2 辞書データに登録されている漢字の変換についてはUnicodeの実装領域「第00面」〜「第16面」に対応していますが、ツールの「IMEパッド」の表示は実装領域「第00面」のみです
※3 Unicodeの実装領域「第00面」〜「第16面」に対応
なお、次期版の「 弓道辞書 」version 1.30 では、Microsoft IME 98/2000 対応版での「第1・第2水準実装外漢字」漢字変換に完全対応します
(Unicodeの実装領域「第00面」のみ対応)
また、「日本語入力かな漢字変換辞書システム」での漢字変換候補表示に用いられるフォントに第1・第2水準実装外漢字が含まれていなければ、漢字変換候補文字列の第1・第2水準実装外漢字は「・」「□」などと表示されます
「日本語入力かな漢字変換辞書システム」の漢字変換候補文字列は、「アプリケーション」の表示フォント設定が適用されます
アプリケーション上の未確定の変換文字列も、「アプリケーション」の表示フォント設定が適用されます
<Microsoft IME 2000〜 の場合>
「日本語入力かな漢字変換辞書システム」の漢字変換候補文字列は、「OS」の表示フォント設定が適用されます
アプリケーション上の漢字変換文字列は、「アプリケーション」の表示フォント設定が適用されます
(アプリケーション上の未確定の変換文字列の表示フォントを特定のフォントに指定する事も出来ます)<ATOK の場合>
「日本語入力かな漢字変換辞書システム」の漢字変換候補文字列は、「ATOK」の表示フォント設定が適用されます
アプリケーション上の未確定の変換文字列は、「アプリケーション」の表示フォント設定が適用されます
第1・第2水準実装外漢字を扱うには、Unicode対応アプリケーションソフトにて「Unicode(UTF-8)エンコードモード」や「Unicode テキストドキュメントモード」(=UTF-16)などとなっている状態でなければ扱う事が出来ません
なお、 「Unicode」として「第3水準漢字」「第4水準漢字」を完全に扱うには、対応フォントがインストールされているだけで無く、OSとアプリケーションの両方がUnicodeの実装領域「第00面」〜「第16面」にそれぞれ対応している必要があります≫ Unicodeの実装領域「第00面」のみでは、「第3水準漢字」「第4水準漢字」のうちのUnicodeの実装領域「第02面」に実装されている「第3水準漢字」19文字と「第4水準漢字」283文字は扱う事が出来ません
≫ 「Unicode 3.1」対応フォントでは、Unicode 3.2で定義された「第3水準漢字のうちの一部非漢字部分」の、Unicodeの実装領域「第00面」に実装されている数十文字は入っていません
「第3水準漢字のうちの一部非漢字部分」を完全に扱うには、「Mac OS X 10.1〜」に標準添付されている「ヒラギノ Pro OpenType Font」や、「Habian2000u TrueType Font」といった「Unicode 3.2」対応フォントである必要があります
OSについては、
アプリケーションについては、
|
ブラウザソフトでは、
「Internet Explorer 4.0〜」(※1)
「Netscape Navigator 4.x」(※2)
「Netscape 6.0〜」(for Mac OS 〜9.x/ Linux)「Opera 6.x/7.x」(5.0〜?)
縦書きブラウザ「影鷹」(※3)
・・・では、Unicodeの実装領域「第00面」のみ対応
・・・では、Unicodeの実装領域「第00面」〜「第16面」に対応
ただし、Unicode対応アプリケーション上で「 弓道辞書 」を使用していても、
アプリケーションの一部にShiht_JISに依存する部分のある古い設計のアプリケーションでは、「第1・第2水準実装外漢字」を変換しようとしても「?」(半角のQestion Mark)と出力されます
Microsoft「Office v.X」(for Mac OS X 10.1〜) (「Word for Mac」「Excel for Mac」)の仕様上、 ことえり3やATOK14〜などの日本語入力かな漢字変換辞書システムからは「Unicode 2.1 UCS」文字集合に実装さている文字しか正常に出力出来ず、「CJK Unified Ideographs Extension A」や「CJK Unified Ideographs Extension B」を出力しようとしても文字化けします
(既存ファイルからの読み込みでは、「CJK Unified Ideographs Extension A」や「CJK Unified Ideographs Extension B」が正常に表示出来ます)・・・などのアプリケーション固有の仕様/制約により「第1・第2水準実装外漢字」を「 弓道辞書 」の力によって出力出来ない場合もありますし、
Unicode(UTF-8)カーネル(※1アプリケーション)の場合は、「Windows 95/98/Me」「Mac OS 〜9.x」にてUnicodeで日本語を表記する場合、「第00面」実装境域においては「日本語入力かな漢字変換辞書システム」ではUnicode(UTF-16)カーネル(※1)のため『16ビット(2オクテット)』として処理・出力されるのに対し、Unicode(UTF-8)カーネル(※1アプリケーションでは『24ビット(3オクテット)』としてデータ処理されますが、「Windows 95/98/Me」「Mac OS 〜9.x」の場合には、OSネイティブで『16ビット(2オクテットのエンコードデータ)』と『24ビット(3オクテット)エンコードデータ)』との変換テーブルを持たず、OSカーネルの「Shift_JIS」が変換の中間に介在する構造となっているおり、「Shift_JIS」で扱えないデータは欠落するため「?」(半角のQestion Mark)と出力されます
・・・などのOS固有の仕様/制約により「第1・第2水準実装外漢字」を「 弓道辞書 」の力によって出力出来ない場合もあります
※1 「Micorosoft Internet Explorer」「Netscape 6.0〜」など、Unicode対応のブラウザソフトなどのHTML関連の多くはUnicode(UTF-8)カーネル
「Microsoft Word 98〜」「JUSTSYSTEM 一太郎」「Sun Microsystems StarSuite 7.x」(※)「OpenOffice.org 1.x」(※2)などのUnicode対応ワープロソフトのほとんどがUnicode(UTF-16)カーネル
≫ 「Windows NT4.0SP4~/2000/xp」「Windows Server 2003」「Mac OS X」では、『16ビット(2オクテットのエンコードデータ)』と『24ビット(3オクテット)エンコードデータ)』との変換テーブルが存在するため、比較的新しいUnicode(UTF-16)/Unicode(UTF-8)のカーネルの違いに関係無くダイレクトに変換する事が出来ます
※2 ・「Sun Microsystems StarSuite
6.x/7.x」(Windows版、Linux/Intel版、Solaris/SPARC版)
・「OpenOffice.org 1.x」(Windows版、Linux/Intel版、Linux/PowerPC版、Solaris/SPARC版、Solaris/Intel版、FreeBSD版、Debian版、Mac OS X X11版(X11 for MacOS X などの FreeBSD X11カーネルのインストールが必要)、Mac OS X Java派生版)
これらは「Microsoft Office ドキュメントファイル」と非常に高精度なファイル互換性を持ち、多機能(一太郎ファイルコンバータ/豊富なテンプレート/Unicode 2.1 UCS文字集合実装フォントなどが付属)版の「Sun Microsystems StarSuite 7.x」は5台までのPCへインストール可能で9800円で販売、「OpenOffice.org 1.x」は付加機能やメーカーサポートなどが無い代わりに無償配布されています また、「ワープロソフト」や「表計算ソフト」だけで無く、「Microsoft Office Personal」には入っていない「ホームページ作成支援ソフト」「数式エディタソフト」「ドローソフト」までセットになっているだけで無く、「Sun Microsystems StarSuite 7.0」「OpenOffice.org 1.1.0」からは「PDF形式(Acobe Acrobat)ファイルへのエクスポート」(※)や、ドローソフトやプレゼンテーションソフトでの「swf形式(Macromedia Flash)ファイルへのエクスポート」などもサポートしています
|
また、「Unicode対応」と謳っているフリーソフトの中には、Shift_JISカーネルの設計のため、Unicodeエンコードファイルを開く事は出来ても「非漢字+第1・第2水準漢字文字集合」+「機種依存文字」の範囲の文字しか表示する事が出来ず、「第1・第2水準実装外漢字」については「?」(半角のQestion Mark)としてしか表示出来ない誇大広告なシロモノが非常に多いため、注意が必要です
(その一方で、Unicodeに関して何ら説明の無いフリーソフトであっても、Unicodeの実装領域「第00面」〜「第16面」にフルに対応しているシロモノもあったりします)
Windows の場合には、台湾の研究機関が開発した「文字字形自動生成テキストエディタ」や「Internet Explorer用文字字形自動生成プラグイン」を使用すると、「Unicode UCS文字集合」対応フォントがインストールされていないPCでも、「Unicode 3.2 UCS文字集合+α」の83232文字以上が扱えるようになります
■
「易符動態組字編輯器 eForth Composite
Glyph Editor」
1.01 (文字字形自動生成テキストエディタ) |
「Windows 98/Me/NT4.0SP4~/2000/xp」「Windows Server 2003」対応フリーソフト(無償配布)
補足 |
|
ダウンロードファイル データ量 |
1.39MB(zip 形式圧縮・・・解凍ソフトが別途必要です)
|
作者 | 易符智慧科技 eForth tecnology |
入手先 | http://www.eforth.com.tw/efeditor/ |
■
「易符 IE 工具列元件」(eForth Bar) (Internet Explorer用文字字形自動生成プラグイン) |
「Windows
NT4.0SP4~/2000/xp」「Windows
Server 2003」対応フリーソフト(無償配布)
(Windows 95/98/Me
ではインストール出来ません)
補足 | |
ダウンロードファイル データ量 |
263KB(zip 形式圧縮・・・解凍ソフトが別途必要です)
|
作者 | 易符智慧科技 eForth tecnology |
入手先 | http://www.eforth.com.tw/efeditor/ |
■ クリップボードを介在させての文字のコピーについて |
Unicodeで日本語を表記する場合、「第00面」実装境域においては「UTF-16では16ビット(2オクテット)」「UTF-8では24ビット(3オクテット)」となるため、Windows 95/98/Me の場合にはフォントデータ的には同一の文字ではあっても、PC内部での文字符号データ的には「別物」として扱われ、クリップボードによって第1・第2水準実装外の漢字のUnicodeカーネルアプリケーション同士で移植しようとしても、第1・第2水準実装外漢字が「?」(半角のQestion Mark)に置き換わる」であるとか「半角英数文字のみ正常に表示、それ以外は文字化け」などとなる場合(※1)も多々発生します
≫ その場合には、一度「Outlook Expless」(※2)や「Netscape Composer」(※)の「Unicode(UTF-8)エンコードモード」設定時(下記参照)での「新規メッセージ」本文入力欄に貼り付けてから、再度クリップボードでコピー→ペーストし直すという工程を取ると、第1・第2水準実装外漢字も正常にコピーされます
※ <重要> リッチテキスト(HTML)形式対応メールソフト自体が持つセキュリティ面の問題については、「 インターネットにおけるセキュリティ問題について 」 をご覧下さい
≫ 「Windows NT4.0SP4~/2000/xp」「Windows Server 2003」「Mac OS X」では、『16ビット(2オクテットのエンコードデータ)』と『24ビット(3オクテット)エンコードデータ)』との変換テーブルが存在するため、比較的新しいUnicode(UTF-16)/Unicode(UTF-8)のカーネルの違いに関係無くクリップボードを介在させて第1・第2水準実装外漢字をコピーさせる事が出来ます
≫ いわゆる「クリップボード履歴」「クリップボード拡張」アプリケーションについては、
「CLISM」for Windows
Unicode対応
(Windows 95/98/Me の場合には、コピーすると「CLISM」上では「第1・第2水準実装外漢字」は「?」(半角のQestion Mark)として表示されますが、貼り付けの際には「第1・第2水準実装外漢字」が出力されます)
「CLCL」for Windows
バイナリデータとしてUnicodeを処理します
(コピーすると「CLCL」上では「第1・第2水準実装外漢字」はテキストデータとして表示されませんが、貼り付けの際には「第1・第2水準実装外漢字」が出力されます)
「Maclip」for Windows
リッチテキスト(rtf)データとしてのみ「第1・第2水準実装外漢字」を処理します
(コピーすると、「Maclip」上では「?」(半角のQestion Mark)として表示され、通常のテキストデータとしては「第1・第2水準実装外漢字」を処理出来ませんが、リッチテキスト(rtf)対応アプリケーション上へ貼り付けると「第1・第2水準実装外漢字」が出力されます)・・・が「第1・第2水準実装外漢字」に対応している事を確認しています
(ただし、Windows 95/98/Me の場合にはコピー元と張り付け先のアプリケーションのカーネルの違いなどにより、出力が「?」(半角のQestion Mark)となるケースもあります)
■ Windows に標準で装備されているUnicode対応アプリケーションソフトでの使用例 |
■ 「メモ帳」(NotePad) |
Windows 95/98/Me のメモ帳はUnicode非対応
Windows NT4.0/2000 のメモ帳はUnicodeの実装領域「第00面」のみ対応
Windowsxp・Windows Server 2003 のメモ帳はUnicodeの実装領域「第00面」〜「第16面」に対応
■ 「ワードパッド」(WordPad) |
Windows 95 のワードパッドはUnicode非対応
素の状態での Windows 98/NT4.0 のワードパッドは Unicode 2.1 UCS文字集合しか対応していませんが、Microsoft IME 2000〜 がインストールされると、Unicodeの実装領域「第00面」対応となります
≫ ディフォルト状態での Windows 98/NT4.0 のワードパッドを制御している「riched32.dll」(Windows 95/NT Rich Text Edit Control 4.0)は、Unicode 2.1 UCS文字集合しか対応出来ず、Unicodeの実装領域「第00面」の文字であっても、Unicode 3.0で規定された「CJK Unified Ideographs Extension A」や、Unicode 3.2で規定された歯科記号「U+23BE〜U+23CC」では表示が「・」となります
(Unicode 3.2で規定されたアイヌ語表記用小文字カタカナ「U+31F0〜U+31FF」やアイヌ語表記/鼻濁音のが行・ガ行の発音表記文字(半濁音付きのか行・カ行)表記用半濁音記号「U+309A」では、ディフォルト状態での Windows 98/NT4.0 のワードパッドでも、もしかしたら表示可能かも)≫ Microsoft IME 2000 は、「日本語入力かな漢字変換辞書システム」の他に「riched20.dll」(Microsoft Rich Text Edit Control, v3.0 5.30.23.1200)も含んでおり、「riched20.dll」が制御するワードパッドでは、Unicodeの実装領域「第00面」対応となります
(「Microsoft IME 2000 Service Release 1 アップデート プログラム」+「Microsoft IME 2000 Service Release 1 Global IME 問題修正プログラム アップデート」のインストールを推奨)
Windows Me/2000 のワードパッドはUnicodeの実装領域「第00面」のみ対応
≫ Windows Me/2000 は、標準で Microsoft IME 2000 が入っています
(「Microsoft IME 2000 Service Release 1 アップデート プログラム」+「Microsoft IME 2000 Service Release 1 Global IME 問題修正プログラム アップデート」のインストールを推奨)
Windowsxp・Windows Server 2003 のワードパッドはUnicodeの実装領域「第00面」〜「第16面」に対応
≫ Windowsxp・Windows Server 2003 の「riched32.dll」は「Wrapper Dll for Richedit 1.0」となり、OSの中枢部分である「user32.dll」(Windows XP/2003 USER API Client DLL)によってワードパッドも制御する方法を採用しています
■ 「Outlook Express」 |
<重要> リッチテキスト(HTML)形式対応メールソフト自体が持つセキュリティ面の問題については、「 インターネットにおけるセキュリティ問題について 」をご覧下さい
これでUnicode(UTF-8)エンコードモードになりました
第1・第2水準実装外漢字が入力出来る状態になっています(※)
※ Windows 95/98/Me 上の「Outlook Express」では、基本的には Unicode 3.0 UCS文字集合 の文字しか扱えません
≫ Unicodeの実装領域「第00面」の文字であっても、Unicode 3.2で規定されたアイヌ語表記用小文字カタカナ「U+31F0〜U+31FF」やアイヌ語表記/鼻濁音のが行・ガ行の発音表記文字(半濁音付きのか行・カ行)表記用半濁音記号「U+309A」は扱う事が出来ますが、同じくUnicode 3.2で規定された歯科記号「U+23BE〜U+23CC」では表示が「・」となります
あとは通常通りの操作でメールを送信しましょう
< 注 意 事 項 >
メールの日本語標準エンコード方式は「JIS(iso-2022-jp)」となっています
受信側の方が「Unicode(UTF-8)対応メールソフト」を使用していなければ、メール文章は文字化けしてしまいます先方のメールソフトの対応エンコード方式を事前に確認しておきましょう
<主な「Unicode(UTF-8)対応メールソフト」>
「Outlook Express」
「Microsoft Outlook 98〜」
「Netscape Messenger 4.x」
「Opera 6.x/7.x」(5.0〜?)
「Mac OS X 10.0 標準装備メールソフト」(Mail.app)
・・・などでは、Unicodeの実装領域「第00面」対応
「Microsoft Outlook version 2002/Microsoft Office Outlook 2003」
「Mac OS X 10.1〜 標準装備メールソフト」(Mail.app)
・・・などでは、Unicodeの実装領域「第00面」〜「第16面」に対応
<主な「Unicode(UTF-8)非対応対応メールソフト」>
「PostPet(1.x/2.x)」(PostPet V3は不明)
「Microsoft Internet Mail」(「Internet Explorer 3.x」付属)
「Netscape Communicator 〜3.x」(「Netscape Navigator 〜3.x」付属)
携帯電話のメール機能
送信されてきたメールの差出人が使用している 送信されてきたメールの「ヘッダ」(メールソフトとメールサーバーとがやり取りする情報)には、メールの差出人が使用しているメールソフトの種類が基本的には記入されていますので、メールソフトで「ヘッダ」を表示して、先方のメールソフトが「Unicode(UTF-8)エンコードメール」に対応しているかどうか事前に確認しておきましょう |
■ 「ホームページ」での Unicode エンコードについて |
ホームページ作成支援ソフトがUnicode対応(※1)、かつ文字コード選択をUnicode(UTF-8)とすれば、Unicode(UTF-8)エンコードのHTML文章を作成出来ます
※1 有名処では・・・
<Unicode非対応>
「Macromedia Dreamweaver 〜4.0」
<Unicode対応(実装領域「第00面」対応)>
「Adobe Golive 5.0/6.0/CS」
(実装領域「第01面」〜「第16面」については不明)「Microsoft FrontPage 98/2000」
(実装領域「第01面」〜「第16面」非対応)「IBM Homepage Builder 2001(5.0)/6.0/7.0」
(実装領域「第01面」〜「第16面」については不明)「Netscape Navigator 4.x」の「Netscape Composer」(Netscape Navigatorに標準装備のホームページ作成支援機能)
(実装領域「第01面」〜「第16面」非対応)「Netscape 6.x」・「Netscape 7.0〜」(for Mac OS 9.x/Linux)の「Netscape Composer」(Netscapeに標準装備のホームページ作成支援機能)
(実装領域「第01面」〜「第16面」非対応)<Unicode対応(実装領域「第00面」〜「第16面」対応)>
「Microsoft FrontPage version 2002/Microsoft Office FrontPage 2003」
「Netscape 7.0〜」(for Windows/Mac OS X)の「Netscape Composer」(Netscapeに標準装備のホームページ作成支援機能)
<不明>
「Macromedia Dreamweaver MX/MX2004」
「Macromedia Contribute」
■ 「ブラウザソフト」と「フォント」の多言語処理方法について |
■ 「Internet Explorer/Outlook Express」(for Windows) の場合 |
文字化けの発生を出来る限り抑える事を目的として、フォントに組み込まれている「CodePage」値によって表示に用いるフォントを絞り込む手法を採用しています
日本語の言語切り替え型エンコード方式(「Shift_JIS」「EUC(euc-jp)」「JIS(iso-2022-jp)」)で記述した文章で表示に用いる事が可能なフォントは、「932」(932 JIS/Japan もしくは 932 JIS/Japan Windows OEM Character Set)の「CodePage」値が組み込まれているフォントのみです
また、Unicode で記述した文章で表示に用いる事が可能なフォントについても、日本語OS上の「日本語版Internet Explorer/Outlook Express for Windows」では「932」の「CodePage」値が組み込まれているフォント(と、その設定されたTrueType FontからFont LinkされているTrueType Font(.ttf/.ttc))に限られ、「Simsun」「Simsun-18030」「Simsun (Founder Extended)」 などといった「932」の「CodePage」値が組み込まれていないフォントを用いてUnicodeエンコードページを表示させる事が不可能です
(中国系の「Unicode UCS 文字集合対応フォント」のうち、「932」の「CodePage」値が組み込まれているフォントは少数です)≫ 「Microsoft Font properties extension」(Windows用フリーソフト)をインストールする事によって、TrueType Font(.ttf/.ttc)やOpenType Font(.otf)に組み込まれている「CodePage」値を見る事が出来ます
≫ 「Windows 2000/xp」「Windows Server 2003」の場合には、Font Link機能を利用して「第1・第2水準実装外漢字に対応したフォント」を「MS ゴシック」「MS Pゴシック」や「MS 明朝」「MS P明朝」などのTrueType Font(.ttf/.ttc)にリンクさせると、リンクさせたTrueType Fontフォントとしてシームレスに、「932」の「CodePage」値が組み込まれていないるTrueType Font(.ttf/.ttc)であっても「第1・第2水準実装外漢字に対応したTrueType Font」に実装された「Unicode UCS」文字集合が表示されるようになります
(リンク元のフォントでコードポイントが空白となっている部分に、リンク先のTrueType Font(.ttf/.ttc)で実装されているコードポイントの文字が代用される形となります)
「第1・第2水準実装外漢字を実装し、「932」の「CodePage」値が組み込まれている、Microsoft謹製フォント」(「Arial Unicode MS」TrueType Font など)がPCに正しく(=Microsoftによるセットアップウィザードプログラムによって)インストールされれば、表示すべき第1・第2水準実装外漢字が表示設定フォントに実装されていない場合、表示すべき第1・第2水準実装外漢字の部分だけブラウザソフトが自動的に表示すべき第1・第2水準実装外漢字を実装したフォントに置き換えて表示してくれるようにレジストリ(PCの設定情報データベース)へ書き加えられます
※ HTML文章でfontタグとかCSS(スタイルシート)によってfont-famiryとして「第1・第2水準実装外漢字に対応したOpenType Font」の種類を指定しても、「CJK Unified Ideographs Extension A」の文字は空白となります
※ 「Internet Explorer/Outlook Express for Windows」の「インターネットオプション」窓のフォント設定では設定項目に OpenType Font(.otf) のフォント名は出てきません
≫ 「Windows 2000/xp」「Windows Server 2003」のFont Link機能が機能するのはTrueType Font(.ttf/.ttc)同士の組み合わせの場合のみで、TrueType Font(.ttf/.ttc)とOpenType Font(.otf)の組み合わせの場合やOpenType Font(.otf)同士の組み合わせの場合には機能しません
■ 「Netscape 6.0〜」や「Opera 7.1〜」の場合 |
表示すべき第1・第2水準実装外漢字が表示設定フォントに実装されていない場合、表示させるPCの側に「第1・第2水準実装外漢字に対応したTrueType Font(※)フォント」が何か一つでも入っていれば、表示すべき第1・第2水準実装外漢字の部分だけブラウザソフトが自動的に表示すべき第1・第2水準実装外漢字を実装したフォント(※)に置き換えて表示してくれます
※ 「Windows版Netscape 〜7.0.x」では、OpenType Font(.otf) には置き換えてくれません
(「Netscape 7.1」から不具合が訂正されています)≫ 「Windows版Netscape 〜7.0.x」の場合、 OpenType Font(.otf) を用いて正常に表示させる事が出来ません
(OpenType Font(.otf) では半角英数文字以外の表示が部分的に文字化けする場合があります)
(「Netscape 7.1」から不具合が訂正されています)
■ 「Netscape Navigator 4.x」や「Opera 6.x/7.0〜7.03」の場合 |
表示すべき第1・第2水準実装外漢字が表示設定フォントに実装されていない場合でも、ブラウザソフトが自動的に表示すべき第1・第2水準実装外漢字を実装したフォントに置き換えて表示するという機能はありません
そのため、
HTML文章を記述する側のヒトが、HTML文章でfontタグとかCSS(スタイルシート)によってfont-familyとして「第1・第2水準実装外漢字に対応したフォント」の種類を指定させる
≫ 「Netscape Navigator 4.x」の場合、フォント指定は「半角英数文字だけのフォント名」のモノしか適用されません
(全角文字を含むフォント名のフォントは無視されます)≫ 「Opera」の場合もフォント指定が確実に働くとは言い難い状況ですが、何が原因でフォント指定の実行の有効・無効を決めるのか、かなり不可解です・・・
見る側のヒトがブラウザソフトの設定を「第1・第2水準実装外漢字に対応したフォント」に変更する
見る側のPCが「Windows 2000/xp」「Windows Server 2003」の場合には、見る側のヒトがFont Link機能を利用して、日本語フォントとしてシームレスに「第1・第2水準実装外漢字に対応したフォント」の文字も表示されるようにする
・・・などの手間を掛ける必要があります
しかし、「CJK Unified Ideographs Extension A」を実装している TrueType Font(.ttf/.ttc) や OpenType Font であれば、Unicodeエンコードページの「CJK Unified Ideographs Extension A」の漢字を表示させる事が出来ます
≫ フォント指定が無視される場合であっても、ブラウザソフトの『設定』にて「CJK Unified Ideographs Extension A」を実装しているフォントに手動で切り替えれば表示する事が出来ます
■ 「Microsoft Word 98/2000」での 「HTML形式保存ファイル」について |
しかし、「Microsoft Word 98/2000」でのHTML形式保存というものは、ネット上にホームページとして公開するためのHTML文章作成を目的としたモノでは無く、HTML形式を使用しながらWord形式(.doc)での文章と出来る限り同一のように再現する事を目的としているため、文字の一つ一つにまで文字属性やレイアウトの詳細なデータが付与されています
よって、ホームページ作成支援ソフトによって作成されるHTML文章ファイルの数倍〜数十倍ものデータサイズに肥大するため、「Microsoft Word 98/2000」でのHTML形式保存によって作成したHTML文章をネット上にホームページとして公開するのは好ましくありません、・・・というか迷惑です!
であるので、Microsoft が無償配布している「HTML Filter 2.1 for Office 2000」や「HTML TIDY」- (日本語版・GUIフロントエンド)などを利用しましょう
「HTML Filter 2.1 for Office 2000」ページからの引用 Office HTML Filter は、HTML (Hypertext Markup Language) 形式で保存した Office 2000 文書に埋め込まれている Office 固有のマークアップ タグを削除するためのツールです。Office 2000 で HTML 文書を作成すると、Office 固有のマークアップ タグが埋め込まれます。これらのタグがあると、編集の「ラウンドトリップ」をすることができます。たとえば、Word 2000 で作成した文書を HTML 形式で保存した場合に、これらのタグが埋め込まれていると、その文書を Word 2000 で再度開いたときに文書を作成したときと同じ書式設定、編集状態などが再現されます。 Office HTML Filter を使用すると、Word 2000 または Excel 2000 で HTML 文書の編集を完了した後で、最終的な HTML 文書から Office 固有のマークアップ タグを削除できます。タグを削除すると文書のサイズが小さくなるので、Web サーバー上の格納領域が少なくなり、ページのダウンロードにかかる時間も短くなります。 Office 固有のマークアップ タグを削除した場合のメリットとデメリットに関する詳細については、「Office HTML Filter を使用して短時間でダウンロードできる Web ページを作成する」を参照してください。
|
なお、「Microsoft Word version 2002/Microsoft Office Word 2003」では、を選択→「ファイルの種類」窓で「Web ページ」を選択すると文字の一つ一つにまで文字属性やレイアウトの詳細なデータが付与されたHTMLファイルとして保存され、を選択→「ファイルの種類」窓で「Web ページ (フィルタ後)」 を選択すると、ホームページ用途に最適なHTMLファイルが保存出来るようになっています
もしくは、「Microsoft Word 〜2000」は使用しないで、「Netscape 6.0〜」の「Netscape Composer」(Netscapeに標準装備のホームページ作成支援機能)や、「市販のホームページ作成支援ソフト」を利用してホームページを作っておいたほうが、後になってラクなのでは無いかと思われます・・・
■ 既存のホームページを「Unicodeエンコード」へ変換するには |
Shift_JISなどの既存のHTML文章を「Unicode(UTF-8)」に変換するには、下記のようなエンコード相互変換ソフトを使用すると非常に効率的です
■
「MultiTextConverter」Version 2.0.5 for
Windows 「MultiTextConverter」Version 3.2.0 for Mac OS 〜9.x/Mac OS X |
対応改行コード (取扱説明書から抜粋) |
|
||||||||||||||||||||
対応エンコード (取扱説明書から抜粋) |
|
||||||||||||||||||||
特徴 |
|
||||||||||||||||||||
ダウンロードファイル データ量 |
Version 2.0.5 for Windows :
268KB (zip 形式圧縮版) ※ zip 形式圧縮 (解凍ソフトが別途必要です) Version 3.2.0
for Mac OS 〜9.x/Mac OS X :
579KB(sit 形式圧縮版)
|
||||||||||||||||||||
作者 | 林晃 さん | ||||||||||||||||||||
入手先 | http://www1.odn.ne.jp/soft/mtc.html |
■ Unicodeの「CJK Unified Ideographs Extension B」の文字を入力するには |
現在の時点では、「Microsoft IME」「ATOK for Windows」「ATOK 〜15 for Mac OS/Mac OS X」「ATOK X Linux」などの「日本語入力かな漢字変換辞書システム」の文字一覧表では、いずれも Unicodeの実装領域「第00面」しか表示出来ません
≫ 「ATOK 16 for Mac OS X 10.1〜」や、Mac OS X 10.1/10.2に標準装備の「ことえり3」・Mac OS X 10.3に標準装備の「ことえり4」では、文字一覧表にUnicodeの実装領域「第02面」の「CJK Unified Ideographs Extension B」の文字も表示出来ます
そのため、Mac OS X 10.1〜以外の環境で「CJK Unified Ideographs Extension B」の文字をアプリケーション上に入力するには、「日本語入力かな漢字変換辞書システム」以外のツールなどを利用する事になります
<方法1>
下段に記述している「The Unicode Consortium」の文字検索で検索、Unicode(UTF-8)で表示された「CJK Unified Ideographs Extension B」の文字データ(※)をクリップボード経由でコピー&ペースト※ 「CJK Unified Ideographs Extension B」の該当する文字を含むフォントがPCにインストールされていない状態や、インストールされていてもブラウザソフト上で使用出来る条件に適合していない状態では、
Internet Explorerの場合には「・」
「Netscape 6.0〜」の場合には「??」
・・・と表示されます
<方法2>
Windowsの場合、上段に記述している「文字字形自動生成テキストエディタ」の文字検索機能で検索、エディタ本体の文章表示部に表示された「CJK Unified Ideographs Extension B」の文字をクリップボード経由でコピー&ペースト
■ 公的機関リンク |