「 第3・第4水準漢字の基礎知識 」 |
日本工業規格(JIS)が定めている「第1水準漢字」「第2水準漢字」については、とくに難しい事を考えなくともPCやネット上で扱う事が出来ますが、「第3水準漢字」「第4水準漢字」「第1〜4水準実装外漢字」を扱うためには、下記の「文字集合」「エンコード」「フォント」の3つの要素によってPCやネット上の文章が成り立っているという事を認識しておく必要があります |
● 「文字集合」 扱う事の出来る文字の種類とその文字数を制定したモノ |
Windows での標準として採用されている「Windows Character Set」(非漢字+第1・第2水準漢字+IBM拡張文字=6879文字+α)
Unix での標準として採用されている「JIS X 0208:1983」文字集合(非漢字+第1・第2水準漢字=6355文字)、「JIS X 0208:1997」文字集合(非漢字+第1・第2水準漢字=6879文字)
Windows 98/Me (Microsoft Word 98〜をインストールしたWindows 95 を含む)・Windows NT4.0SP4〜/2000/xp・Windows Server 2003 や、一部のUnix で採用されている「Windows Extension Character Set」=「JIS X 0208:1997+JIS X 0212:1990」文字集合(非漢字+第1・第2水準漢字+補助漢字=12934文字)
- 「Adobe GB1-4」(※)対応TrueType Font や「Adobe GB1-4」(※)対応OpenType Font がインストールされた Windows にて導入される「Adobe GB1-4」(※)文字集合(Unicode 3.0 UCS文字集合の漢字部分の全て・・・Unicode 3.0 の範囲内での日本語表示に完全対応しています=29063文字)
※ Adobe Solutions Network Technical Notes - Fonts
- 「Microsoft Officexp/Office 2003 Editions」+「Unicode 3.1 UCS」文字集合サブセット(profiling)対応フォントがインストールされた Windows NT4.0/2000/xp・Windows Server 2003 にて導入される「Unicode 3.1 UCS」文字集合(70195文字−α)
- Windows 98/Me/NT4.0SP4~/2000/xp・Windows Server 2003 上の「文字字形自動生成テキストエディタ」で扱える「Unicode 3.2 UCS文字集合+α」(83232文字以上)
- 「Internet Explorer用文字字形自動生成プラグイン」をインストールした、Windows NT4.0SP4~/2000/xp・Windows Server 2003 上のInternet Explorerで扱える「Unicode 3.2 UCS文字集合+α」(83232文字以上)
Mac OS 〜9.x/Mac OS X での標準として採用されている「Mac Japanese」文字集合(非漢字+第1・第2水準漢字+Apple拡張文字=6879文字+α)
Mac OS X 10.0 で採用されている「Adobe Japan1-4」(※)文字集合(=15444文字)
Mac OS X 10.1 で採用されている「AGPS(Apple Publishing Glyph Set)(仮)」(非漢字+第1〜第4水準漢字+Adobe Japan1-4+電算写植文字)=20298文字)
Mac OS X 10.2 で採用されている
「Adobe Japan1-5」(※)文字集合(「AGPS(Apple Publishing Glyph Set)(仮)」+国語審議会「表外漢字字体表」新規制定文字+その他)=20317文字)
「Adobe GB1-4」(※)文字集合(Unicode 3.0 UCS文字集合の漢字部分の全て=29064文字)
※ Adobe Solutions Network Technical Notes - Fonts
- Mac OS X Language Support Updates: Software Download をインストールした「Mac OS X 10.1.5〜」にて導入される「Unicode 3.2 UCS」(71216文字?)
↑:「Unicode対応アプリケーション」や「Unicode UCS 文字集合対応フォント」を別途インストールする事で、扱う事が出来る文字集合をさらに拡張させる事が出来ます
「Unicode 2.1 UCS」(38887文字)
「Unicode 3.0 UCS」(49194文字)
「Unicode 3.1 UCS」(70195文字)
「Unicode 3.2 UCS」(71216文字)
「Unicode 4.0 UCS」(72442文字)・・・など
なお、「UCS」とは国際符号化文字集合(Universal Multiple-Octet Coded Character Set)の意味です
● 「エンコード」 PCやネット上で文章を扱うための電子符号化方法 |
Windows 95/98/Me や Mac OS 〜8.x 上の文章で標準として採用されている「Shift_JIS」
≫ 扱える文字集合=非漢字+第1・第2水準漢字 (+機種依存文字)=6879文字 (+α)
Windows NT4.0/2000/xp や Mac OS 9.x/Mac OS X 上の文章で標準として採用されている「Unicode(UTF-16)」
≫ 扱える文字集合=「Unicode 〜3.0 対応アプリケーション」(最大49194文字)
「Unicode 3.1〜対応アプリケーション」(70195文字〜)(インストールされているフォントが「Unicode 3.2〜 UCS」であれば、その対応文字集合が上限)
電子メールでの文章で標準として採用されている「JIS(iso-2022-jp)」
≫ 扱える文字集合=非漢字+第1・第2水準漢字 (+機種依存文字)=6879文字 (+α)
Unix 上の文章で標準として採用されている「EUC(euc-jp)」
≫ 扱える文字集合=半角カタカナを除く非漢字+第1・第2水準漢字=6879文字 (−α)
一部のUnix 上の文章で採用されている「EUC(euc-jp-3)」
≫ 扱える文字集合=非漢字+第1・第2水準漢字+補助漢字=12934文字
・・・など
● 「フォント」 | 電子符号化された文章をディスプレイやプリンタで 表示するために必要な「文字字形データ」を収録した データ集合ファイル |
Windows に入っている「MS ゴシック」「MS Pゴシック」「MS UI Gothic」「MS 明朝」「MS P明朝」などに実装されている文字集合は、
≫ Windows 95 では「Windows Character Set」(非漢字+第1・第2水準漢字+IBM拡張文字=6879文字+α)を実装
≫ Windows 98/Me (Microsoft Word 98〜をインストールしたWindows 95 を含む)・Windows NT4.0SP4〜/2000/xp では「Windows Extension Character Set」=「JIS X 0208:1997+JIS X 0212:1990」文字集合(非漢字+第1・第2水準漢字+補助漢字=12934文字以上)(※)をUnicode実装
※ 上記フォントのバージョンが上がるにつれ、「その他」の部分の文字数がより多く実装されているようです
Mac OS 〜9.x / Mac OS X の両方に入っている「Osaka」「平成明朝」「中ゴシックBBB」などに実装されている文字集合は、
≫ 「Mac Japanese」文字集合(非漢字+第1・第2水準漢字+Apple拡張文字=6879文字+α以上(※)を実装
※ 上記フォントのバージョンが上がるにつれ、「その他」の部分の文字数がより多く実装されているようです
Mac OS X に入っている「ヒラギノ明朝 Pro W3」「ヒラギノ明朝 Pro W6」「ヒラギノ角ゴシック Pro W3」「ヒラギノ角ゴシック Pro W6」「ヒラギノ丸ゴシック Pro W4」などに実装されている文字集合は、
≫ Mac OS X 10.0 では「Adobe Japan1-4」文字集合(=PostScript実装15444文字字形、Unicode実装9772文字)を実装
≫ Mac OS X 10.1 では「AGPS(Apple Publishing Glyph Set)(仮)」文字集合(=PostScript実装20298文字字形、Unicode実装約13600文字)を実装
≫ Mac OS X 10.2 では、
ヒラギノProフォントは「Adobe Japan1-5」文字集合(=PostScript実装20317文字字形、Unicode実装約13600文字)を実装
簡体中文フォントは「Adobe GB1-4」文字集合(29064文字)を実装・・・ 「华文细黑」 「华文黑体」 「华文宋体」 「华文楷体」 「华文仿宋」
(↑:Unicode 3.0 の範囲内での日本語表示に完全対応しています)
■ 第3水準漢字・第4水準漢字とは? |
2000年(平成12年)1月、日本工業規格
JIS X 0213:2000『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』
が官報告示されました これは従来の JIS漢字規格(JIS X 0208:1997)『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』(非漢字524文字、第1水準漢字2965文字、第2水準漢字3390文字の計6879文字)に、第3水準漢字(記号類661文字含む)1908文字、第4水準漢字2436文字という形で4344文字を追加し、計11223文字へと拡張したシロモノです 教科書調査を始めとする他分野にわたる用字調査、一般からの意見を募った公開レビューなどを経て完成させられた規格だけに、今後の活躍が期待されます |
・・・というシロモノで、上記の「教科書調査を始めとする他分野」「一般からの意見」の中身は以下のようなものとなっています
(下記の全てが採用された訳では無い)
JCS WG2 1998-12-06 新JIS漢字典拠一覧
「通産省工業技術院」依託、「日本規格化協会」傘下、「符号化文字集合調査研究委員会」第2分科会(JCS WorkGroup 2) 公開レビュー資料 (1998-12-06) 」転記(※) |
※ 現在ではサーバーから削除され閲覧不可能な状態であるために転記しました
世間一般に公開する事が目的の公的資料や官報告示であるので転記には問題など発生しないハズ・・・
なお、
JIS X 0208:1997『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』については、「97JIS文字集合」「旧JIS漢字」
JIS X 0213:2000『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』については、「JIS2000文字集合」「2000JIS文字集合」「JIS X 0213:2000漢字集合」「新JIS漢字」
などと一部の人間が呼ぶ事もあるようですが、
「 弓道辞書 」では、
前者については、「非漢字+第1・第2水準漢字文字集合」
後者については、「非漢字+第1〜第4水準漢字文字集合」
というような表記に統一します
■ 第3水準漢字・第4水準漢字を扱う手法について |
PCやネット上において、コンシューマーレベルで「第1・第2水準実装外漢字」を扱う手立て(※)として、
「Unicodeエンコード」を採用する
JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコードの「Shift_JIS(Shft_JISX0213)」「JIS(iso-2022-jp-3)」「EUC-JP(EUC-JPX0213)」を採用する
「HTML2.0(RFC1866)」で定義されている「文字参照(character references)」規定を導入する
・・・という3つの方法があります
※ ごくごく普通のヒトがごくごく普通のPCを使って扱う事が出来得る方法・・・、という意味合い
「Unicodeエンコード」とは・・・ |
従来の言語切り替え型エンコード方式(日本語では「Shift_JIS」「EUC(euc-jp)」「JIS(iso-2022-jp)」)で記述した文章というのは、自国言語以外の言語圏(※)では文字化けしてしまうという問題があり、ネットによる情報の国際化・共有化を妨げる要因の一つとなっていました※英語圏を除く
例えば、検索エンジンの老舗的存在である、
・・・というように、従来から利用されている言語切り替え型エンコード方式を採用しているため、これらの検索エンジンでは日本語と英語のホームページしか検索出来ません |
この問題を克服するため、世界中の文字を一つのエンコード上で扱う事が出来るように新しく制定されたエンコード方式が「Unicode」です
後発の検索エンジンである「Google 日本」では、「Unicode(UTF-8)」エンコードを採用したため、
・・・という特徴があり、老舗の検索エンジンの存在を脅かすほどの高い支持を得ています(※)
|
「Unicodeエンコード」であれば、日本で一般的ではない漢字であっても、中国(大陸)・香港・台湾・韓国/朝鮮などで用いられている漢字もそのまま利用出来るため、いま現在PCで浸透している「Shift_JIS」「EUC(euc-jp)」「JIS(iso-2022-jp)」では扱えなかった第1・第2水準実装外の漢字を扱う事が出来ます(※)
※ 「フォント」の文字集合に該当文字が実装されていれば正しく表示出来ますが、含まれていない場合にはPC内部では正しく処理出来ていてもディスプレイ上では表示は出来ません (「文字抜け」します)
しかし、「Unicode UCS」対応フォントが導入されていない古いPC環境を使用している場合でも、
Windows / Unix / Mac OS X の場合、ネット上で無償配布されている「Unicode UCS対応フォント」をダウンロードする
Mac OS 〜9.x の場合、OSのCD-ROMなどから「MultiLanguageKit」をインストールしたり、ネット上で無償配布されている「OpenType Font」をダウンロードしたりする
・・・などをする事で、「Unicode」対応アプリケーション上で「Unicodeエンコードによる多漢字・多ヶ国語文章」を表示する事が出来るようになります
また、世界的な流れとして従来の言語切り替え型エンコード方式から「Unicode」への移行が始っています(※1)(※2)ので、「第3水準漢字」「第4水準漢字」などを扱う手法としても、一般的には「Unicode」として扱うのが基本です
※1 欧州統一通貨の単位である「€(EURO)」は、日本工業規格(JIS)では「第3水準漢字」として定義されています
しかし、国際的な通貨の表記を必要とするグローバルなデータを、日本国内でしか通用しない「言語切り替え型エンコード方式」の拡張方式(=「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」)や、「言語切り替え型エンコード方式」の外字として扱っても意味を持たないため、「€(EURO)」を扱うデータは全て「Unicode」である必要があります
※2 2002年(平成14年)8月から運用開始された、総務省の「住基ネット(住民基本台帳ネットワーク)」では、「Unicode」をベースとしたエンコードが採用されています
さらに、「住基ネット」をベースとして官公庁をネットワーク化するという「電子政府」構想でも、「住基ネット」でのエンコード方式がそのまま使用される事になりますので、官公庁とやりとりをする必要があるデータなどについても「Unicode」への移行が求められる事になります
「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」とは・・・ |
一般的なパソコン(=「Windows」「Macintosh」)での標準として文章作成時のエンコードとして用いられているShift_JIS(※)では、いわゆる「メーカー拡張文字(=機種依存文字)領域」と「外字領域」と呼ばれている、『あまり使われていない領域』が存在しています※ Shiift_JISエンコードでは、94×94区画の実装面が2面規定されており、
- 非漢字+第一水準漢字が実装されている「第1実装領域」
- 第2水準漢字が実装されている「第2実装領域」
- 将来の拡張用として残されていた「第3実装領域」(メーカー拡張文字が実装されてしまった)
の3つの領域が『第1面』、
ユーザーが独自に利用出来る領域として規定されていた「第4実装領域」(=外字領域)が『第2面』、として規定されています
この『あまり使われていない領域』に入っている「メーカー拡張文字」と「外字」を使えないようにして、そこ(=「第3実装領域」と「第4実装領域」)へ新しく第1・第2水準実装外の文字を入れてしまって「JIS X 0208:1997」を拡張しましょう
・・・というのが規格制定時の発想で、そこから「第3・第4水準漢字文字集合」が誕生しました
しかし、発想の元となった「JIS X 0213:2000」に準拠したエンコードの、実際に出来上がったシロモノというのは、
● 「Shift_JIS」(Shift_JISX0213)
規格の枠組みは一切変わっていません
しかし、規格制定時の予定から拡張して「第3実装領域」と「第4実装領域」以外の区画(※1)(※2) にも第3水準漢字を割り当ててしまったため、致命的な問題 (※3) が発生し、このエンコード手法そのものの将来性を見限った形での制定とせざるを得ませんでした
※1 「第1実装領域」と「第2実装領域」の隙間
※2 制定段階の途中から「Shift_JISX0213」の互換性については断念し、実装文字数の増加に重点を置いていたためにこのような結果となりました
※3 第3・第4水準漢字の扱い方 「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」編 の「致命的な問題<その1>」を参照の事
● 「EUC」(EUC-JISX0213)
1990年に制定されていた「補助漢字(JIS X 0212:1990)」対応エンコード方式の「euc-jp-3」を拡張した、「EUC-JISX0213」が参考情報として制定される事になりました
「補助漢字(JIS X 0212:1990)」を割り当てられている第3面(3バイト文字領域)の空き区画へ第4水準漢字を実装し、従来JIS X 0208が割り当てられていた第2面(2バイト文字領域)に、Shift_JIS第1面と同様の方法で第3水準漢字を割り当てられる形となっています
であるので、「euc-jp-3」対応アプリケーション上において「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」対応フォントにて表示されば、すぐさま第3・第4水準漢字が扱えます
また、「euc-jp-3」非対応アプリケーションの場合においては、「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」対応フォントにて表示さればすぐさま非漢字+第1〜第3水準漢字文字集合を利用する事が出来ますが、第4水準漢字については「文字化け」します
● 「JIS」(iso-2022-jp-3)
いままでのJIS X 0208:1997対応の「iso-2022-jp」や、JIS X 0212:1990対応の「iso-2022-jp-2」(3ヶ国語対応:簡体字中国語・韓国語・日本語)・「iso-2022-jp-1」(日本語専用)とは全く互換性の無い「iso-2022-jp-3」というエンコード方式が参考情報として制定される事になりました
しかし、「iso-2022-jp-3」に対応したメールソフトはほとんどありませんし、将来に渡って増える見込みもほとんどありません
(後述の「致命的な問題<その2>」参照の事)ただ、従来からの「JISエンコード文章対応アプリケーション」(メールソフトなど)(※1)でも表示フォントを「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」対応フォントにさえすれば(※2)、すぐさま非漢字+第1〜第3水準漢字文字集合については扱える(※3)ようになりますが、第4水準漢字については文字化けします
※1 第3・第4水準漢字の扱い方 「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」編 の「致命的な問題<その1>」を参照の事
※2 通称「iso-2022-jp-3-compatible」と呼ばれます
・・・というシロモノに仕上がったため、日本工業規格の正式な規格として制定する事が出来ませんでした(※)
※ 「JIS X 0213:2000」に準拠した「Shift_JIS」「iso-2022-jp」「euc-jp」エンコードは、JIS X 0213:2000『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』-「附属書1:Shift_JISX0213」「附属書2:iso-2022-jp-3」「附属書3:EUC-JPX0213」として、「JIS X 0213:2000」に附属する『参考情報』としての扱いとなっていますので、これらはJISにおける「規格」ではありません
その結果、OSやアプリケーションのカーネル(内部構造)のUnicode化を推進するMicrosoftやApple、大手ソフトメーカーなどでは「JIS X 0213:2000 附属書1〜3」に準拠したエンコードは採用せず、Unicode 3.2エンコード上で「非漢字+第1〜第4水準漢字文字集合」を扱う事に決定しました
そして、「JIS X 0213:2000 附属書1〜3」に準拠したエンコードは、日の目を見る事無くその役目を終えました・・・
なお、「JIS X 0213:2000 附属書1〜3」に準拠したエンコードは通称「JIS2000」と呼ばれる事が多かったようですが、「 弓道辞書 」では「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」という表記に統一します
「文字参照(character references)」とは・・・ |
「HTML2.0(RFC1866)」で定義されているHTML文法の一つで、「文字参照(character references)」の「&○○○○;」記述にて、フォントのコードポイントをダイレクトに文字指定するというモノです
この「文字参照」の規定は、「Unicode」エンコードが扱えないアプリケーションを使っている場合であっても、ごくごく一般的な「Shift_JIS」「EUC-JP」「JIS」エンコード(=非漢字+第1・第2水準漢字+αしか扱えない)HTML文章上に、「第3・第4水準漢字」「第1〜第4水準実装外漢字」などを組み込んだホームページやリッチテキスト(HTML)形式メール(※)を作成出来る事を目的として定義されました
※ <重要> リッチテキスト(HTML)形式対応メールソフト自体が持つセキュリティ面の問題については、「 インターネットにおけるセキュリティ問題について 」 をご覧下さい
ごくごく一般的な「Shift_JIS」エンコード(=非漢字+第1・第2水準漢字)のホームページを既に作成されている方にとっては、ほんの少し手を加えるだけで「第1・第2水準実装外漢字」を表示させる事が出来るようになり、なおかつ「文字参照」非対応のブラウザソフトやメールソフト上でも「非漢字+第1・第2水準漢字」の部分は文字化けする事無く表示可能なため、大変に便利な存在でしょう(※)
※ 「フォント」の文字集合に該当文字が実装されていれば正しく表示出来ますが、含まれていない場合にはPC内部では正しく処理出来ていてもディスプレイ上では表示は出来ません (「文字抜け」します)
しかし、「Unicode UCS」対応フォントが導入されていない古いPC環境を使用している場合でも、
Windows / Unix / Mac OS X の場合、ネット上で無償配布されている「Unicode UCS対応フォント」をダウンロードする
Mac OS 〜9.x の場合、OSのCD-ROMなどから「MultiLanguageKit」をインストールしたり、ネット上で無償配布されている「第3・第4水準漢字実装 OpenType Font」をダウンロードする
・・・などをする事で、「文字参照」対応のブラウザソフトやメールソフト上で「文字参照による多漢字・多ヶ国語文章」を表示する事が出来るようになります
なお、この「 弓道辞書 」READMEでも「第1・第2水準実装外漢字」を扱っていますが、そのほとんどは「Shift_JIS」エンコード上での「文字参照(character references)」を使用しています(※)
※「 豪華特別付録!!! 」 で、「Encoded by Unicode(UTF-8)」と書かれているページのみ「Unicodeエンコード」を使用しています
なお、WindowsやMac OS 〜9.xでは、「Unicode」エンコードや「文字参照」で表示出来る「Unicode UCS」文字集合対応フォントによって表示出来るのは「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」文章での「非漢字+第1・第2水準漢字」のみです
また、WindowsやMac OS 〜9.x/Mac OS Xでは、「JIS2000(JIS X 0213:2000 附属書1〜3)準拠エンコード」対応フォントによって表示出来るのは「Unicode」エンコードや「文字参照」文章での「非漢字+第1・第2水準漢字」のみです
■ PCにおける多漢字・多言語ソリューションの流れ |
1990年 | 非漢字+第1水準漢字+第2水準漢字の6879文字しか扱えない電子符号化文章(JIS
X 0208:1983)の状況を改善すべく、日本工業規格(JIS)では非漢字+第1・第2水準漢字文字集合実装外である新たな文字集合「補助漢字(JIS
X 0212:1990文字集合)」(非漢字254文字+漢字5801文字)
と、「補助漢字(JIS X 0212:1990)」準拠エンコード(「iso-2022-jp-2」「iso-2022-jp-1」「euc-jp-3」)を制定
|
|||||||||||||||||||
1993年 | The Unicode Consortium と
ISO(国際標準化機構)/IEC(国際電気標準会議)
10646 は、全世界の主要言語のエンコードを統合した一つのなエンコード方式「Unicode
1.1」(実装領域「第00面」のみ:最大収録文字数65536文字)
と、全世界の主要な文字を含んだ単一の文字集合「UCS(国際符号化文字集合
: Universal
Multiple-Octet Coded Character Set)」(30000文字強)を制定しました
|
|||||||||||||||||||
1995年 | 日本工業規格(JIS)では、「Unicode
1.1」「Unicode 1.1 UCS」を日本標準として取り入れ「JIS
X 0221:1995」として制定
|
|||||||||||||||||||
1996年 | The Unicode Consortium と
ISO/IEC 10646 は、「Unicode 2.0」(実装領域「第00面」のみ」)
を制定する(※)と同時に、文字集合「UCS」を改定して38885文字に拡張しました
|
|||||||||||||||||||
1990年代後半 | 日本工業規格(JIS)は、いつまでたっても「非漢字+第1水準漢字+第2水準漢字の6879文字」以外の文字が『ごくごく普通のPC上で、ごくごく普通のヒト』には扱えるようにならないことに業を煮やし、コンシューマーベースで普及している「Shuft_JIS」対応アプリケーション上でそのまま扱える事を目標(※)とした、JIS
X 0208の拡張方式である「JIS X 0213」の文字集合とエンコード方式の制定に着手
|
|||||||||||||||||||
1998年 | The Unicode Consortium と ISO/IEC 10646 は、「Unicode 2.1」(実装領域「第00面」のみ」) を制定る(※)と同時に、文字集合「UCS」を改定して 38887文字に拡張しましたす | |||||||||||||||||||
1998年 | Microsoft は、「Unicode 2.1」準拠のワープロソフト「Word 98」をリリース
|
|||||||||||||||||||
1998年 | Microsoft は Windows 98/NT4.0 SP4 にて「MS ゴシック」「MS Pゴシック」「MS UI Gothic」「MS 明朝」「MS P明朝」を「補助漢字(JIS X 0212)」文字集合に対応させてリリース(「Unicode 2.1」準拠) | |||||||||||||||||||
1999年9月 | The Unicode Consortium と ISO/IEC 10646
は、「Unicode 3.0」(実装領域「第00面」のみ)
を制定と同時に、文字集合「UCS」を改定して49194文字に拡張しました
|
|||||||||||||||||||
2000年1月 | 中国(中華人民共和国)では、PCのOSやアプリケーション、PDAや携帯電話などの、全ての情報通信機器への「GB18030-2000」エンコード方式(※1)の採用を義務付けました(※2)
|
|||||||||||||||||||
2000年1月 | JIS X 0213:2000 告示
なお、「第3・第4水準漢字文字集合」は、10年前に制定された「補助漢字(JIS X 0212:1990文字集合)」と大部分が重複しており、「補助漢字(JIS X 0212:1990文字集合)」の中に含まれていない「非漢字+第3・第4水準漢字」は約400文字だけです |
|||||||||||||||||||
2001年3月 | Apple は、「Mac OS X」から15444文字の文字集合を備えたOpenType
Font(※1)「ヒラギノ明朝
Pro W3」「ヒラギノ明朝 Pro W6」「ヒラギノ角ゴシック
Pro W3」「ヒラギノ角ゴシック Pro W6」「ヒラギノ丸ゴシック
Pro W4」version 7.0 (「大日本スクリーン製造株式会社」製)
を導入し、「Unicode 2.1/3.0対応アプリケーション上で「Adobe
Japan1-4(※2)文字集合」のUnicode実装9772文字や「Adobe
InDesign 1.0/2.0/CS」「Adobe
Illustlator CS」「Canon
EDICOLOR 7.0」などのPostScriptカーネルアプリケーション上で「Adobe
Japan1-4(※2)文字集合」PostScript実装15444文字字形を扱う形態を取っています
|
|||||||||||||||||||
2001年3月 | The Unicode Consortium と ISO/IEC 10646
は、「Unicode 3.1」(実装領域「第00面」〜「第16面」:最大収録文字数1114112文字)を制定
|
|||||||||||||||||||
2001年4月 | 日本工業規格(JIS)では、「Unicode
3.x」準拠の実装領域「第00面」〜「第16面」の符号化体系と、「Unicode
3.0」準拠の実装領域「第00面」文字集合(UCS)を、日本標準として取り入れ、「JIS
X 0221-1:2001」として35040文字の文字集合と符号化を制定
なお、「JIS X 0221」系列は廃止され、「JIS X 0221-1」に改められました |
|||||||||||||||||||
2001年6月 | Microsoft は、
にて、「Unicode 3.1」に対応させました(※2)
また、日本語版「Officexp」でも、アプリケーションとして実装領域「第00面」〜「第16面」に対応しましたが、肝心の「Unicode 3.1 UCS」文字集合対応フォントは附属していません しかし、「Microsoft Global IME for Officexp (Simplified Chinese)- with Language Pack」 をダウンロードしてインストールすれば、「Simsun(Founder Extended)」が組み込まれるようです |
|||||||||||||||||||
2001年9月 | Apple (と、フォントベンダーである「大日本スクリーン製造株式会社」)は、「Mac
OS X 10.1」で「ヒラギノ明朝
Pro W3」「ヒラギノ明朝 Pro W6」「ヒラギノ角ゴシック
Pro W3」「ヒラギノ角ゴシック
Pro W6」「ヒラギノ丸ゴシック
Pro W4」version
7.0 を導入、実装文字数を拡張し、「AGPS(Apple Publishing
Glyph Set)(仮)」(※)文字集合(PostScript実装20317文字字形、Unicode実装約13600文字)としました
そして、Mac OS X 10.1データシートでは、
|
|||||||||||||||||||
2001年11月 | Microsoft は、「Windowsxp」にて、「OS」や「標準添付アプリケーション」の多くは実装領域「第00面」〜「第16面」に対応しましたが、「Unicode 3.x UCS」対応フォントは附属していません | |||||||||||||||||||
2002年1月 | Microsoft は、「Office
v.X」(for Mac OS X 10.1〜)にて、「Unicode
3.2」に対応させました(※)
|
|||||||||||||||||||
2002年3月 | The Unicode Consortium と ISO/IEC 10646
は、「Unicode 3.2」を制定し、実装領域「第00面」や、「第02面」の中の「CJK
Unified Ideographs Extension B」は8文字追加され42,719文字(U+20000〜U+2A6DF)になるなど、「Unicode
3.2 UCS」は1016文字(※1)が追加され71216文字となりましたました
|
|||||||||||||||||||
2002年6月 | Appleは、「Mac OS X 10.1.5〜」にて、 Mac OS X Language Support Updates: Software Download をインストールする事によって「Unicode 3.2 UCS」文字集合へ対応出来るようにしています | |||||||||||||||||||
2002年8月 | 総務省の「住基ネット(住民基本台帳ネットワーク)」が運用開始され、「Unicode」をベースとしたエンコード(※)が採用されました
|
|||||||||||||||||||
2002年8月 | Appleは、「Mac OS X 10.2」にて、
新「ことえり3」での「ことえりパレット」は「Glyph
Input Protocol」をサポートし、実装領域「第00面」+「第01面」〜「第16面」対応アプリケーション上で、Unicode実装の文字だけでなくPostScript実装の文字字形すべてを扱う事が出来るようになりました
また、Adobe と Apple は、「AGPS(Apple Publishing Glyph Set)(仮)」を拡張し、「国語審議会「表外漢字字体表」新規制定文字+その他」を追加して、PostScript実装20317文字字形、Unicode実装約13600文字の「Adobe Japan1-5」(※)文字集合を定義し、「Mac OS X 10.2」付属の「ヒラギノ明朝 Pro W3」「ヒラギノ明朝 Pro W6」「ヒラギノ角ゴシック Pro W3」「ヒラギノ角ゴシック Pro W6」「ヒラギノ丸ゴシック Pro W4」version 7.1にて実装しました それから、簡体中文フォント「华文细黑」 「华文黑体」 「华文宋体」 「华文楷体」 「华文仿宋」 は「Adobe GB1-4」(29063文字) をサポートしており、「Unicode 3.0 UCS」文字集合の漢字部分がフルに実装されています(Hangul領域は実装されていません) |
|||||||||||||||||||
2002年9月 | 大日本スクリーン製造株式会社は、ヒラギノOpenTypeフォント45書体を9月25日に発売しました
|
|||||||||||||||||||
2003年4月 | The Unicode Consortium と ISO/IEC 10646 は、「Unicode 4.0」を制定し、1226文字が新規実装されて「Unicode 4.0 UCS」は72442文字となりましたました | |||||||||||||||||||
2003年10月 | Appleは、「Mac OS X 10.3」にて、「ことえり4」で新設された「アイヌ語入力モード」において、第3水準漢字のアイヌ語表記用小文字カタカナ「U+31F0〜U+31FF」「セ゚(半濁音付きのセ)」「ツ゚(半濁音付きのツ)」「ト゚(半濁音付きのト)」「ㇷ゚(小文字)(半濁音付きの小文字フ)」を含むアイヌ語カタカナ表記のローマ字入力をサポートしました | |||||||||||||||||||
2003年11月 | JUSTSYSTEM は、「Adobe Japan1-5」(※)文字集合のPostScript実装20298文字字形、Unicode実装約13600文字にフルに対応し、第3・第4水準漢字辞書も標準搭載した「ATOK 16 for Mac OS X 10.1〜」を11月21日に発売しました |
|||||||||||||||||||
今後の予定 | The Unicode Consortium と ISO/IEC 10646
は、「CJK Unified Ideographs Extension C block」の制定作業に取り掛かっており、「Unicode 4.0」以降のバージョン(=4.1?)にて実装されるようです ≫ http://www.unicode.org/versions/beta.html
|
|||||||||||||||||||
今後の予定 | Microsoft は、2005年後半にリリースが予定されている「Windowsxp
の後継OS」にて、Mac OS X 10.1〜と同様のUnicodeによる「非漢字+第1〜第4水準漢字」文字集合を採用するようです
|