「中国語コンバータ」をご利用くださり、ありがとうございます


―― 目次 ――
【1】 概要
【2】 ダイアログ版「中国語コンバータ」について
【3】 コマンドライン版「中国語コンバータ」について
【4】 変換アルゴリズムについて
簡体字と繁体字の変換 / ピンインの変換 / GBK の変換 / 擬似中国語コードの変換 / Chinese Writer のフォント名 / 変換できない文字は? / 出力フォント名の指定
【5】 使い方のヒント
GB コードとは? / BIG5 コードとは? / リッチテキストフォーマットとは? / 中国語を扱えるワープロ・エディタはありますか? / HZ、GB18030 や Unicode には変換できないのですか? / ワード文書を GB・BIG5 のテキストファイルに変換できますか? / Chinese Writer の古いフォント名を新しいフォント名に変更できますか?
【6】 インストールとアンインストールについて
【7】 ライセンス
【8】 その他


【1】 概要 目次にもどる

  このソフトは、中国語で使われる GB コードBIG5 コード、および日本語 Windows 上で使われる各種中国語コードを相互に変換します。リッチテキストフォーマットに対応しているので、日本語と中国語が混在している文書でも正しく変換されます。

  「中国語コンバータ」は以下の文字コードが変換できます。
  日本語 Windows 上で中国語を扱うとき、GB・BIG5のほか、Chinese Writer や cWnn などの日本独自の中国語ソフト(IME+フォント)が、広く利用されています。これら日本独自の中国語ソフトでは、日本語シフトJISコード上に擬似的に中国語コードを割り当てて使っています。しかし、これら擬似コードでは中国・台湾のコンピュータと互換性がありません。日本語 Windows だけの閉じた体系です。たとえば、擬似中国語コードの代表的存在である Chinese Writer のコードを例にあげると、以下のように同一の漢字であっても、GB や BIG5 と異なる番号が割り当てられています。

  GB2312 コード BIG5 コード Chinese Writer コード
你 ni C4E3 A741 92E1
好 hao BAC3 A66E 8DC1


  このように擬似コードは、中国や台湾で用いられているコードとは異なるため、そのままファイルを中国や台湾の人に送っても文字を見ることができません。
  Word 98 以降は日本語コードと中国語コードが混在可能になり、直接 GB や BIG5 で入力することが可能になりました。これからは日本語 Windows 上でも、中国語を入力するときは、擬似コードではなく直接 GB や BIG5 で入力する方向へと徐々に向かってゆくでしょう。

  この「中国語コンバータ」を使えば、このような従来からの擬似中国語コードを、互換性のある GB や BIG5 に変換することができます。

  このほか「中国語コンバータ」には以下のような特長があります。   初めてダウンロードされた方は、まずダイアログ版「中国語コンバータ」をご利用ください。
  文字コード変換の詳細や、オプションの設定のポイントをお知りになりたい方は、「変換アルゴリズムについて」を一度お読みになることをお勧めいたします。
  中国語の文字コードに詳しくない方は、「使い方のヒント」もあわせてお読みください。




【2】 ダイアログ版「中国語コンバータ」について 目次にもどる

  ダイアログ版「中国語コンバータ」chnconv.exe は、この「中国語コンバータ」のユーザインタフェイスとなるものです。各種中国語文字コードの変換を行います。テキストファイル・リッチテキストフォーマットでの変換が可能です。

  Windows の標準的な操作法により、コマンドラインが使えない人でも、手軽に使うことができます。

  ダイアログ上から、入出力ファイルの文字コード・ファイル名を指定して「実行」を押してください。テキストファイルかリッチテキストフォーマットかは、自動的に判別されます。リッチテキストフォーマットなら、多言語混在のファイルでも正しく変換することができます。

  また、オプションにより、GB・BIG5出力時のフォント指定や、GB・BIG5間の異体字変換の方法などを指定することができます。
 

  chnconv.exe は以下の点にも注意を払っています。

  1) ファイル名の指定は参照ボタンを
  ファイル名の指定は、通常は「参照ボタン」(「...」のボタン)を使うことをおすすめします。
  バージョン4.50からファイル名のドラッグアンドドロップに対応しました。
  自分で入力してファイル名を指定したときは、次のようにファイルを検索します。入力ファイル名が相対パス名で指定されたときは、「マイドキュメント」フォルダをカレントディレクトリとしてファイルを検索します。また、出力ファイル名が相対パス名で指定されたときは、入力ファイルが存在するディレクトリをカレントディレクトリとしてファイルを検索します。
  Windows NT/2000/XP ならば、通常の日本語(Shift-JIS)以外の文字を使ったファイル名も指定できます。

  2) 出力先に同じ名前のファイルがあったら?
  出力先に同名の古いファイルが存在するときは、上書きするかどうかメッセージで問いあわせをします。CANCEL を選択すると変換は失敗します。OK を選択すると、古いファイルはゴミ箱に移されます。(ゴミ箱がサポートされていないフロッピーなどのディスクでは、ゴミ箱に移されず、完全に削除されます。)
  入力ファイル名と出力ファイル名が同じであっても正しく処理されます。
  上書き時にファイルをごみ箱に入れるとき1〜3秒ほど時間がかかります。
  オプションにより、「上書き時に確認しない」「上書き時にごみ箱に移動しない」を指定することもできます。

  3) 日本語 Windows 以外でも使えます
  日本語版以外の Windows でも使用できます。Windows 2000/XP/Vista なら、英語・中国語などの表示に切り替えることが出来ます。

  4) オプションの設定
  変換オプションの設定は、環境ファイル chnconv.cfg に保存されます。
  オプションの設定のポイントについては、「変換アルゴリズムについて」をお読みください。

  5) その他
  変換の過程でダイナミックリンクライブラリ chnconv.dll を呼び出します。
  この chnconv.dll をインストールされたディレクトリから削除した場合、変換は失敗します。「ヘルプ」をクリックすると、必要なプログラムが正しく存在するか確認することができます。




【3】 コマンドライン版「中国語コンバータ」について 目次にもどる

  コマンドライン版「中国語コンバータ」を利用するには、まず、インストール時にスタートメニューに作られた「中国語コンバータ用コマンドプロンプト」を起動してみてください。このコマンドプロンプトには、「中国語コンバータ」へのパスが設定され、「マイドキュメント」フォルダがカレントディレクトリに設定されています。

  このコマンドラインから、「chnconv」と入力し、Enter キーを押して実行すると、詳しい解説が現れます。

  簡単な使い方としては、たとえば

 <例1>Chinese Writer のファイル「テスト1.txt」を GB のファイル「テスト2.txt」に変換する
             chnconv    -cCW    -cGB    テスト1.txt    >    テスト2.txt

 <例2>Chinese Writer のファイル「テスト1.rtf」を GB のファイル「テスト2.rtf」に変換する
             chnconv    -cCW    -cGB    テスト1.rtf    >    テスト2.rtf

のように実行します。使用法の詳細については、コマンドラインから引き数なしで起動すれば、ヘルプ画面が現れますので、そちらをお読みください。


  コマンドラインの操作法に慣れてしまった人には、この便利さは手放せません。カレントディレクトリの認識、ワイルドカードの検索、サブディレクトリの再帰検索、入出力のパイプおよびリダイレクトの指定、各種オプションの指定が可能です。大量にファイルを処理する必要のある人は、ぜひコマンドライン版をお使いください。

  たとえば、カレントディレクトリにある全ての Chinese Writer のリッチテキストフォーマットを GB に変換するには
             chnconv    -cCW    -cGB    *.rtf    bak
のように指定すれば、すべてのファイルの変換が自動的に実行されます。さらに、サブディレクトリのファイルも全て変換したければ、
             chnconv    -cCW    -cGB    -s    *.rtf    bak
のように指定してください。数百、数千のファイルでも、いっきに自動的に処理されます。


  このプログラムは、変換の過程でダイナミックリンクライブラリ chnconv.dll を呼び出すため、プログラムの実行には、これらのファイルがプログラムファイルと同じディレクトリに存在する必要があります。(付属の setup.exe を使って通常のインストールを行なったなら大丈夫です。)
  このプログラムは、Windows 32-bit のコマンドライン用プログラムです。MS-DOS(16-bit)では使用できません。コマンドラインそのものの環境設定については、DOS の知識が要求されますので、各種解説書をご参照ください。インストール時にスタートメニュー・デスクトップに作られるコマンドライン用ショートカットファイルを利用すると便利です。




【4】 変換アルゴリズムについて 目次にもどる

  「中国語コンバータ」は、内部に独自の変換テーブルを持ち、高速に処理しています。
  ダイアログ版・コマンドライン版のいずれを使って変換しても、変換そのものはダイナミックリンクライブラリ chnconv.dll が受け持っているため、ダイアログ版とコマンドライン版では、同じ変換結果になります。

  「中国語コンバータ」はこのほかに、以下のような特長も持っています。
各項目へジャンプ →
簡体字と繁体字の変換 / ピンインの変換 / GBK の変換 / 擬似中国語コードの変換 / Chinese Writer のフォント名 / 変換できない文字は? / 出力フォント名の指定

1) 簡体字と繁体字の変換 先頭にもどる
  簡体字と繁体字の間の変換は文字単位で行ないます。単語や文を単位に行なうわけではありません。このため、一対多の対応になっている漢字は、必ずしも正しい変換ができるとは限りません。たとえば、GB 簡体字の「出fa」「頭fa」の「fa」は、「發」と「髪」を区別することができず、いずれも BIG5 の「發」にしてしまいます。

  簡体字と繁体字の変換で注意すべき漢字については、「Wikipedia Unihan 繁簡体対照表」などにまとめられています。機械を過信せず、変換後に自分の目で確認することをお勧めします。

  このような簡体字・繁体字間の異体字を自動で適切に処理したい方は、「中国語コンバータ」ではなく、Microsoft 社製の Office Proofing Tools をお使いになることをお勧めします。


2) ピンインの変換 先頭にもどる
  ピンイン(声調符号付アルファベット)は、BIG5コードでは文字が未定義のため、声調符号なしのローマ字に変換します。GB コードでは該当する A8A1 から A8BA までのコードに正しく変換しますが、MS-Word の設定により表示が乱れることがあります。
  Word98 または Word2000 をインストールしてあれば、Word 上で、「書式→文字種の変換」で文字種を半角に変換し、フォントを Times New Roman のような収録字数の多いフォントに変えると、きちんと表示されます。
  リッチテキストフォーマットを変換する場合は、「中国語コンバータ」のオプションでピンインのフォント名を Times New Roman などに指定しておけば、自動的にピンインをこれらのフォントで出力できるようになります。


3) GBK の変換 先頭にもどる
  拡張 GB コード(GBK)にある繁体字を Chinese Writer などの GBK 非対応のコードに変換するときは、繁体字をできるだけ簡体字に変換します。オプションの設定によってこの変換を抑制できます。


4) 擬似中国語コードの変換 先頭にもどる
  NiHao Win は、半角文字のコード配列が不自然・不適切なため、テキストファイルは正しく変換できないことがあります。また、Chinese Writer のテキストファイルでは注音字母を出力できません。
  また、中文起稿 と cWnn は、それぞれ Version 1 と Version 2 以降では文字コードが異なります。「中国語コンバータ」では、読み込みは Version 1 と Version 2 以降のどちらも可能ですが、出力は Version 2 以降の文字コードで出力します。
  なお、各社 擬似中国語コード のフォント名は、簡体字と繁体字を区別しません。すべて簡体字として扱います。


5) Chinese Writer のフォント名 先頭にもどる
  Chinese Writer の最新版であるバージョン 7 では、Chinese Writer コードのフォント名が変更されています。
  中国語コンバータは、リッチテキストフォーマットを入力するとき、古いフォント名と新しいフォント名の双方を読み込むことができます。
  リッチテキストフォーマットを出力するときは、標準では古いフォント名で出力します。「オプション」→「フォント(漢字)」→「出力する Chinese Writer のフォント名」で「バージョン 7 以降」を指定すると、新しいフォント名で出力します。
  また、どちらのフォント名で出力する場合でも、リッチテキスト中の「代替フォント指定」に両方のフォント名を書き込むので、フォント名が違っていても、Word 上で一応 文字を表示することが可能です。
  (参考: Chinese Writer の古いフォント名を新しいフォント名に変更できますか?)


6) 変換できない文字は? 先頭にもどる
  該当する字がない場合は、全角文字なら ?? を、半角文字なら ? を出力します。オプションにより、文字コード番号を出力することもできます。


7) 出力フォント名の指定 先頭にもどる
  リッチテキストフォーマットを GB や BIG5 に変換するときは、通常はデフォルトのフォント名を出力します。 Word はフォントのコードページをきちんと判断するので、システムにこれらのフォントがなくとも、他に GB または BIG5 のフォントがあれば、ただしく表示されます。
  オプションにより、特定のフォント名を出力するようにもできます。

  フォント名は通常のフォントとゴシック体フォントとを区別して変換します。もしオプションの設定により通常のフォントとゴシック体フォントに同じ名前を指定した場合は、ゴシック体の部分をボールドにして出力します。とくに BIG5 は、システムからゴシック体フォントが提供されないため、デフォルトで通常のフォントとゴシック体フォントが同じ名前になります。

  バージョン 4.50 より、ピンインの出力フォントを漢字とは別に指定できるようにしました。





【5】 使い方のヒント 目次にもどる
各項目へジャンプ →
GB コードとは? / BIG5 コードとは? / リッチテキストフォーマットとは? / 中国語を扱えるワープロ・エディタはありますか? / HZ、GB18030 や Unicode には変換できないのですか? / ワード文書を GB・BIG5 のテキストファイルに変換できますか? / Chinese Writer の古いフォント名を新しいフォント名に変更できますか?

1) GB コードとは? 先頭にもどる
  GB コードは、中国大陸で広く使われている文字コードです。簡体字を主体にしていますが、繁体字を扱うこともできます。GB コードにはいくつかの種類がありますが、「中国語コンバータ」は GB2312 と GBK に対応しています。GB2312・GBK ならば、そのまま中国のコンピュータでも見ることができます。メールなどで中国の人とやり取りをする場合は、通常 GB2312・GBK を使う必要があります。


2) BIG5コードとは? 先頭にもどる
  BIG5コードは、台湾・香港で使われている文字コードです。繁体字を主体にしています。「中国語コンバータ」は BIG5 に対応しています。BIG5 ならば、そのまま台湾・香港のコンピュータでも見ることができます。メールなどで台湾・香港の人とやり取りをする場合は、通常 BIG5 を使う必要があります。


3) リッチテキストフォーマットとは? 先頭にもどる
  リッチテキストフォーマットは、Microsoft Word などのワープロソフトで読み書きできるファイル形式の一つです。フォント・レイアウト・図表・画像などの情報を含むことができ、Word 文書ファイル(.docファイル)とほぼ同等の内容を保存することができます。拡張子は .rtf です。
  「中国語コンバータ」は、テキストファイルとリッチテキストフォーマットの2種類の形式に対応しています。Word 文書ファイルは直接は変換できません。
  文書ファイルを変換するには、Word などで一度「名前を付けて保存」によりリッチテキスト形式で保存したあと、「中国語コンバータ」で変換してください。

  変換した後、リッチテキスト形式のファイルを再び Word で読み込み、「名前を付けて保存」により Word 文書ファイル(.doc)形式で保存しなおせば、 Word 文書ファイル(.doc)形式に戻すことができます。


4) 中国語を扱えるワープロ・エディタはありますか? 先頭にもどる
  「中国語コンバータ」は、文字コードを変換するだけです。中国語の文書を読み書きするには、中国語が扱えるワープロやエディタが別途 必要になります。ワープロならば Microsoft Word(98以降)、エディタならば EmEditor が中国語に対応しています。

  また、これらのソフトを使うには、同時に中国語フォントや中国語 IME が必要になります。
  中国語フォントは、上に挙げた Microsoft Word(2000以降)や Windows 2000/XP あるいは Internet Explorer(5.0以降)などに入っていますので、必要に応じて、自分でインストールしてください。Windows 98/Me ならば、Microsoft 社のホームページ Windows Update でも入手可能です。(GB コードは SimSun が、BIG5 コードは MingLiU が代表的なフォントです。)
  中国語入力の IME については、Windows 2000/XP に入っている中国語 IME をお使いください。「コントロールパネル」→「キーボードの設定」から中国語 IME を追加することができます。また、高電社製 Chinese Writer や オムロンソフトウェア製 cWnn(楽々中国語)にも、GB 用・BIG5 用の中国語 IME が同梱されています。

  コンピュータで中国語を使うための詳しい情報については、「電脳中国語学 II」(漢字文献情報処理研究会編、好文出版)などの各種参考書をご覧ください。


5) HZ、GB18030 や Unicode には変換できないのですか? 先頭にもどる
  「中国語コンバータ」は HZ の出力 や GB18030 の入出力はできません。Unicode の入出力もできません。本ソフトの姉妹編 「RTFコンバータ」をご利用ください。http://www5b.biglobe.ne.jp/~harigaya/ から入手できます。


6) ワード文書を GB・BIG5 のテキストファイルに変換できますか? 先頭にもどる
  「中国語コンバータ」はファイル形式の変換はできません。文字コードの変換だけです。Microsoft Word 2000 以降をお使いなら、「名前を付けて保存」でファイルの種類を「エンコードされたテキスト (*.txt)」を選ぶと、GB や BIG5 のテキストファイルで保存できます。


7) リッチテキストで使われている Chinese Writer の古いフォント名を新しいフォント名に変更できますか? 先頭にもどる

  できます。方法は2つあります。

  1つ目の方法は、変更したいリッチテキストフォーマットをいったん Chinese Writer から cWnn などのファイルに変換し、その後、「オプション」→「フォント(漢字)」→「出力する Chinese Writer のフォント名」で「バージョン 7 以降」を指定して、さきほどの cWnn のファイルを Chinese Writer に変換します。
  この方法は、リッチテキスト中のフォントテーブルのフォント名を直接書き換えるので、Word のツールバーでも新しいフォント名が表示されます。同時に、古いフォント名も「代替フォント」として書き込むので、古いフォントしかインストールされていない環境でも、本文の表示は可能です。

  2つ目の方法は、変更したいリッチテキストフォーマットに対し、ファイル内で使われていないコード名で、ダミーの変換を行う方法です。たとえば、入力を「卓絶」、出力を「中文起稿」で、変換を行ないます。
  これにより、文字コードの変換やフォント名の変更は行なわれませんが、フォントテーブルに Chinese Writer の新しいフォント名を「代替フォント名」として書き込みます。Word のツールバーに表示されるフォント名は古いフォント名のままですが、「代替フォント名」に新しいフォント名が指定されているので、新しいフォントしかインストールされていない環境でも、本文は文字化けせず、新しいフォントで表示可能になります。

  どちらの方法も一長一短です。(このようなユーザ無視のバージョンアップは本当に困りますね!)

  (参考: Chinese Writer のフォント名)





【6】 インストールとアンインストールについて 目次にもどる

  インストールは、付属の setup.exe を使用してください。

  アンインストールは、「コントロールパネル」→「プログラムの追加と削除」(または「アプリケーションの追加と削除」)から「中国語コンバータ」を探して「変更と削除」を実行してください。
  ファイル・ショートカット・レジストリ情報等すべて削除できます。




【7】 ライセンス 目次にもどる

  本ソフトはフリーソフトです。商用も含めて、あらゆるコンピュータ上で無料で利用することができます。アーカイブファイルを、改変せずにそのままであれば、自由に再頒布することができます。
  本ソフトは全くの無保証です。あなたの望みどおりの役に立つという保証は全くありません。





【8】 その他 目次にもどる

  「中国語コンバータ」最新版は以下のアドレスで入手できます。

    http://www5b.biglobe.ne.jp/~harigaya/
    http://www.vector.co.jp/vpack/browse/person/an019647.html


  「Chnconv.dll」API の仕様や、「中国語コンバータ」の全ソースファイルは、以下のアドレスで入手できます。

    http://www5b.biglobe.ne.jp/~harigaya/


  リッチテキストフォーマットとテキストファイル間の変換や、Unicode や中国語以外の言語との変換は、本ソフトの姉妹編「RTFコンバータ」をご利用ください。「中国語コンバータ」ではできない GB→HZ の変換や GB18030 の変換も、「RTFコンバータ」を使えば変換可能です。


  もしお気づきの点があれば、製作者 針谷壮一 までご連絡ください。
  問題点をご指摘される場合は、問題が発生するファイルのサンプルをメールに添付していただければ、より適切にお答えすることができます。
    mailto: harigayas@mvi.biglobe.ne.jp


2009年3月3日      
針谷壮一      



(注)
  * 「KOA-TechnoMate中国語」「Chinese Writer」 は(株)高電社 の製品です。
  * 「NiHao Win」 は(株)クリエイト大阪、(株)アイ・ピー・エム の製品です。
  * 「cWnn」 は(株)オムロンソフトウェア の製品です。
  * 「中文起稿」 は(株)東京コンピュータサービス、(株)富士通ミドルウェア の製品です。
  * 「CX かんたん/かんぺき電脳」 は(株)サンセール の製品です。
  * 「卓絶」 は(株)東計電算 の製品です。