ちょっと見て判定 head_files

初めにお読みください

このソフトにできること

ファイルの先頭を見て、テキストを判定する。

エクセルシート上の、ファイルリストを読み、各ファイルの先頭を軽く読んで、テキストかバイナリかを判定する。 可能ならテキストの文字コード判定なども行う。

以下に同意した上でご使用ください

1. 保証はありません。 (自律)

既知の欠陥も未知の欠陥も含めたまま公開されています。 品質や正確さはご自身で判断してください。 使用により生じた損失など、すべての責任はあなたが負います。

2. フリーです。 (自由)

どなたでも目的によらず無料で無期限に使えます。 登録や承諾は不要です。 商用も可です。 自由な加工を含む再利用も再配布もできます。

3. 公正であれ。 (公正)

オリジナルが、あなたの作品と無関係に利用できることを明示する。 オリジナルの仕事とあなたの仕事を、正直に区別する。 オリジナルの著作権とライセンスを尊重する。

コ・ウェア・ライセンス(自律、自由、公正)の詳細は http://cowares.nobody.jp/license/ で公開されています。

動作環境

配布しているファイルについて

  1. ZIP形式で圧縮しています。 Windows 2000 以前では、この形式を解凍できるソフトウェアが別途必要です。
  2. 圧縮ファイルには以下のファイルが含まれます。
    head_files.xlsmExcel 2007 形式のソフトウェア本体です。これをエクセルで開けば使えます。
    head_files_2k.xlsExcel 2000 形式のソフトウェア本体です。これをエクセルで開けば使えます。
    head_files.xlamExcel 2007 形式のソフトウェア本体です。アドインとして使います。
    head_files_2k.xlaExcel 2000 形式のソフトウェア本体です。アドインとして使います。
    ライセンス.txtこのソフトウェアのライセンスです。
    初めにお読みください.htmlこの解説書です。
    その他解説書の使う画像ファイルなど。

ご使用の手引き - とりあえず使ってみる

エクセル2007 以降はアドインリボンで操作
Excel 2007 ribbon
エクセル2003 以前はツールバーで操作
Excel 2000 toolbar
  1. このソフトウェアを開きます。
  2. ファイルリストのあるセル範囲を選択します。
  3. ツールバーの「判定実行」ボタンを押します。
  4. ファイルリストの右方に、判定結果等が書き込まれました。
results

ご使用の手引き - 詳しく知りたい

  1. このソフトは判定結果をファイルリストのあるシートに書き込みます。
    • 判定結果が、ワークシートの既存データを上書きする可能性があります。
    • ファイルリストを含む連続テーブルの右端に、結果を書き込みます。
    • 連続せず、飛び飛びに書き込みがある場合、この判定がうまく働かず、上書きが起こります。
  2. ファイルリストはタイトルを持ち、縦一列に並ぶものに限ります。
    • ファイルのフルパスを並べる必要があります。
    • タイトル行が無くても動作しますが、結果の書式が崩れます。
    • 行によって異なる列を選んでも動作しますが、結果は行ごとに同じ位置に書き出すため、同一行に2つ以上あれば上書きが起こります。
    • 「ファイル一覧表 list_files」が出力した B 列を、そのまま使うことができます。
  3. 可視セルのみを対象とするので、オートフィルタなどで対象を絞り込んで実行できます。
  4. 複数セルが選ばれている場合は、それが対象となり、単一セルが選ばれている場合は、そこを始点として下方向に連続した範囲を対象とします。
  5. 表示する先頭バイト数
    • ツールバーで、セルの head 欄に抽出する先頭データのバイト数を指定できます。
    • デフォルトは 128バイトです。
    • 表示できないバイナリは x0xFF などになります。
    • テキスト判定された場合、改行コードを \n で表示します。
    • テキスト判定された場合、判定した文字エンコードで変換します。エンコード判定できなかったものは Shift_JIS として変換します。
    • 自動判定した文字エンコードの妥当性を、この表示で判断します。先頭に英文が長く続く場合、既定値より大きくすると良いかもしれません。
  6. 判定に使うバイト数
    • ツールバーで、文字コードなどの判定に使う先頭データのバイト数を指定できます。
    • デフォルトは 4096バイトです。
    • これより後ろはまったく見ないので、リストに巨大なファイルがあっても効率よく処理できます。
    • この数字が小さいと、正しい判定をしにくくなります。
  7. text/binary 判定
    • 先頭の判定範囲に、エスケープ、タブ、改行以外の制御コード( x00 - x1F) があるものを binary と判断。
    • 上記以外で、エスケープ( x1B) を持つものを iso-2022-jp text と判断。
    • 残りを text と判断。
  8. bom 有無
    • unicode および utf-8 ファイルの先頭に BOM がある場合、その内容を EFBBBF などと表示。
  9. linefeed
    • 改行コードが見つかった場合、 CrLf などとしてその種類を表示。
  10. charset
    • エスケープおよび BOM による判定があれば、それを採用。
    • 7bit ascii printable のみで構成されていれば、 ascii
    • xml 宣言の encoding= があれば、それを採用。
    • html の meta タグの charset= があれば、それを採用。
    • 以上のいずれでもなければブランク。

ダウンロードしたマクロが動かないとき

連絡先

動作報告、不動作報告、要望などは、ブログにコメントしてください。

作者Tomizono (工房ばう)
メールcowares@gmail.com
ブログhttp://cowares.blogspot.com
ホームページhttp://kobobau.mocvba.com/xls/
ダウンロードhttp://www.vector.co.jp
オープンソースオリジナルソースは cowares-excel-hello プロジェクトが配布しています。

低価格のシステム開発

エクセルブック、ワード、アクセスのカスタムメイドやウェブシステムの開発などをリーズナブルな価格で承っております。

そのマクロ、部下が1時間残業して作ってませんか?

あなたの部下は時給1,000円以下ですか?

  • エクセル、アクセスのデータ、マクロが1,000円から発注できます。
  • 使用制限の無いオープンで安心なコ・ウェア・ライセンス。
  • コ・ウェアなら、部下に命令するより安上がりです。

業者との会議に10万円以上の人件費が飛んでませんか?

仕様の決定に過大な時間とコストをかけていませんか?

  • その費用で、たたき台となるプロトタイプを作れます。
  • 初号機に不満が無ければ、そのまま完成品として現場に投入できます。
  • 完全オープンなコードなので、続きを別の業者に発注してもよいのです。
  • コ・ウェアなら、大きな失敗を防げます。
2011.5.12 更新