使ってみればだいたい分かると思いますが、 基本的にはメニューとツールバーボタンとトラックバーで操作します。
音声ファイル(*.wav) を「ファイルを開く」メニューか、 ドラッグ&ドロップでファイルをドロップして開いて下さい。 また、コマンドプロンプト上から seimon (file名) と打っても起動できます。
計算を始めてしばらくすると画面上に声紋の画像が表示されます。 どうも画像が見づらいと感じた時は右のトラックバーでコントラストを調整してください。
後は声紋画像をクリップボードにコピーしたりファイルに保存したり、 リアルタイム演奏で時間毎の声紋の変化を見るなりして下さい。
声紋の見方ですが、縦軸は「周波数」、横軸は「時間」をあらわしており、 色の明るさは 赤 → 黄色 → 緑 → 青 → 黒 の順にその成分の強さを示しています。
また、声紋画像上の点をクリックすると、下のツールバーにその点の周波数、 強さ(パワースペクトル値)、もっとも近い音階が表示されます。 音階の表示は「オクターブ+音階」の形式になっています。
終了するときはメニューの「終了」か、右上の終了ボタンを押してください。
なお、こういう音声解析系のアプリケーションの宿命なのかメモリを結構食います。 メモリの少ないマシンであまりにも大きい音声ファイルを開こうとすると メモリスワップ地獄に陥ります。目安としては、開こうとするファイルのサイズの 3、4 倍位のメモリを必要であると覚えておいて下さい。
各トラックバー、メニューバー、 ツールバーボタンには次の機能が割り当てられています。 主要な機能にはショートカットキーが割り当てられており、 キーボードのみでの操作も可能です。ショートカットキーの 割り当てについてはメニューをご覧になってください。
トラックバー
・上トラックバー … 時間を指定するのに使います。
・右トラックバー … 画像のコントラストを調整します。 どうも画像が見づらいと思ったら上下させてみてください。 ツールバーの右にコントラストの調節値が表示されています。
ファイルメニュー
・「ファイルを開く」、「ファイルを閉じる」 … 音声ファイル(*.wav) を開いたり閉じたりします。
・「声紋画像の保存」 … 声紋画像をファイルとして保存します。
・「終了」 … アプリケーションを終了します。
編集メニュー
・「声紋のコピー」 … 声紋画像をクリップボードにコピーします。
・「リセット」 … 画面比率やコントラストを初期状態に戻します。
・「詳細設定」 … 離散フーリエ変換時の分割ポイント数や窓関数や周波数軸、スペクトル軸の スケール指定などの設定をします。
ポイント数を大きくすると周波数の分解能は良くなりますが、 時間ごとの分解能は低くなります。詳しいことは信号処理の本などを参照してください
演奏メニュー
・「再生、停止、巻き戻し etc.」 … 音声ファイルを再生したり停止したりします。
表示メニュー
・「画像の拡大」 …画像を拡大して表示します。
・「声紋」、「スペクトル」「波形」 … アクティブなウィンドウを声紋にするか、パワースペクトル表示にするかを選択します。 声紋ウィンドウの場合は縦軸は周波数、横軸は時間となり、 パワースペクトルの場合は縦軸は各周波数成分の強さ、横軸は周波数となります。 また波形ウィンドウを開くと波形が表示されます。
・「時間軸表示」 … 声紋表示の時に、時間軸の補助線を表示するかを選択します。
・「重ねて表示、縦に並べて表示」 … 声紋画像とスペクトル画像を重ねて表示したり並べて表示します。
ヘルプメニュー
・「ヘルプ」 … ヘルプファイルを表示します。
・「バージョン情報」 … 現在のバージョンを表示します。