Setup Options (1)ウィンドウ
Setup Options (1)ウィンドウはAnalyzer用の設定値を設定するウィンドウです
* 抽出関係のオプションは一部ダウンローダも使用します。

<General タブ>
(1). settingフォルダー内のSetup Options (1)ウィンドウ用のsettingファイルがリスト表示されます。設定をインポートしたい場合は項目をダブルクリックするか(2)のimportボタンを使用してください。
(2). 押すと選択されている設定ファイルを読み込み(ダブルクリックでもokです、タブ内に表示されている設定項目値が変更されます。(各設定値を実際に有効にするにはこの後に(25)のupdateボタンを使用してください)
(3). タブ内に表示されている各設定値をsettingファイルとして書き出します。
(4). クリックしたりするとファイル名とかステータスが表示されます。
(5). Analyzer上にあるreject extensionチェックボックスで使用する設定値を設定します(複数の場合は ","で区切っってください)
ここに入力されている拡張子がファイルの拡張子に含まれている時はリンク抽出を開始しなくなります。
この機能をオンにするにはAnalyzer上にあるreject extensionチェックボックスもオンにしてください。
(6). チェックをいれるとcgiへのリンクを抽出しません。
(7). チェックをいれるとcgiへのリンクを抽出しません。
(8). チェックをいれるとメールアドレスへのリンクを抽出しません
(9). チェックをいれるとdirectoryへのリンクを抽出しません。
(10). チェックをいれると外部サーバーへのリンクを抽出しません。
(11). チェックをいれると外部サーバーかどうかの判断が少し厳しくなります(あまり変わりませんが(^^;)
(12). チェックをいれておくとドット以降の文字をすべて拡張子とみなします。
(13). 通常はオフにしておいてください。
(14). 通常はonにしておいてください。
(15). チェックを入れるとリンク抽出時にファイル名中にアンカーネームが含まれていた場合はアンカーネームを削除するようになります。リンク追跡をオンにしている場合はこれもなるべくオンにしておいてください。
(16). Link AnalyzerでOnline Connect したさいに、ページがHD上のLemon_Analyzer_Cacheフォルダーに保存されるようになります。
ファイル転送が失敗に終わった場合は保存しません。またタイムアウト時はファイルサイズが正常、または確認できなかった(サーバーからサイズが送られてこなかった)場合のみ保存されます。
(17). このチェックをオンにすると(16)(17)の機能がオンでHD上にファイルが保存される時にURLを元にサイトのdirectory構造をHD上に再現するようになります。
* エラーでファイルが取得できなかった場合でもdirectoryはHD上に作成されます
(18). リダイレクト時にRefererを自動的に設定してそれをRefererとして使用するようになります。
(19). Analyzer上のconnectボタン使用時でリンク追跡ゼロの場合、通常 40x や50x のエラーを受け取った時リトライはしないようになっていますが、これにチェックをいれると403や404以外では自動でリトライするようになります。
* リンク追跡が1以上ならチェックをいれなくても自動でリトライします。
(20). Setup Accept Filter (Analyzerでのリンク抽出時指定した拡張子をもつもののみ抽出する場合、ここで拡張子を設定しておきます。実際に設定をenableにするにはanalyzer上の各該当するチェックボックスをオンにしてください)
editfieldに抽出したいファイルの拡張子を入力します。(拡張子のみ入力してください(拡張子の前についているドットは入力しないでください)
(21). これがオフの状態では、抽出時にURL内の拡張子にここに登録されている文字列(拡張子)が含まれているだけでokとみなし抽出します。オンの状態ではURL内の拡張子=ここに登録されている文字列(拡張子)の場合のみ抽出します。
* 例えばチェックオフで 文字列(拡張子)を"htm"として1つだけ登録したとします。この場合URL内の拡張子が html や shtml でも"htm"が含まれているのでokとみなされ抽出されます。(チェックがオンの場合はイコールではないのでこの場合抽出されません)
(22). パネル上のすべての設定値をアプリが内部に持っている初期値(初めて起動した時に設定されている値)に変更されます。
(23). パネル上のすべての設定値を実際の設定値(設定ウィンドウがオープンされた時に表示されていた値に変更します。
(24). 各設定値を変更せずにwindowをクローズします。
(25). 各設定値を実際に変更し、windowをクローズします。



<抽出時のオプション(Special)と(Flash)の設定をおこなうタブです>
(1). 抽出オプションのspecial(Startとして設定してある文字列から始まり、Endとして設定してある文字列までを抽出します)で使用される開始文字列を入力してください。
(2). 抽出後の文字列にStartとして設定されている文字列も含む場合はチェックを入れて下さい。
(3). 抽出オプションのspecialで使用される終了文字列を入力してください。
(4). 抽出後の文字列にEndとして設定されている文字列も含む場合はチェックを入れて下さい。
(5). End文字列として改行(chr(13))を指定したい場合はチェックを入れてください
(6). チェックオンの場合検索時に改行コードの有無をチェックして、あれば行ごとに検索するようになります。
(7). チェックオンで、ピックアップされた文字列をURLと仮定して通常通り、ルートからのパスかどうかのチェックをするようになります。
(8). 抽出した文字列中にあるtag("<"から">"まで)を削除するオプションです
(9). Analyzer上のflash抽出のためのオプションです。通常はオンにしておいてください(URL(文字列)がうまく抽出されなかった場合はオフにしてみてください)


<Mode 2 タブ>


(1). 抽出モード2に使用する正規表現を入力します。
(2). 何番目の部分表現を抽出する文字列とするかを指定します。
(3). チェックをいれると大文字小文字を区別します。
(4). チェックをいれると"."が改行文字にもマッチするようになります。
(5). オンで最長、オフにすると最も短いパターンにマッチするようになります。
(6). チェックをいれると抽出した文字列をURLとしてチェックします。
(7). Generalタブ内のReject Filter設定を使用する場合はチェックをいれてください。
(8). Accept Filter設定(指定した拡張子をもつもののみ抽出する)を有効にする場合はチェックをいれてください。
(9). 選択されているフィールド上のカーソルを一番後ろに移動します。
(10). 選択されているフィールドをクリアします。
(11). Stockウィンドウに登録されている正規表現がリスト表示されます。 選択するとフォーカスされているフィールド上に入力されます。


<Following Links タブ>



(1). チェックをいれておくと同じURLは追跡しません。
(2). リンク追跡時に追跡するファイルの拡張子を設定します。(ここに入力されている文字列が拡張子内に含まれていれば(拡張子そのものでなくても)追跡します。複数指定する場合は "htm,jpg" などのように","で区切ります。
(3). チェックをいれておくとリンク追跡のためにQueに登録されたURLが、Lemon_Outフォルダー内の "Log_Analyze(AutoPilot)" というファイルに保存されていきます。
(4). directoryへのリンクも追跡する時はチェックをいれてください。
(5). チェックをいれておくと自分自身と同じファイルなら追跡しません。
(6). チェックをいれておくと自分自身と同じURLなら追跡しません((5)にもチェックを入れておく必要があります)
(7). チェックをいれておくと自分自身よりも上の階層へのリンクは追跡しません。
(8). チェックをいれると外部サーバーへのリンクを追跡しません。 (この機能はReject Filter設定のOutside(server)#1がチェックOFFの場合のみ機能します)
* "外部サーバーへのリンクを抽出する/追跡する" 場合は、
(Outside(server)#1)(8)共にチェック
OFFにします
* "外部サーバーへのリンクを抽出しない/追跡しない" 場合は、
(Outside(server)#1)(8)共にチェック
ONにします
* "外部サーバーへのリンクを抽出する/追跡しない" 場合は、
(Outside(server)#1)が
OFF、(8)をONにします