(1). ここにリンクを抽出したいファイル(HTMLソース、テキストなど)をドロップまたはペーストします。また(2)にアドレスを入力して connectボタン(6)でwebサーバーに接続して取得(DL)することもできます
(2). ソースのURL。
* (1)にドロップしたファイルのコメント欄にURLなどがある場合,自動的にここにはいります。それ以外の場合、またはURLが正しくない場合は手動で入力してください。(テキストドロップも可能です)
ソースをペーストした時など、そのソースのURLもペーストもしくは手動、またはテキストドロップで(2)に入力してください。これをしないと正しく抽出できない場合があります。
* (3)のConnectボタンを使用する場合はここに取得したいファイルのURLを入力します
(3). URL欄内のアドレスをLemonの選択されているブックマークにくわえます(ブックマークの選択には(48)を使用してください)
(4). ブックマーク。選択するとそのアドレスがURL欄にはいります。refererがセットされている場合はrefererもセットされます。
(5). 取り込まれているソースのファイル名(またはアドレス)が表示されます
(6). URL欄(2)に入力されているアドレスに接続してファイルをゲット(レジュームには対応してません)します。リンクを追跡させる場合は(21)のポップアップメニューで何階層までたどるか階層を指定してください("0"の場合は追跡しません/リンク抽出もスタートされません(ファイルを取得するだけです)
またSetup Options(1)ウィンドウやPreferencesパネルでも追跡のための各設定をしておく必要があります
(7). URL欄を空にします。
(8). ダウンロードの順番を待っている(Queueに登録されている)残りアイテム数が表示されます。(ダウンロードがスタートしている、または完了したアイテムは含まれません)
(9). Pause中に押すとQueueを編集できる下のウィンドウが開きます。
(10). GetURLボタン使用時に(11).のボタンをオンの場合。URLの取得と同時に(1)のフィールドにソース(や文字列)などが自動で入力されますが、このボタンをOffにしていると前の、元から(1)のフィールドに存在していたソース(や文字列)などは消去されずに残ったまま、その後に続いて入力されます。(オンの場合は今までどうり消去されてから入力されます)
(11). このボタンが押し込まれた状態でGetURLボタンを使用するとページのURLと同時にソースも取得します(ieとicabのみ)
(12). mozilla/Netscape6用GetURLボタンの動作をmozilla用かNetscape6用か切り替えます
(13). GetURLボタン。mozilla/Netscape6が開いているページのURLを取得します
(mozillaとNetscape6の切り替えは(12)のチェックボックスでおこないます。切り替えるとアイコンも変わります)
(14). GetURLボタン。iCABが開いているページのURLを取得します。
(15). GetURLボタン。Internet Explorerが開いているページのURLを取得します。
(16). GetURLボタン。Netscapet Communicator が開いているページのURLを取得します。
(17). 選択されているブックマークに登録してある全ページを自動で取得、リンクを抽出します。(リトライ時レジュームには対応してません)
リンクを追跡させる場合は(21)のポップアップメニューで何階層までたどるか階層を指定してください("0"の場合は追跡しませんが取得完了したページのリンクの抽出はおこなわれます)またSetup Options(1)ウィンドウやPreferencesパネルでも追跡のための各設定をしておく必要があります
タイムアウトした場合、取得済みサイズがサーバーが送ってきたcontent-lengthと同じなら、okとみなし抽出を開始します。それ以外はリトライします。(一部例外あり)
指定されている最後の回数目のリトライでもDLに失敗した場合はリンク抽出はされずに次ファイルの取得に入ります。
(18). ConnectやAutoPilotボタン使用時、リンク追跡/抽出を一時停止させます。抽出時に押された場合、
ListWindowへのリンク抜き出しはストップせず、Queueへの登録のみ停止されます。
(Pauseボタンが押された時にアクセスまたは抽出途中だったURLはQueueの一番上に再登録されます)
(19). 取得中のページをキャンセルして次のページの取得にはいります(キャンセルした場合リンクの抽出はおこなわれません)
(20). statusが表示されます
(21). リンクを追跡する場合、何階層まで追跡するかを指定します("0"の場合は追跡なしになります)
(22). チェックを入れると抽出されたURLにRefererとして(2)に入力されているアドレスが設定されるようになります。このRefererはAutoPilot機能使用時やURL List Window上にあるDownloaderボタン使用時に自動的に使用されます
(23). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(href解析時用)
(24). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(src(29)解析時用)
(25). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(javascript(30)解析時用)
(26). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(action(31)解析時用)
(27). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(flash(32)解析時用)
* (23).(24).(25).(26).(27).(28)のチェックボックスをオンにした場合、Setup Options(1) Window内のSetup Accept Filterに拡張子を設定/登録する必要があります(チェックボックスをオンにした場合、登録されている拡張子をもつものだけ抽出されます。すべて抜き出す場合はこれらのチェックをオフにしてください)
(28). リンク(URL)がもつファイル拡張子で抽出を制限する場合。(special(33)解析時用)
(29). src="" 形式のリンクも抜き出す時はチェックをいれます。frame内にあるページを追跡して抽出する場合はチェックを入れておく必要があります。
(30). Javascript形式(解析はしてません)のリンクも抜き出す時はチェックをいれます。
(31). action="" 形式のリンクも抜き出す時はチェックをいれます。
(32). flash内のリンクも抜き出す時はチェックをいれます(これは適当に抜き出しているだけです(^^;)これをオンにするときは、なるべく(26)をオン+(32)で抜き出す拡張子の指定もしてください。
(33). スタートとして設定してある文字列から始まり、エンドとして設定してある文字列までを抽出します。このオプションの設定は(34)のボタンを押してオープンされる Setup Options(1) ウィンドウ内でおこなってください。
(34). Setup Options(1) Window を開きます。
(35). 取り込んだソースを消去します。
(36). リンク抜き出し中などの場合、作業を途中でストップさせます。
(37). リンク抽出をスタートさせます。
(38). ドロップまたはペーストされたソースのバイトサイズ。接続中の場合はDL済みのサイズになります。
(39). (1)のフィールド内にある文字列中からこのフィールドに入力されている文字列を(42).(43).のボタンを使用して検索します
(40). (43)のボタンを使用/検索してピックアップされた文字列の色を黒に戻します
(41). (42)のボタン使用後にもう一度文字列の最初から検索したい場合に使用してください。
(42). 最初から/または前回ヒットした文字列の後ろから検索開始します。
(検索途中で最初から検索したくなった場合は(41)のボタンを使用してください)
(43). 最初から最後まで一度に検索します(ピックアップされた文字列は赤色で表示されています。赤色になったものは、(40)のボタンで元に戻せます)
ヒットした数は(20)に表示されます
(44). チェックをいれるとSetup Options(1) Window内のReject Extensionでの設定を使用します。(ファイルの拡張子にReject Extensionでの設定値が含まれる場合は抽出を開始しません)
(45). (1)のフィールド内にある文字列を編集するためのウィンドウが開きます。
(46). 抽出モードを切り替えます。
0-1.1b7までのモードです。(次バージョンのv1.3で削除する予定です)
1-現在のデフォルトモードです。
2-登録されている正規表現を使用して抽出するモードです。
(Setup Options(1) Windowで使用する正規表現を登録する必要があります。)
(47). チェックをいれておくと抽出モード0または1の時にモード2も実行されるようになります。
(48). 押すとbookmarkが切り替わります。(0または1)
(49). GetURLボタン使用時にソース入力欄にクリップボード内の文字列が自動でペーストされます。srcボタンもオンの場合はsrcボタンの方が優先されます。(srcボタンはIE / iCABのみ動作します)
Queue編集Window (9).のボタンを押すとこのウィンドウが開きます
(1). 登録されているURLが表示されます。
(2). 登録されているURLの数が表示されます。
(3). 選択されているCustom Refererを削除します(Pref内のReferer(Default)値がRefererとして使用されるようになります)
(4). 選択されているURLを削除します。
(5). 選択されているURLを上下に移動します。
(6). Editコマンドを切り替えます
(7). 選択されているURLまたはRefererに含まれている(7)の文字列を(8)に入力されている文字列に置き換えます。(8)を空にしている場合はネーム中から(7)に入力されている文字列が削除されます
(8). (7)を参照してください
(9). Editコマンドを実行させます。
(10). 変更せずにウィンドウをクローズします。
(11). 編集したとおりにQueueを更新します。
< Tips - Analyzer >
HTMLソースからリンクを手動で抽出する場合の簡単な説明です。
* リンク抽出のためのLemonへのソース取り込み方法は上記のアイコンへの
ファイルドロップとAnalyzerのSource Field(取り込んだソースが
表示されている所)へのファイルドロップ、
直接 LemonのAnalyzerへソースをペーストする、
アドレスを入力して webサーバーに接続して取得する、
... の4通りの方法があります。
* Source Fieldへファイルドロップした場合ファイルの コメント欄にURLが
入っていると 自動的にそれを取得します。 ない場合は別にアドレスも
Source URL欄にペーストまたは入力 してください。
* ペーストする場合は起動しているブラウザーの
メニュー>Page Source (Netscape(us)の場合、IE(us)の場合は"Source"、
iCabの場合は"Show Source")を 選択、ソース表示後、 すべて選択し Lemonへ ペーストしてください。
(この時、そのソースのアドレスも Lemonへペーストまたは、Analyzer上にある GetURLボタンで取りこんでください。)
* webサーバーへ接続して取得する場合はSource URL欄に取得したいファイルの
アドレスを いれてconnectボタンをおします。これでソース(ファイル)が取り込まれます。
あとは Source Type を "HTML src"にしてAnalyzeボタンをおすだけです。
( 内やJavaScript形式内のリンクも抽出するときは それぞれのチェックBoxに チェックをいれておいてください。 )
リンク追跡について
指定した階層までのリンク追跡はConnectボタン/AutoPilotボタンどちらでも有効です。
(階層を"0"に指定した場合のみ上記各ボタンの動作が少し異なります)