跳轉至內容

PlanoTse求職自動化/響應手冊

來自Wikibooks,開放世界中的開放書籍
PlanoTse求職自動化手冊
資料項型別 響應 XML案例研究

響應資料持有者

[編輯 | 編輯原始碼]

PlanoTse是一個用於挖掘全球資料的個人工具。這意味著網頁搜尋自動化。它的一種應用是在求職自動化中。PlanoTse中的資料型別之一是響應。它是一個資料持有者,用於儲存原始和派生的網頁資料。響應和指令碼是PlanoTse中兩種最重要的資料持有者型別。

網頁搜尋中,瀏覽器上顯示的每個網頁都稱為HTTP響應。當您輸入網頁地址並要求瀏覽器轉到該地址時,您會發出一個HTTP請求。在網頁搜尋自動化中,會自動生成許多HTTP請求,並且許多HTTP響應(即檢索到的網頁)會從各種Web伺服器傳送回給您。作為網頁搜尋自動化流程的一部分,PlanoTse對每個返回的網頁執行以下步驟

如何處理HTTP響應
  1. 建立一個響應資料持有者,將其儲存為XML檔案。例如,Response12345.xml,其中12345是資料持有者的ID號。
  2. 將網頁內容儲存在HTML檔案中,例如Response12345.htm
  3. 將網頁上找到的所有無用連結儲存在XML檔案中,例如Response12345.RemovedLinks
  4. 將網頁上找到的所有有用文字和連結儲存在HTML檔案中,例如Response12345.txt
  5. 等等。

響應 - 資料項集合

[編輯 | 編輯原始碼]

對於特定的資料域,所有響應持有者都儲存在同一個集合目錄下,其名稱為Responses。此目錄位於MyData(對於個人域)或OurData(對於非個人域)下。當然,所有這些都位於資料根目錄下,如選單命令[工具 » 目錄 » 資料根目錄]中所知。

響應附件資料夾

[編輯 | 編輯原始碼]

每個響應持有者的名稱為Response12345.xml,其中12345是持有者編號。附帶有一組資料項附件。資料項的所有附件都儲存在資料項資料夾中。

PlanoTse求職自動化手冊
資料項型別 響應 XML案例研究
華夏公益教科書