如何搜尋/型別
本書中作者可能包含的搜尋集中存在很大的差異。雖然一些人能夠明顯區分搜尋之間的差異,但另一些人則不能。為此,以下解釋了搜尋的型別。
網際網路搜尋引擎是一種旨在幫助您訪問儲存在網際網路上公共伺服器上的檔案的程式。搜尋引擎允許您請求符合特定標準(通常是包含特定單詞或短語的標準)的媒體內容,並檢索與這些標準匹配的檔案列表。資料收集是自動化的,由軟體完成,這些軟體通常被稱為網路爬蟲。
網路搜尋引擎的工作原理是儲存大量網頁的資訊,這些資訊是從全球資訊網本身檢索的。這些頁面由網路爬蟲檢索——一個自動化的網路瀏覽器,它會遵循它看到的每個連結。然後分析每個頁面的內容以確定如何對其進行索引(例如,從標題、標題或稱為元標記的特殊欄位中提取單詞)。有關網頁的資料儲存在索引資料庫中,以便在以後的查詢中使用。一些搜尋引擎,如谷歌,會儲存所有或部分源頁面(稱為快取)以及有關網頁的資訊。
當用戶訪問搜尋引擎並進行查詢時,通常是透過提供關鍵字,引擎會查詢索引並根據其標準提供最匹配網頁的列表,通常會附帶包含文件標題和有時包含部分文字的簡短摘要。
搜尋引擎的有用性取決於它返回的結果的相關性。雖然可能存在數百萬個包含特定單詞或短語的網頁,但有些網頁可能比其他網頁更相關、更受歡迎或更權威。大多數搜尋引擎採用方法對結果進行排名,以優先提供“最佳”結果。搜尋引擎決定哪些頁面是最匹配頁面以及以何種順序顯示結果的方式因引擎而異。隨著網際網路使用方式的變化和新技術的出現,這些方法也會隨著時間而改變。
大多數網路搜尋引擎都是商業性企業,由廣告收入支援,因此,一些搜尋引擎採用有爭議的做法,允許廣告商付費以使他們的列表在搜尋結果中排名更高。
索引和摘要資料庫作為紙質期刊索引的電子替代品而發展起來。從歷史上看,圖書館提供目錄來幫助查詢期刊、雜誌和報紙,但他們很少對每期中的文章進行編目。索引和摘要書籍和資料庫填補了這一空白。可以透過至少文章作者、文章標題和文章主題來搜尋電子索引。大多數索引都有更多方法可以訪問文章。
索引和摘要資料庫始終包含索引的文章資訊,有時包含摘要,很少包含文章的全文。在網際網路和谷歌時代,使用沒有全文的資料庫似乎過時了,但許多學術研究仍然依賴此類資料庫。
索引中新增文章主題詞是人工完成的(與自動化的計算機程式相比),這種新增帶來了積極和消極的影響。新增主題詞需要訓練有素的人員,而這些人需要得到報酬,因此會增加索引的成本。另一方面,能夠透過主題找到類似的文章可以節省大量時間。
引文索引跟蹤科學期刊中的哪些文章引用了哪些其他文章。這允許一個撰寫文章的人找出有多少人引用了他們的文章。
"圖書館目錄是圖書館中所有書目專案的登記簿。"書目專案可以是書籍、影片、肖像或任何其他被視為圖書館資料的物品。
搜尋引擎部分的大部分內容最初是從維基百科的搜尋引擎文章複製的。
圖書館目錄部分的第一句話引用自維基百科的圖書館目錄文章。