智慧財產權與網際網路/搜尋引擎

搜尋引擎是一種軟體系統,旨在搜尋網際網路網頁上的資訊。服務的響應通常以垂直列表形式呈現,通常稱為結果頁面。資訊可能是網頁、影像、影片、地圖和其他型別的檔案的混合。一些搜尋引擎還會從公共資料庫或開放目錄中挖掘資料。與僅由人工編輯維護的網頁目錄不同,搜尋引擎還會透過執行網路爬蟲來維護即時資訊,網路爬蟲會將其搜尋演算法應用於它找到的所有新網頁和已更改網頁。一般來說,無法被網路搜尋引擎搜尋的網際網路內容被稱為“深層網路”。
| 年份 | 引擎 | 當前狀態 |
|---|---|---|
| 1993 | W3Catalog | 不活躍 |
| Aliweb | 不活躍 | |
| JumpStation | 不活躍 | |
| 全球資訊網蠕蟲 | 不活躍 | |
| 1994 | WebCrawler | 活躍(聚合器) |
| Go.com | 不活躍(重定向到迪士尼) | |
| Lycos | 活躍 | |
| Infoseek | 不活躍(重定向到迪士尼) | |
| 1995 | Daum | 活躍 |
| 麥哲倫 | 不活躍 | |
| Excite | 活躍 | |
| SAPO | 活躍 | |
| 雅虎! (目錄) | 活躍(自 2004 年起稱為雅虎!搜尋) | |
| AltaVista | 不活躍(被雅虎!收購:2003 年,重定向:2013 年) | |
| 1996 | Dogpile | 活躍(聚合器) |
| Inktomi | 不活躍(被雅虎!收購) | |
| HotBot | 活躍(Lycos.com) | |
| Ask Jeeves | 活躍(更名為 Ask.com) | |
| 1997 | 北方之光 | 不活躍 |
| Yandex | 活躍 | |
| 1998 | 谷歌 | 活躍 |
| Ixquick | 活躍(Startpage 的別名) | |
| MSN 搜尋 | 活躍(作為必應) | |
| empas | 不活躍(與 NATE 合併) | |
| 1999 | AlltheWeb | 不活躍(重定向到雅虎!) |
| GenieKnows | 活躍(更名為 Yellowee.com) | |
| Naver | 活躍 | |
| Teoma | 不活躍(重定向到 Ask.com) | |
| Vivisimo | 不活躍 | |
| 2000 | 百度 | 活躍 |
| Exalead | 活躍 | |
| Gigablast | 活躍 | |
| 2001 | Kartoo | 不活躍 |
| 2003 | Info.com | 活躍 |
| Scroogle | 不活躍 | |
| 2004 | 雅虎! 搜尋 | 活躍(最初為雅虎! (目錄),1995 年) |
| A9.com | 不活躍 | |
| 搜狗 | 活躍 | |
| 2005 | AOL 搜尋 | 活躍 |
| SearchMe | 不活躍 | |
| 2006 | 搜搜 | 不活躍(重定向到搜狗) |
| Quaero | 不活躍 | |
| Search.com | 活躍 | |
| ChaCha | 不活躍 | |
| Ask.com | 活躍(最初為 Ask Jeeves,1996 年) | |
| Live Search | 活躍(作為必應,最初為 MSN 搜尋,1998 年) | |
| 2007 | wikiseek | 不活躍 |
| Sproose | 不活躍 | |
| 維基百科搜尋 | 不活躍 | |
| Blackle.com | 活躍(谷歌的別名) | |
| 2008 | Powerset | 不活躍(重定向到必應) |
| Picollator | 不活躍 | |
| Viewzi | 不活躍 | |
| Boogami | 不活躍 | |
| LeapFish | 不活躍 | |
| Forestle | 不活躍(重定向到 Ecosia) | |
| DuckDuckGo | 活躍 | |
| 2009 | 必應 | 活躍(最初為 MSN 搜尋,1998 年) |
| Yebol | 不活躍 | |
| Mugurdy | 不活躍 | |
| Scout(由 Goby 提供) | 活躍 | |
| NATE | 活躍 | |
| Ecosia | 活躍 | |
| 2010 | Blekko | 不活躍(出售給 IBM) |
| Cuil | 不活躍 | |
| Yandex(英文) | 活躍 | |
| 2011 | YaCy | 活躍(點對點搜尋引擎) |
| 2012 | Volunia | 不活躍 |
| 2013 | Qwant | 活躍 |
| Infoseek | 不活躍(重定向到迪士尼) | |
| 2014 | Egerin | 活躍(庫爾德語/索拉尼語搜尋引擎) |
| 2015 | Cliqz | 活躍(瀏覽器整合搜尋引擎) |
| 2016 | Search Encrypt | 活躍 |
網際網路搜尋引擎本身早於 1990 年 12 月的全球資訊網首次亮相。Who is 使用者搜尋可以追溯到 1982 年[1],而 Knowbot Information Service 多網路使用者搜尋則首次在 1989 年實施[2]。第一個有據可查的搜尋引擎搜尋內容檔案(即 FTP 檔案)是Archie,它於 1990 年 9 月 10 日首次亮相[3]。
在 1993 年 9 月之前,全球資訊網完全由人工索引。蒂姆·伯納斯-李編輯了一個網頁伺服器列表,並託管在 CERN 網站上。谷歌網的一個 1992 年列表快照仍然存在[4],但隨著越來越多的網頁伺服器上線,中央列表再也無法跟上。在 NCSA(國家超級計算應用中心)網站上,新伺服器在標題“最新內容!”[5]下宣佈。
第一個用於搜尋 網際網路上內容(而不是使用者)的工具是 Archie[6]。這個名字代表“archive”,沒有“v”。它是由艾倫·埃姆蒂奇、比爾·希蘭和 J. 彼得·德意志建立的,他們都是加拿大魁北克省蒙特利爾麥吉爾大學的計算機科學學生。該程式下載了位於公共匿名 FTP(檔案傳輸協議)站點上的所有檔案的目錄列表,以建立一個可搜尋的檔名資料庫;但是,Archie 搜尋引擎並沒有索引這些站點的內容,因為資料量非常有限,可以很容易地人工搜尋。
Gopher(1991 年由明尼蘇達大學的馬克·麥卡希爾建立)的興起導致了兩個新的搜尋程式:Veronica 和 Jughead。與 Archie 類似,它們搜尋了儲存在 Gopher 索引系統中的檔名和標題。Veronica(Very Easy Rodent-Oriented Net-wide Index to Computerized Archives)提供了對整個 Gopher 列表中大多數 Gopher 選單標題的關鍵字搜尋。Jughead(Jonzy's Universal Gopher Hierarchy Excavation And Display)是一個用於從特定 Gopher 伺服器獲取選單資訊的工具。“Archie 搜尋引擎”這個搜尋引擎的名稱不是對 Archie 漫畫系列的引用,但“Veronica”和“Jughead”是該系列中的角色,因此引用了它們的前輩。
在 1993 年夏天,還沒有為網路建立搜尋引擎,儘管許多專門的目錄是由人工維護的。日內瓦大學的奧斯卡·尼爾斯塔茲編寫了一系列 Perl 指令碼,這些指令碼定期映象這些頁面並將它們改寫成標準格式。這為 W3Catalog(網路上第一個原始的搜尋引擎)奠定了基礎,W3Catalog 於 1993 年 9 月 2 日釋出[7]。
1993 年 6 月,當時在麻省理工學院的馬修·格雷製作了可能是第一個網路機器人,基於 Perl 的全球資訊網漫遊器,並使用它來生成一個名為“Wandex”的索引。漫遊器的目的是測量全球資訊網的大小,它一直這樣做,直到 1995 年底。網路上的第二個搜尋引擎 Aliweb 出現在 1993 年 11 月。Aliweb 沒有使用網路機器人,而是依賴於網站管理員通知它在每個站點上是否有一個特定格式的索引檔案。
國家超級計算應用中心的 Mosaic™ 網頁瀏覽器不是第一個存在的瀏覽器,但它是第一個引起轟動的人[8]。1993 年 11 月,Mosaic v1.0 透過包含圖示、書籤、更具吸引力的介面和圖片等功能,從現有瀏覽器的眾多小包中脫穎而出——這些功能使軟體易於使用,並吸引了“非極客”。
JumpStation(由喬納森·弗萊徹於 1993 年 12 月建立[9])使用網路機器人來查詢網頁並構建其索引,並使用網路表單作為其查詢程式的介面。因此,它是第一個將網路搜尋引擎的三個基本特徵(爬取、索引和搜尋)組合起來的 WWW 資源發現工具,如下所述。由於它執行的平臺上的資源有限,它的索引僅限於爬蟲遇到的網頁中的標題和標題,這種限制自然也延伸到對其執行的搜尋。
第一個“全文字”基於爬蟲的搜尋引擎之一是 WebCrawler,它誕生於 1994 年。與它的前輩不同,它允許使用者搜尋任何網頁上的任何單詞,這已經成為現代所有主要搜尋引擎的標準。它也是第一個被公眾廣泛知曉的搜尋引擎。1994 年晚些時候,Lycos(起源於卡內基梅隆大學)釋出,並在該領域成為一個主要的商業嘗試。
很快,許多搜尋引擎出現,並爭奪人氣。這些包括麥哲倫、Excite、Infoseek、Inktomi、北方之光和 AltaVista。雅虎! 是人們查詢感興趣網頁的最受歡迎的方式之一,但它的搜尋功能執行在其網頁目錄上,而不是其網頁的全文副本。資訊搜尋者還可以瀏覽目錄,而不是進行基於關鍵字的搜尋。
1996 年,網景公司希望與一家搜尋引擎達成獨家協議,將其作為其同名網路瀏覽器的特色搜尋引擎。 由於對此事興趣濃厚,網景公司最終與五家主要的搜尋引擎達成協議:每家搜尋引擎每年支付 500 萬美元,並在網景搜尋引擎頁面輪流展示。 這五家引擎分別是:雅虎、麥哲倫、萊科斯、資訊尋求者和激動。 [10][11]
谷歌於 1998 年從一家名為 goto.com 的小型搜尋引擎公司那裡採用了出售搜尋詞的想法。 此舉對搜尋引擎行業產生了重大影響,該行業從苦苦掙扎轉變成網際網路上最賺錢的行業之一。 [12]
搜尋引擎也被認為是 20 世紀 90 年代末網際網路投資熱潮中最耀眼的明星。 [13] 多家公司以驚人的速度進入市場,並在首次公開募股時獲得了創紀錄的收益。 有些公司已經撤下了其公共搜尋引擎,並正在推廣企業專用版本,例如北極光。 許多搜尋引擎公司陷入了網際網路泡沫的泥潭,網際網路泡沫是一個由投機驅動的市場繁榮,於 1999 年達到頂峰,並於 2001 年結束。
- 2000 年左右,谷歌的搜尋引擎開始崛起。 [14] 透過一項名為 PageRank 的創新技術,該公司在許多搜尋方面取得了更好的結果,正如 Sergey Brin 和 Larry Page(谷歌的創始者)在名為《搜尋引擎剖析》的論文中所解釋的那樣。 [15] 這種迭代演算法根據連結到該網站和其他頁面的其他網站和頁面的數量和 PageRank 對網頁進行排名,其前提是優秀或理想的頁面比其他頁面擁有更多連結。 谷歌還為其搜尋引擎維護了一個極簡的介面。 相反,它的許多競爭對手將搜尋引擎嵌入到一個網路入口網站中。 事實上,谷歌搜尋引擎變得如此流行,以至於出現了像神秘搜尋者這樣的模仿引擎。
到 2000 年,雅虎開始提供基於 Inktomi 搜尋引擎的搜尋服務。 雅虎於 2002 年收購了 Inktomi,並在 2003 年收購了 Overture(擁有 AlltheWeb 和 AltaVista)。 雅虎使用谷歌搜尋引擎直到 2004 年,當時它推出了自己的搜尋引擎,該搜尋引擎基於其收購的公司的技術組合。
微軟於 1998 年秋季首次推出了 MSN 搜尋,它使用的是 Inktomi 的搜尋結果。 在 1999 年初,該網站開始顯示來自 Looksmart 的列表,這些列表與來自 Inktomi 的結果混合在一起。 在 1999 年的一小段時間內,MSN 搜尋使用了 AltaVista 的結果。 在 2004 年,微軟開始過渡到自己的搜尋技術,該技術由其自己的網路爬蟲(稱為 msnbot)提供支援。
微軟的重新品牌搜尋引擎必應於 2009 年 6 月 1 日推出。 2009 年 7 月 29 日,雅虎和微軟最終敲定了一項協議,雅虎搜尋將由微軟必應技術提供支援。
方法
[edit | edit source]搜尋引擎會以近乎即時的速度維護以下流程
- 網路爬取
- 索引
- 搜尋[16]
網路搜尋引擎透過從一個網站到另一個網站的網路爬取來獲取資訊。 "蜘蛛" 會檢查針對它的標準檔名 robots.txt,然後根據許多因素(例如標題、頁面內容、JavaScript、層疊樣式表 (CSS)、標題(如標準 HTML 標記中所顯示的資訊內容或其在 HTML 元標記中的元資料)將某些資訊傳送回以進行索引。 "沒有一個網路爬蟲能夠實際爬取整個可訪問的網路。 由於網站數量無限、蜘蛛陷阱、垃圾郵件以及真實網路的其他緊急情況,爬蟲會使用爬取策略來確定何時應認為對某個網站的爬取足夠。 一些網站會被徹底爬取,而另一些網站只會被部分爬取"。 [17]
索引是指將網頁上找到的單詞和其他可定義的標記與其域名和基於 HTML 的欄位關聯起來。 這些關聯在公開資料庫中建立,以供網路搜尋查詢使用。 使用者的查詢可以是一個詞。 索引有助於儘快找到與查詢相關的資訊。 [16] 一些索引和快取技術是商業機密,而網路爬取則是以系統的方式訪問所有網站的簡單過程。
在 "蜘蛛" 的訪問之間,搜尋引擎工作記憶體中儲存的頁面的快取版本(呈現該頁面所需的部分或全部內容)會快速傳送給查詢者。 如果訪問已過期,搜尋引擎可以充當網頁代理。 在這種情況下,該頁面可能與索引的搜尋詞不同。 [16] 快取的頁面保留了其詞語被索引的版本的顯示外觀,因此,當實際頁面丟失時,頁面的快取版本對網站很有用,但這個問題也被認為是連結腐爛的一種輕微形式。

通常,當用戶在搜尋引擎中輸入查詢時,它通常包含幾個關鍵詞。 [18] 索引中已經包含了包含這些關鍵詞的網站的名稱,這些名稱會立即從索引中獲取。 實際的處理負載在於生成作為搜尋結果列表的網頁:列表中的每個頁面都必須根據索引中的資訊進行加權。 [16] 然後,最頂部的搜尋結果項需要查詢、重建和標記顯示匹配關鍵詞上下文的 "片段"。 這些只是每個搜尋結果網頁所需處理的一部分,而後續頁面(緊隨最頂部)需要進行更多這種後處理。
除了簡單的關鍵詞查詢之外,搜尋引擎還提供自己的基於 GUI 或命令的運算子和搜尋引數來最佳化搜尋結果。 這些提供了使用者在反饋迴圈中進行 "過濾" 和 "加權" 時所需的控制,這些反饋迴圈是使用者在檢視初始搜尋結果的第一頁時建立的。 例如,從 2007 年開始,Google.com 搜尋引擎允許使用者透過點選初始搜尋結果頁面最左側欄中的 "顯示搜尋工具",然後選擇所需的日期範圍來按日期 "過濾"。 [19] 也可能按日期 "加權",因為每個頁面都有一個修改時間。 大多數搜尋引擎支援使用布林運算子 AND、OR 和 NOT 來幫助終端使用者最佳化搜尋查詢。 布林運算子用於字面搜尋,允許使用者最佳化和擴充套件搜尋詞。 引擎會按輸入的準確方式查詢單詞或短語。 一些搜尋引擎提供一種名為 "鄰近搜尋" 的高階功能,允許使用者定義關鍵詞之間的距離。 [16] 還有基於概念的搜尋,其中研究涉及對包含您搜尋的單詞或短語的頁面進行統計分析。 此外,自然語言查詢允許使用者以向人類提問的方式輸入問題。 [20] 像這樣的網站是 ask.com。 [21]
搜尋引擎的有用性取決於它返回的 "結果集" 的相關性。 雖然可能存在數百萬個包含特定單詞或短語的網頁,但有些網頁可能比其他網頁更相關、更受歡迎或更權威。 大多數搜尋引擎使用方法對結果進行排名,以便首先提供 "最佳" 結果。 搜尋引擎如何決定哪些頁面是最匹配的頁面,以及應該以什麼順序顯示結果,在不同的引擎之間差異很大。 [16] 隨著網際網路使用量的變化和新技術的不斷發展,這些方法也會隨著時間的推移而改變。 搜尋引擎主要發展出兩種型別:一種是人類已廣泛程式設計的預定義和分層排序關鍵詞系統。 另一種是透過分析找到的文字生成 "反向索引" 的系統。 第一種形式更多地依賴於計算機本身來完成大部分工作。
大多數網路搜尋引擎都是商業性企業,由 廣告 收入支援,因此其中一些搜尋引擎允許廣告商付費將其列表在搜尋結果中排名更高。 不接受搜尋結果付費的搜尋引擎透過在其搜尋結果旁邊展示與搜尋相關的廣告來賺錢。 每當有人點選這些廣告之一時,搜尋引擎就會賺錢。 [22]
市場份額
[edit | edit source]截至 2018 年 2 月,谷歌是全球最受歡迎的搜尋引擎,市場份額為 74.52%。 [23]
全球最受歡迎的搜尋引擎(市場份額 >1%)是
| 搜尋引擎 | 市場份額(截至 2018 年 2 月) | |
|---|---|---|
| 谷歌 | — | Template:Bartable |
| 必應 | Template:Bartable | |
| 百度 | Template:Bartable | |
| 雅虎! | Template:Bartable | |
東亞和俄羅斯
[edit | edit source]在一些東亞國家和俄羅斯,谷歌不是最受歡迎的搜尋引擎。
在俄羅斯,Yandex 的市場份額為 61.9%,而 Google 的市場份額為 28.3%。[24] 在中國,百度是最受歡迎的搜尋引擎。[25] 韓國本土搜尋門戶 Naver 在該國佔線上搜索量的 70%。[26] Yahoo! Japan 和 Yahoo! 臺灣分別是最受歡迎的日本和臺灣網際網路搜尋途徑。[27]
歐洲
[edit | edit source]西歐市場主要由 Google 主導,但也有一些例外,比如捷克共和國,Seznam 是一個強大的競爭對手。[28]
搜尋引擎偏差
[edit | edit source]雖然搜尋引擎被程式設計為根據網站的受歡迎程度和相關性的某種組合對網站進行排名,但實證研究表明,它們提供的資訊存在各種政治、經濟和社會偏見[29][30] 以及對該技術的潛在假設。[31] 這些偏見可能是經濟和商業過程(例如,在搜尋引擎上投放廣告的公司在搜尋結果中也會變得更受歡迎)和政治過程(例如,刪除搜尋結果以遵守當地法律)的直接結果。[32] 例如,Google 不會在法國和德國展示某些新納粹網站,在那裡否認大屠殺是非法的。
偏見也可能是社會過程的結果,因為搜尋引擎演算法經常被設計成以更“流行”的結果為代價排除非規範性的觀點。[33] 主要搜尋引擎的索引演算法傾向於覆蓋美國網站,而不是非美國國家的網站。[30]
Google Bombing 是操縱搜尋結果以達到政治、社會或商業目的的一種嘗試。
一些學者研究了搜尋引擎引發的文化變化[34] 以及它們的結果中某些有爭議的主題的呈現方式,例如愛爾蘭的恐怖主義[35] 和陰謀論。[36]
定製結果和過濾泡泡
[edit | edit source]許多搜尋引擎,如 Google 和 Bing,會根據使用者的活動歷史提供定製結果。這會導致一種被稱為過濾泡泡的效應。該術語描述了一種現象,即網站使用演算法根據使用者的相關資訊(如位置、過去的點選行為和搜尋歷史)有選擇地猜測使用者想看到什麼資訊。因此,網站往往只顯示與使用者過去觀點一致的資訊,有效地將使用者隔離在一個傾向於排除相反資訊的泡泡中。典型的例子是 Google 的個性化搜尋結果和 Facebook 的個性化新聞流。根據創造了這個詞的 Eli Pariser 的說法,使用者接觸到衝突觀點的機會減少了,他們在智力上被隔離在自己的資訊泡泡中。Pariser 轉述了一個例子,即一個使用者在 Google 上搜索“BP”,結果得到關於英國石油的投資新聞,而另一個搜尋者則得到關於深水地平線漏油事件的資訊,這兩個搜尋結果頁面“驚人地不同”。[37][38][39] 根據 Pariser 的說法,泡泡效應可能對公民對話產生負面影響。[40] 由於這個問題已被識別,出現了競爭的搜尋引擎,它們試圖透過不跟蹤或“過濾”使用者來避免這個問題,例如 DuckDuckGo。其他學者並不認同 Pariser 的觀點,他們認為支援他論點的證據缺乏說服力。[41]
基督教、伊斯蘭教和猶太教搜尋引擎
[edit | edit source]在過去十年中,網際網路和電子媒體在阿拉伯和穆斯林世界的全球發展鼓勵了中東和亞洲次大陸的伊斯蘭教信徒嘗試建立自己的搜尋引擎,建立自己的過濾搜尋門戶,使使用者能夠進行安全的搜尋。與通常的安全搜尋過濾器不同,這些伊斯蘭網路門戶將網站分類為“清真”或“禁戒”,基於現代專家對“伊斯蘭法”的解讀。ImHalal 於 2011 年 9 月上線。Halalgoogling 於 2013 年 7 月上線。這些搜尋引擎對 Google、Bing(和其他搜尋引擎)的集合使用禁戒過濾器。[42]
雖然穆斯林世界缺乏投資和技術發展緩慢阻礙了伊斯蘭搜尋引擎的進展,並阻礙了其成功,但穆斯林生活方式網站 Muxlim 這樣的專案確實獲得了 Rite Internet Ventures 等投資者的數百萬美元投資,但它也失敗了。其他宗教導向的搜尋引擎包括 Jewgle,這是 Google 的猶太版本,以及 SeekFind.org,它是基督教的。SeekFind 過濾攻擊或貶低他們信仰的網站。[43]
搜尋引擎提交
[edit | edit source]搜尋引擎提交是指網站管理員將網站直接提交給搜尋引擎的過程。雖然搜尋引擎提交有時被宣傳為推廣網站的一種方式,但它通常不是必要的,因為主要的搜尋引擎使用網路爬蟲,最終會找到網際網路上大多數網站,無需任何幫助。他們可以一次提交一個網頁,也可以使用網站地圖提交整個網站,但通常只需要提交網站的主頁,因為搜尋引擎能夠爬取設計良好的網站。提交網站或網頁到搜尋引擎還有兩個原因:在不等待搜尋引擎發現的情況下新增一個全新的網站,以及在網站進行大幅重新設計後更新網站記錄。
一些搜尋引擎提交軟體不僅將網站提交到多個搜尋引擎,還從自己的頁面新增網站連結。這似乎有助於提高網站排名,因為外部連結是決定網站排名的最重要因素之一。然而,Google 的 John Mueller 已經表示,這“會導致你的網站出現大量的非自然連結”,對網站排名產生負面影響。[44]
另請參閱
[edit | edit source]參考資料
[edit | edit source]- ↑ Harrenstien, Ken; White, Vic (1982 年 3 月 1 日). "RFC 812 - NICNAME/WHOIS". Internet Engineering Task Force. Retrieved 2022 年 2 月 12 日.
- ↑ "Knowbot 程式設計:移動代理的系統支援". 國家研究倡議公司。
- ↑ Deutsch, Peter (1990 年 9 月 11 日). "[next] 一個網際網路檔案伺服器伺服器(關於 Lisp) - comp.archives". Google Groups. Retrieved 2022 年 2 月 12 日.
- ↑ "全球資訊網伺服器". 全球資訊網聯盟 (W3C). Retrieved 2022 年 2 月 12 日.
- ↑ "有什麼新鮮事!1994 年 2 月". 馬賽克通訊公司. Retrieved 2022 年 2 月 12 日.
- ↑ "網際網路歷史 - 搜尋引擎(來自搜尋引擎觀察)". 萊頓大學. 2001 年 9 月. Archived from the original on 2009 年 4 月 13 日. Retrieved 2022 年 2 月 12 日.
- ↑ Nierstrasz, Oscar (1993 年 9 月 2 日). "可搜尋的 WWW 資源目錄(實驗性)". Retrieved 2022 年 2 月 12 日.
- ↑ "啟用發現 - NCSA Mosaic". 國家超級計算應用中心. Archived from the original on 2021 年 8 月 17 日.
- ↑ "有什麼新鮮事,1993 年 12 月". 國家超級計算應用中心. 1993 年 12 月 28 日. Archived from the original on 2006 年 1 月 17 日. Retrieved 2022 年 2 月 12 日.
- ↑ "雅虎!和網景簽署國際分銷協議". 雅虎!. 1997 年 7 月 8 日. Retrieved 2022 年 2 月 12 日.
- ↑ "瀏覽器交易推動網景股票上漲 7.8%". 洛杉磯時報. 1996 年 4 月 1 日. Retrieved 2022 年 2 月 12 日.
{{cite journal}}: Cite journal requires|journal=(help) - ↑ Pursel, Bart. "搜尋引擎". 賓夕法尼亞州立大學出版社. Retrieved 2018 年 2 月 20 日.
- ↑ Gandal, Neil (2001). "網際網路搜尋引擎市場競爭動態". 產業組織國際期刊. 19 (7): 1103–1117. doi:10.1016/S0167-7187(01)00065-0.
- ↑ "我們的歷史深入". W3.org. Retrieved 2012-10-31.
- ↑ Brin, Sergey; Page, Larry. "大型超文字網路搜尋引擎的解剖" (PDF).
- ↑ a b c d e f Jawadekar, Waman S (2011), "8. 知識管理:工具與技術", 知識管理:文字與案例, 新德里:塔塔·麥格勞-希爾教育私人有限公司, p. 278, ISBN 978-0-07-07-0086-4, 檢索於 2012 年 11 月 23 日
{{citation}}: 未知引數|chapterurl=被忽略 (|chapter-url=建議) (幫助) - ↑ Dasgupta, Anirban; Ghosh, Arpita; Kumar, Ravi; Olston, Christopher; Pandey, Sandeep; and Tomkins, Andrew. 網路的可發現性. http://www.arpitaghosh.com/papers/discoverability.pdf
- ↑ Jansen, B. J., Spink, A., and Saracevic, T. 2000. 現實生活、真實使用者和真實需求:對網路上使用者查詢的研究和分析。資訊處理與管理. 36(2), 207-227.
- ↑ Chitu, Alex (2007 年 8 月 30 日). "輕鬆找到最近的網頁". 谷歌作業系統. 檢索於 2015 年 2 月 22 日.
- ↑ "多功能問答系統:綜合視角", Mittal 等人,IJIIDS,5(2), 119-142, 2011.
- ↑ http://www.ask.com. 檢索於 2015 年 9 月 10 日。
- ↑ "常見問題". RankStar. 檢索於 2013 年 6 月 19 日.
- ↑ "桌面搜尋引擎市場份額". NetMarketShare. 檢索於 2018 年 2 月 15 日.
- ↑ "Live Internet - 網站統計". Live Internet. 檢索於 2014-06-04.
- ↑ Arthur, Charles (2014-06-03). "中國科技公司準備主宰世界". 衛報. https://www.theguardian.com/world/2014/jun/03/chinese-technology-companies-huawei-dominate-world. 檢索於 2014-06-04.
- ↑ "Naver 如何影響公司的生產力". 華爾街日報. 2014-05-21. 檢索於 2014-06-04.
- ↑ "網際網路帝國時代". 牛津網際網路研究所. 檢索於 2014-06-04.
- ↑ Seznam 在捷克共和國挑戰谷歌. Doz.
- ↑ Segev, El (2010). 谷歌與數字鴻溝:線上知識的偏差,牛津:Chandos 出版社。
- ↑ a b Vaughan, Liwen; Mike Thelwall (2004). "搜尋引擎覆蓋偏差:證據和可能原因". 資訊處理與管理. 40 (4): 693–707. doi:10.1016/S0306-4573(03)00063-3.
- ↑ Jansen, B. J. and Rieh, S. (2010) 資訊搜尋和資訊檢索的十七個理論結構. 美國資訊科學與技術協會雜誌. 61(8), 1517-1534.
- ↑ 伯克曼網際網路與社會中心 (2002), "在中國用替代搜尋系統替換谷歌:文件和截圖", 哈佛法學院。
- ↑ Introna, Lucas; Helen Nissenbaum (2000). "塑造網路:為什麼搜尋引擎的政治很重要". 資訊社會:國際期刊. 16 (3). doi:10.1080/01972240050133634.
- ↑ Hillis, Ken; Petit, Michael; Jarrett, Kylie (2012-10-12). 谷歌與搜尋文化. 勞特利奇. ISBN 9781136933066.
- ↑ Reilly, P. (2008-01-01). Spink, Prof Dr Amanda; Zimmer, Michael (eds.). ‘Googling’ Terrorists: Are Northern Irish Terrorists Visible on Internet Search Engines?. Information Science and Knowledge Management. Springer Berlin Heidelberg. pp. 151–175. doi:10.1007/978-3-540-75829-7_10. ISBN 978-3-540-75828-0.
- ↑ Ballatore, A. "Google chemtrails: A methodology to analyze topic representation in search engines". First Monday.
- ↑ Parramore, Lynn (10 October 2010). "The Filter Bubble". The Atlantic. https://www.theatlantic.com/daily-dish/archive/2010/10/the-filter-bubble/181427/. Retrieved 2011-04-20. "Since Dec. 4, 2009, Google has been personalized for everyone. So when I had two friends this spring Google "BP," one of them got a set of links that was about investment opportunities in BP. The other one got information about the oil spill...."
- ↑ Weisberg, Jacob (10 June 2011). "Bubble Trouble: Is Web personalization turning us into solipsistic twits?". Slate. http://www.slate.com/id/2296633/. Retrieved 2011-08-15.
- ↑ Gross, Doug (May 19, 2011). "What the Internet is hiding from you". CNN. http://edition.cnn.com/2011/TECH/web/05/19/online.privacy.pariser/. Retrieved 2011-08-15. "I had friends Google BP when the oil spill was happening. These are two women who were quite similar in a lot of ways. One got a lot of results about the environmental consequences of what was happening and the spill. The other one just got investment information and nothing about the spill at all."
- ↑ Zhang, Yuan Cao; Séaghdha, Diarmuid Ó; Quercia, Daniele; Jambor, Tamas (February 2012). "Auralist: Introducing Serendipity into Music Recommendation" (PDF). ACM WSDM.
- ↑ O'Hara, K. (2014-07-01). "In Worship of an Echo". IEEE Internet Computing. 18 (4): 79–83. doi:10.1109/MIC.2014.71. ISSN 1089-7801.
- ↑ "New Islam-approved search engine for Muslims". News.msn.com. Retrieved 2013-07-11.
- ↑ "Halalgoogling: Muslims Get Their Own "sin free" Google; Should Christians Have Christian Google? - Christian Blog". Christian Blog.
- ↑ Schwartz, Barry (2012-10-29). "Google: Search Engine Submission Services Can Be Harmful". Search Engine Roundtable. https://www.seroundtable.com/search-engine-submission-google-15906.html. Retrieved 2016-04-04.
Further reading
[edit | edit source]- Steve Lawrence; C. Lee Giles (1999). "Accessibility of information on the web". Nature. 400 (6740): 107–9. doi:10.1038/21987. PMID 10428673.
{{cite journal}}: Cite has empty unknown parameter:|quotes=(help)CS1 maint: multiple names: authors list (link) - Bing Liu (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer,ISBN 3-540-37881-2
- Bar-Ilan, J. (2004). The use of Web search engines in information science research. ARIST, 38, 231-288.
- Levene, Mark (2005). An Introduction to Search Engines and Web Navigation. Pearson.
- Hock, Randolph (2007). The Extreme Searcher's Handbook.ISBN 978-0-910965-76-7
- Javed Mostafa (February 2005). "Seeking Better Web Searches". Scientific American.
{{cite journal}}: Cite has empty unknown parameter:|quotes=(help) - Ross, Nancy; Wolfram, Dietmar (2000). "End user searching on the Internet: An analysis of term pair topics submitted to the Excite search engine". Journal of the American Society for Information Science. 51 (10): 949–958. doi:10.1002/1097-4571(2000)51:10<949::AID-ASI70>3.0.CO;2-5.Xie, M.;等 (1998). "網際網路搜尋引擎的質量維度". 資訊科學雜誌. 24 (5): 365–372. doi:10.1177/016555159802400509.
- 資訊檢索:實現和評估搜尋引擎. 麻省理工學院出版社. 2010.