化學資訊來源/主題搜尋
幾乎所有文摘和索引服務,更不用說許多其他二級和一級著作,都有主題索引。在本章中,我們將仔細研究一些已經涵蓋的主要著作的主題索引,並注意到專門針對特定文件型別和包含一級和其他文獻型別的全文資料庫的專業文摘和索引服務的存在。使用特定化學化合物的名稱進行的主題搜尋型別將在以後的主題中討論,儘管這裡討論了代表化合物類別的詞語。
這裡討論的搜尋是主題或主題搜尋,而不是結構、識別符號編號、作者姓名或其他搜尋型別。主題搜尋很少,如果有的話,也是完全直接的。我們必須找到合適的詞語和短語,才能從給定資訊源中獲取所需資訊。搜尋者需要考慮變體拼寫、首字母縮略詞和縮略語的使用、同義詞、替代表達以及其他複雜因素。此外,搜尋系統解釋搜尋詞的方式至關重要。例如,搜尋系統是否將兩個相鄰的詞語解釋為必須按該確切順序出現的短語,或者它是否允許它們按任何順序出現,也許由其他詞語隔開?它是否假設任何搜尋詞語的存在都足以構成有效命中,還是它要求所有搜尋詞語都存在?
主題搜尋中一個基本且長期存在的概念是關鍵詞(不受控詞彙)搜尋和主題(受控詞彙)搜尋之間的區別。隨著線上全文材料的出現,全文搜尋選項提供了更多機會,也帶來了更多複雜性。每種方法都有其優缺點,本章的目的是突出這些優缺點,並討論一些主要資源的主題搜尋功能。
理想情況下,使用從受控詞彙或詞典或其他主題詞權威列表中選擇的搜尋詞進行的搜尋,解決了必須考慮並在搜尋中包含搜尋概念的所有可能的替代表達、所有變體拼寫、首字母縮略詞和其他上述複雜因素的挑戰。受控詞彙詞語可以
- 連線特定概念的替代或可互換詞語,使搜尋者不必記住要包含可能的替代詞、首字母縮略詞等。(X射線光電子能譜用於XPS;基質輔助雷射解吸電離用於MALDI-MS)
- 為抽象概念、一組相關概念(光解;熱傳遞)或一類化合物(類固醇;抗腫瘤劑)提供一個統一的術語
- 表明主題詞所表達的概念是材料的主要重點,而不是次要主題(尤其是有用的指標是主要強調,例如主要MeSH標題)
受控詞彙的一個例子是許多學術圖書館使用的國會圖書館主題詞表(LCSH)。另一個例子是與美國國家醫學圖書館的MEDLINE資料庫一起使用的MeSH(醫學主題詞表)。化學文摘社 (CAS) 使用索引指南和主題索引以及化學物質和作者索引來控制化學文摘中的搜尋詞語,化學文摘現在不再以印刷形式出版。1
不受控(關鍵詞)搜尋和使用受控詞彙搜尋之間的區別很重要,也是本課的主要內容,但在SciFinder等工具中,這種區別變得有些模糊,SciFinder是化學文摘的網路版。雖然SciFinder建立在廣泛的CA索引詞庫的基礎上,但它並未直接公開CA索引,而只是透過對一組搜尋結果進行分析操作來間接引導搜尋者找到相關的索引詞。此外,SciFinder搜尋演算法具有一些內建的智慧,可以自動搜尋單數和複數主題詞,考慮拼寫變體和常見的首字母縮略詞和縮略語。搜尋者只需在研究主題搜尋框中輸入定義搜尋的自然語言表達,而無需嘗試插入布林搜尋詞語。
1STN系統上的CA詞彙表顯示了CAS詞彙控制系統的底層結構,包括其更廣泛和更窄的術語層次結構、連結的術語、以前使用的術語和相關術語。
相比之下,關鍵詞搜尋要求搜尋者在建立主題搜尋時考慮並明確包含替代表達、首字母縮略詞、拼寫變體等,而不參考權威主題列表。關鍵詞搜尋不應與全文搜尋混淆,關鍵詞搜尋也不一定搜尋文獻條目記錄的每個詞語。
全文搜尋可以在全文文章或內容庫中執行,例如出版商網站(例如,美國化學學會的線上期刊網站)或JSTOR上的內容庫,允許搜尋者檢索包含搜尋詞語的文章,而搜尋詞語可以在文章的實際文字中的任何位置。當然,這可能會導致大量僅與主題略有相關的搜尋結果,因此在這些資料庫中成功進行搜尋體驗取決於複雜的關聯性排名演算法,該演算法根據搜尋詞語出現的頻率、搜尋詞語出現的位置(例如,在標題或摘要中)和其他因素對結果進行加權。全文庫通常還允許搜尋者將搜尋範圍限制在條目的標題或摘要中,更接近於在Web of Science等文獻資料庫中的基本關鍵詞搜尋。
與全文內容庫不同,Web of Science等文獻資料庫由代表和描述文章或其他資訊內容(專利、書籍章節、技術報告)的記錄組成。這些記錄可以是結構化的,也可以是高度結構化的,並且可以包含索引人員分配的受控詞彙詞語,或其他資料元素(如引用計數或作者機構隸屬關係)。在文獻資料庫中的關鍵詞搜尋包括搜尋計算機生成的“關鍵詞索引”,該索引包含記錄中的重要詞語,通常是標題或摘要中的詞語,或者作者提供的關鍵詞。在“關鍵詞”概念的一種變體中,科學引文索引(Web of Science的一個子檔案)多年來一直包含一項名為“KeyWords Plus”的功能。KeyWords Plus是那些在文章的參考文獻標題中出現頻率很高的詞語或短語,即使它們可能不會出現在文章的標題或摘要中,因此可以增強檢索能力。
國會圖書館主題詞表 (LCSH)通常用於大學和研究圖書館的圖書館目錄中,LC將化學的廣泛領域劃分為子領域。主題詞是分層的,因此對諸如雜環化合物之類的廣泛術語進行主題搜尋將為搜尋者建議更窄、更具體的術語(例如,呋喃;吡啶)。但是,使用這些更窄的術語索引的專案不會自動包含在更廣泛的搜尋中。LC主題詞可以用限定詞或短語(例如,分析;合成)進一步修改,或者用描述材料型別或格式的術語修改(例如,期刊;百科全書;手冊等);因此,為了找到合適的著作,可以搜尋以下短語:
無機化學百科全書
或
有機化學手冊
瞭解國會圖書館主題詞表的總體模式和層次安排,以及如何在圖書館的線上目錄中搜索這些詞語,可以使研究更加高效和有價值。
分類方案
當然,找到給定圖書館擁有或租賃的相關書籍、期刊或資料庫的一種選擇就是簡單地在圖書館的書架上瀏覽適當的區域,使用下表作為使用國會圖書館分類系統的圖書館的路線圖。但是,許多圖書館正在將越來越多的採購轉移到線上書籍,這些書籍可能被分配了國會圖書館分類,也可能沒有,但自然不會出現在實體書架上。應該諮詢相應的圖書館工作人員,瞭解線上書籍如何在目錄中顯示以及如何最好地搜尋它們。
國會圖書館
化學分類表
| 主題 | LC範圍 |
|---|---|
| 化學(一般) | QD 1-65 |
| 分析化學 | QD 71-142 |
| 無機化學 | QD 146-197 |
| 有機化學 | QD 241-441 |
| 物理化學和理論化學 | QD 450-801 |
| 晶體學 | QD 901-999 |
有關許多化學主題的LC分類號,請參閱此連結到LC分類號的化學術語列表.
在1972年之前,化學文摘有五年和十年期的主題索引。從1972-76年的第九個合集索引期開始,**單一**化學物質的化學名稱索引條目被歸入一本新的著作——**化學物質索引**。其他所有內容,包括物質類別(例如,醚)的名稱,都被歸入**一般主題索引**。因此,對涉及化合物類別、反應、工藝、裝置或動植物物種的術語的搜尋,應在"一般主題索引"中進行,前提是已在"索引指南"中找到了相應的術語或短語。從2007年起,CAS不再按合集索引期對資訊進行分類,因此新的CA索引名稱不再帶有"CI"標籤。為了確保找到在"一般主題索引"中使用的正確術語,重要的是要檢視與您搜尋的時期相對應的"索引指南",因為這些術語可能會隨著時間的推移而發生變化(例如,"Pharmaceuticals"(14CI)與"Drugs"(13CI及之前))。
並非所有首選詞或短語都能在"索引指南"中找到,如果您沒有在那裡找到相應的條目,假設您已經選擇了正確的首選詞,並在"一般主題索引"的相應部分中查詢。始終要注意,當合集索引期的邊界發生變化時,首選詞可能會發生變化。
檢視CA學生版中的示例記錄,特別注意索引詞和縮略語的使用。如上所述,SciFinder主題搜尋會在幕後完成一些工作,以找到要包含在搜尋中的適當術語,因此使用該資源的人員在進行研究主題搜尋時不必過多地擔心受控或不受控詞彙表。但是,正如上面所述,您可以謹慎地將同義詞放在括號中,與相關概念並列,例如,ESCA(XPS)。
受控詞彙索引:化學文摘"索引指南"和補充詞
[edit | edit source]關鍵詞搜尋的優點之一是,搜尋詞可以反映科學界不斷變化的詞彙。只要在一個文件中使用了一個新概念、技術等的名稱,它就可以用於搜尋。受控詞彙列表對科學術語變化的適應速度較慢,但它們的最大好處是,它們可以引導您找到該概念的唯一首選詞。因此,搜尋者只需要識別首選索引詞就可以找到感興趣的文件。
近年來,一個有趣的例子是"點選化學"一詞的出現,該詞由化學家K. Barry Sharpless在20世紀90年代末創造。該表達方式首次出現在1999年的SciFinder中,當時它只是一個會議摘要中的單一引用,並在2001年,該概念在發表的期刊文章中得到了完整的描述。2該表達方式迅速發展成為一個補充詞(從關鍵詞到正式索引詞的過渡狀態)。SciFinder然後顯示了以下趨勢:從2002年作為補充詞使用3次,到2006年使用155次,在2007年,"點選化學"首次作為化學文摘採用的正式索引詞出現,有69項被索引為"點選化學",約202項顯示"點選化學"作為補充詞。在2011年(最近的完整年份)中,"點選化學"一詞產生了1460個參考文獻,其中1097個被索引為該詞。
在2010年化學文摘停止印刷出版之前,"索引指南"是管理六個月卷和五年合集一般主題和化學物質索引的出版物。雖然"索引指南"不再是現行的,但它仍然是一份有用的文件,可以瀏覽以獲得索引詞的指導。例如,在"索引指南"的"E"部分中查詢ESCA會將您引導到實際"一般主題索引"的"P"部分。
ESCA(化學分析電子能譜)
See Photoelectric emission
x-ray
See Photoelectron spectroscopy
x-ray
同樣,在"索引指南"的"X"部分中查詢XPS也會導致相同的首選短語
XPS(X射線光電子能譜)
See Photoelectric emission
x-ray
See Photoelectron spectroscopy
x-ray
因此,透過使用"索引指南",搜尋者會發現,有關該主題的文件可以在化學文摘"一般主題索引"的"P"部分中找到。在使用"一般主題索引"之前,使用CA"索引指南"很重要,因為"一般主題索引"本身沒有"參見"引用。此外,每個五年合集索引期都有自己的"索引指南"。有一個關於一般主題詞層次結構的指南,以幫助選擇術語。
2Kolb, H. C., Finn, M. G., & Sharpless, K. B. (2001). Click Chemistry: Diverse Chemical Function from a Few Good Reactions. Angewandte Chemie International Edition, 40 (11), 2004–2021. doi:10.1002/1521-3773(20010601)40:11<2004::AID-ANIE2004>3.0.CO;2-5
在SciFinder中完善和分析搜尋結果集
[edit | edit source]SciFinder與許多其他文獻資料庫(包括Web of Science)一樣,提供了工具,使搜尋者可以過濾或完善一組搜尋結果。完善操作包括透過研究主題(關鍵詞)、作者或公司名稱、出版年份、文件型別、語言或源資料庫應用限制選項。"完善"基本上是一個單步操作。
SciFinder中的"分析"步驟是對一組研究結果採取行動的更細緻的方法。每個"分析"選項都會生成一個條形圖或直方圖顯示,顯示術語及其在答案集中的分佈,使搜尋者可以進一步探索和發現。(請注意,其中一些選項實際上消除了來自MEDLINE的參考文獻,因為它們基於CA特定的資料元素。)在2010年,化學圖書館員Chuck Huber和A. Ben Wagner在CHMINF-L上給出了以下關於使用這些分析工具的有用指南(在下面的"混搭"中略作編輯)。
- CA章節標題起源於最初的印刷版化學文摘,該文摘出現在80個主要主題章節中,收集在五個大標題下(有關更多資訊,請參見化學文摘章節)
| 章節 名稱 |
章節 程式碼 |
章節 數字 |
|---|---|---|
| 生物化學 | BIO/CC | 1-20 |
| 有機化學 | ORG/CC | 21-34 |
| 高分子化學 | MAC/CC | 35-46 |
| 應用化學與化工 | APP/CC | 47-64 |
| 物理化學、無機化學與分析化學 | PIA/CC | 65-80 |
這些都是非常廣泛的類別。請注意,這些章節的定義和確切標題在過去幾年中多次更改,這解釋了您在進行分析時看到的差異。此分析會自動消除MEDLINE記錄(沒有警告訊息),因為它們當然沒有分配CA章節標題。索引詞分析了CAPLUS和MEDLINE的受控詞彙,即主題詞,但不包括化學物質索引。它不搜尋補充詞。
- CA概念詞頭分析了舊版印刷版一般主題索引中使用的CA"主詞頭"受控詞彙/索引詞,即不包括化學物質索引。這些詞頭出現在SciFinder記錄中的CONCEPT列(標題框,而不是詳細的文字修飾資訊)中。此分析排除了MEDLINE記錄,同樣沒有警告訊息。如果您搜尋的集合中只有CA參考文獻,則此分析似乎與索引詞分析相同。
- 補充詞最初包含來自CA關鍵詞短語的單個詞,這些詞是(或曾經是)用於準備印刷版CA每一期快速索引的索引詞。關鍵詞反映了標題和摘要的內容,使用原始文件中找到的詞彙。MEDLINE記錄不會從此分析中排除。
以下是一些關於如何在SciFinder主題搜尋中使用這些提示的提示。
1) CA章節標題 - 假設您不關心答案集中是否包含MEDLINE記錄,那麼CA章節標題限制將有助於集中於一個非常廣泛的類別,例如酶或生物化學遺傳學或哺乳動物激素。當您需要一個過於廣泛而無法透過關鍵詞定義或消除來自不同類別的噪音的類別時,這很有用。它也可能對包含大量參考文獻的集合很有用,在這種情況下,索引詞分析會讓人不知所措。確保向下滾動足夠遠的距離,以獲取同一章節的較舊變體章節標題。參考文獻通常分配到多個章節,因此需要注意,因為期待所有關於酶的參考文獻(無論上下文如何)都在酶章節中是不合理的。當您選擇CA章節標題時,您是在假設您正在選擇那些主要重點是與章節相關的參考文獻(類似於MEDLINE中的主要MeSH詞頭)。因此,CA章節標題在您想要區分兩個具有相同名稱但領域截然不同的概念時很有用。例如,您搜尋"plasma",並且想要將血液中的物質與恆星中的物質區分開。也許您想專注於主要概念,例如,當您尋找特定型別的催化劑的用途時。如果您縮小範圍,只包含放置在催化章節中的論文,那麼這些論文很可能將催化作用作為主要主題而不是次要主題來處理。
2) 索引詞 - 這有保持 MEDLINE 記錄的優勢。當你在搜尋中達到一個你已經輸入了你所能想到的所有概念和你覺得安全的限制,但仍然有太多參考資訊難以瀏覽的時候,它會很有用。透過索引詞進行分析是完美的解決方案,它向我們展示了當我們不知道自己想要什麼時,集合中包含的內容。它會產生一些想法,讓我們知道集合的哪些方面是我們想要檢視的。索引詞是識別關鍵詞和/或更緊密地將搜尋重點放在主題上的可靠方法。使用索引詞進行分析的一個問題是,有時你想要關注的索引詞會埋藏在按排名排序和字母順序排序的較低級別中。透過使用“分類”,你可以按層次結構向下瀏覽到你想要的術語集,並且在最終“分類”列中更小的術語子集中,你可以找到你正在尋找的術語。但是,“分類”不能用於非常大的答案集。
3) CA 概念詞頭 - 我很少使用這個選項,因為它基本上執行索引詞分析。我所能想到的唯一用途是,當我有 CAPlus 和 MEDLINE 記錄集,並且想要同時消除 MEDLINE 記錄,同時檢視 CA 索引。
4) 補充詞 - 特別是在追求非常新穎、具體或不尋常的主題時,檢查補充詞將是一個額外的預防措施,以確保索引詞分析沒有遺漏一些重要的記錄。這是一種在 MEDLINE 中進行標題詞搜尋的方法,否則只能透過“瀏覽參考:期刊搜尋”螢幕進行。最好先進行索引詞分析,然後使用補充詞作為二次檢查。你可能很少單獨進行 ST 分析。補充詞的另一個用途是在 SciFinder “過度截斷”時。例如,“醇解”被截斷為“醇”,這會導致大量誤報。但是,如果你透過補充詞進行分析,你可以挑出那些在該欄位中出現未截斷的所需術語的論文。
專門的摘要和索引服務,用於主題或文件型別
[edit | edit source]有許多專門的摘要或索引服務,涵蓋化學的子集,例如 分析摘要,或者特定的格式,例如 Proquest 的論文和論文資料庫,或者 Derwent 世界專利索引。本章討論的許多主題搜尋技術都適用於這些作品,但熟悉你選擇搜尋的任何工具的指南、資料庫摘要表和其他使用者幫助是一個非常好的主意。
總結
[edit | edit source]根據所討論的資料庫,搜尋者可能只是輸入自然語言的主題,或者可能需要查閱權威的主題詞列表才能進行主題搜尋。更高階的資料庫(在資料結構、受控詞彙和搜尋引擎最佳化方面)會為搜尋者提供更準確、更全面和更相關的搜尋結果。最低限度開發的資料庫要求搜尋者勤奮和有創造性地思考替代表達方式、同義詞、首字母縮略詞和搜尋的其他方面,以找到最相關的資訊。在精確度(檢索到的文章的相關性)和召回率(資料庫中實際檢索到的相關專案數量)之間總是存在權衡。定義非常狹窄的搜尋策略可能實現近 100% 的精確度,但會找到資料庫中相對較小的重要相關參考百分比。資料庫製作方和供應商開發了許多技術,允許搜尋者改進搜尋策略並將所需資訊帶到表面,關注這些技術將在長遠內帶來回報。