跳轉到內容

化學資訊來源/作者和引文檢索

來自華夏公益教科書

本章涵蓋了直接作者檢索和引文檢索,即檢索引用特定文章或作者出版物的論文。作者檢索,無論是針對個人還是公司,似乎很簡單,但常常會因拼寫錯誤、姓名變更、音譯和文化差異以及姓名的變體形式而變得複雜。作者本人有時也會在不同的論文中以不一致的方式格式化自己的姓名,並使用暱稱(Jim/James)、中間首字母或完整的中間名,或者完全省略一個或多箇中間名。儘管一些文化中婚後將孃家姓改為夫姓的情況現在不那麼普遍了,但這已被處理複合連字元姓氏的複雜情況所取代。一些文化中的習俗是將姓(家族名)放在前面,而許多西方文化稱之為“名字”的名稱放在後面。這幾乎總是導致出版物以兩種順序出現在期刊和資料庫中,例如,Tilak Bommaraju 和 Bommaraju Tilak。

正如任何商業搜尋人員都可以證明的那樣,搜尋公司名稱會帶來另一組挑戰,尤其是由收購和合並引起的名稱變更。公司作者可能以直接子公司名稱列出,但並非最終母公司,而最終母公司可能在鏈條上高出 1-3 級。知名的部門和中心可能列出時沒有任何關於母體實體的參考,例如,國家職業安全與健康研究所,它隸屬於疾病控制與預防中心,而疾病控制與預防中心本身又隸屬於衛生與公眾服務部。再加上私營和公共實體的首字母縮略詞的盛行,以及將長期使用的首字母縮略詞在某個時候定為官方名稱的趨勢,人們就會開始瞭解所涉及的挑戰。建議諮詢一位優秀的商業搜尋指南或商業圖書館員。

一旦確定了作者姓名所有可能的變體,就需要將其轉換為格式正確的搜尋查詢,併為計劃搜尋的每個系統選擇合適的欄位/欄位程式碼。將搜尋限制在個人作者欄位或公司來源欄位將有助於消除錯誤的匹配,例如“wood”,它可以是關鍵詞或作者的姓氏。Web 系統通常會提供一個標記為“作者”的框,可以填寫該框。

姓名輸入順序、標點符號以及一些資料庫中是否必須完全按照在檔案中找到的名稱輸入姓名,是您在線上資料庫中進行作者檢索之前需要了解的關鍵點。著名化學家 Paul von Rague Schleyer 在 1997 年 3 月 23 日給 CHMINF-L 的一封便條中感嘆道:“我在 SCI [科學引文索引] 中被列出了 17 種不同的方式,直到我投訴才被糾正!... 在 CAS 中搜索我的出版物只會找到一半。”雖然人們有時會提出建立作者登記處的建議,類似於 CAS 的化學登記系統,但迄今為止,還沒有任何摘要或索引服務在這方面採取行動。在開始搜尋之前,瞭解所用服務的作者姓名處理方式仍然非常重要。

就印刷作品而言,即使是在非常古老的化學文獻中也能找到作者索引。出版商通常會在期刊卷或出版年份的末尾建立作者索引,以便輕鬆訪問在該期刊中發表的文章。一些甚至會編制涵蓋期刊出版十年或更長時間的索引,其中肯定會包含作者索引。例如,倫敦皇家學會的十年索引(1971-1980 年),它是一個索引,涵蓋了他們在《會議記錄》、《哲學彙刊》和《傳記回憶錄》出版物中的作者。化學文摘社還為從 1907 年創刊以來的印刷版《化學文摘》出版了五年或十年一卷的作者合集索引。

百科全書文章末尾的參考文獻通常是您在某個領域開始研究時獲得該領域關鍵人物的良好來源。作者索引可以在摘要和索引期刊、參考文獻、綜述期刊以及許多其他二手作品中找到。在某些情況下,尋找一家公司作為作者可能是有價值的。公司名稱是如何(甚至是否)索引將取決於資料庫。對於非常常見的個人姓名,有時將個人作者姓名搜尋與該作者在發表時工作的公司名稱結合起來是很有用的。

在本章中,我們將介紹科學網(包括科學引文索引),並解釋科學引文索引(SCI)的跨學科性質,該工具是由尤金·加菲爾德博士發明的。為了涵蓋資料庫中的新條目,SCI 只包括最重要的科學期刊,但當搜尋已知引文時,過去任何時間發表的任何型別的文件都可能在新的期刊文章中被引用,從而成為 SCI 引文檢索中的搜尋關鍵詞。對於化學文摘資料庫,包括了幾種不同型別的原始文件(期刊文章、技術報告、論文、專利、會議論文集)。藉助 SciFinder,現在可以相對輕鬆地對 CA 檔案進行作者檢索,並且還可以對過去十年或更長時間發表的文件進行引文檢索。

如今,在大多數科學學科中,很少能找到由單個科學家撰寫的文章。因此,一篇文章可能列出了 3、5、10 或甚至更多作者。一篇文章的作者數量遠超 100 人的記錄!摘要和索引期刊通常會限制他們在印刷版作者索引或資料庫中包含的特定文章的作者姓名數量,而 SCI 也不例外。“來源索引”最多涵蓋九位作者。隨著計算機環境的不斷發展,這些限制正在逐漸消失。SCI 資料庫現在包括其科學網版本中的所有作者,而化學文摘社在 1996 年以前作者數量的限制為十位,從 1997 年開始將限制提高到了 150 位。SCI 僅使用作者姓名的首字母,這有時會導致檢索到與大衛·威廉姆斯等常見名稱無關的參考文獻。化學文摘社通常會將作者的姓名完全按照原始文件中的顯示進行輸入。

[編輯 | 編輯原始碼]

與按個人姓名進行作者檢索相關的特定搜尋型別是 引文檢索。在這種情況下,會使用出現在新文獻參考文獻中的已知作者作品的參考文獻來識別這些新文獻。換句話說,建立引文索引是為了在已知與您感興趣的主題相關的較舊的被引用作品和較新的引用作品之間建立聯絡。假設只有當最近的文章與較舊的文章主題相同的情況下,才會引用較舊的文章。

多年來,科學資訊研究所(ISI;現已併入湯森路透)出版了《科學引文索引》(SCI),其印刷版格式(現在也包括在科學網上)可以追溯到 1900 年。完整的印刷版 SCI 是一個多學科索引,涵蓋了全世界最重要的科學和技術期刊(約 5,000 種)。

SCI 涵蓋了 1900 年至今發表的文獻,並按作者在“來源索引”中索引,該索引是 SCI 的一部分。可以將“來源索引”視為在索引發布時新文獻的作者索引。由於 SCI 包含所有科學領域最重要的期刊,因此它應該是搜尋任何科學家出版物的首選來源之一。

SCI 真正獨特之處在於,每一卷都包含一個“引文索引”,實際上將 SCI 的涵蓋範圍擴充套件到了 1900 年以前。因此,即使一篇文章是在 1873 年撰寫的,只要有人在 1900 年之後被 SCI 涵蓋的期刊中引用過它,較舊文章中的參考文獻就會提供到較新的引用文章的連結。

SCI 還包含主題索引,我們將在後面的章節中討論。

印刷版科學引文索引的累積版出版於以下年份

          Source      Permuterm     Citation
Years     Index     Subject Index    Index
1945-54      x                          x
1955-64      x                          x
1965-69      x            x             x
1970-74      x            x             x
1975-79      x            x             x
1980-84      x            x             x
1985-89      x            x             x
etc.

印刷版《科學引文索引》中的所有資訊現在都可以在科學網 SCI 資料庫中找到。《科學引文索引》的線上版本也同時在 DIALOG 和 STN 國際上提供,被稱為 SciSearch。參見 STN SciSearch 記錄示例

單個文章中的多個作者的問題在於,只能列出一位作者作為第一作者。因此,SCI 的“引文索引”將使用列出的第一作者作為進入“引文索引”的入口點,即使第一作者不是論文中列出的最傑出的科學家(主要作者)。這是一種合理的方法,因為大多數在參考文獻中遇到該出版物的人會看到它被引用時與它在期刊中出現的完全一樣。但是,考慮一下當您想找出有多少人引用了特定科學家共同創作的所有出版物時,這會導致的問題。如果在一個人的職業生涯中,曾有過該科學家沒有被列為第一作者的情況,則意味著您必須將這些單獨的參考文獻中的每一個用作單獨的搜尋關鍵詞,才能找到所有引用過該科學家作品的文章。這在印刷版 SCI 中是一項非常乏味的工作,並且直到最近在資料庫中也不容易。然而,這通常是一項人們為了支援晉升和任期案件、確定特定研究領域的年輕研究人員等目的而希望執行的任務。

SCI 的網路版本於 1997 年出現(也涵蓋了 1900 年以來的新來源材料)。它被稱為 Web of Science,現在是湯森路透的 Web of Knowledge 的一部分。該版本的科學引文索引包含許多文章的摘要,並且從 1997 年開始包含作者的電子郵件地址。網路版本最強大的功能之一是能夠找到大多數作者的期刊出版物的引用,即使該作者未被列為出版物的第一作者。[這些文章必須發表在 Web of Science 版科學引文索引涵蓋的 5700 多種期刊中之一。]

Web of Science 的科學引文索引上的示例引文搜尋

[edit | edit source]

讓我們看看如何搜尋引用了 David E. Clemmer 博士 1995 年發表的文章。該出版物是

Clemmer, D.E; Hudgins, R.R.; Jarrold, M.F. 裸露蛋白質構象:氣相中的細胞色素 c。J. Am. Chem. Soc. 1995, 117, 10,141-10,142.

是的,那篇文章從第 10,141 頁開始!JACS 是一本龐大的期刊,與大多數科學期刊一樣,全年頁面編號連續。

步驟 1:使用 Web of Science 格式以最少的資訊輸入引文搜尋

CitedAuthor:Clemmer DE
Cited Work:J AM CHEM SOC
Cited Year(S):1995
並執行“搜尋”以檢視該作品是否已被任何人引用。

步驟 2:檢視搜尋找到的參考資料,特別注意明顯打字錯誤的變體形式。請注意,一些查詢候選人只有一個引用(“命中”)。當條目建立時,頁碼(1014 和 1041 而不是 10141)很可能存在打字錯誤。

另一個表明這些是錯誤的線索是,儘管 Clemmer 博士是第一作者,美國化學學會期刊是 SCI 在來源索引中涵蓋的期刊之一,但文章摘要沒有超連結到引文。

步驟 3:檢查具有正確引文的命中,並“完成搜尋”。

步驟 4:隨機選擇結果首頁上的一個參考。這是最近引用原始 1995 年文章的文章之一

步驟 5:檢視 Web of Science 中的完整記錄,包括摘要。

注意右側邊框中的“相關記錄”部分。這些記錄至少包含一個與文件共享的引文。相關記錄功能也存在於 STN 的 SciSearch 上,在該功能上可以搜尋到 1974 年。同樣,請注意 SCI 提供作者地址。假設作者在文章發表後沒有搬遷,這是一個查詢該資訊的理想地點。

STN 國際上的 SciSearch

[edit | edit source]

現在可以在 STN 的 SciSearch(或 Web of Science,如上例所示)上進行搜尋,並進行相當全面的工作,以查詢 SCI 涵蓋的所有引用了特定作者出版物的出版物。在 STN 上,這是使用 SELECT CIT 功能作為從允許進行全面作者搜尋的資料庫的橋樑來完成的。例如,我們可以在 STN 的 CA 檔案中對 Ernest R. Davidson 的出版物進行作者搜尋,並找到他自 1967 年以來出版的所有內容,這些內容包含在答案集 L4 中。STN 上 SmartSELECT 功能的搜尋演算法將從答案集 L4 中提取相關的搜尋關鍵字,並在輸入以下命令時在 SciSearch 中執行搜尋

=> FILE SCISEARCH
=> S L4<CIT>

Chuck Huber 在 2006 年 9 月 26 日在 Scholartalk 上釋出了這個分步程式,Scholartalk 是 CAS 為 SciFinder Scholar 管理員提供的封閉迴圈討論列表

1) 在 CAPLUS、SCISEARCH 和/或其他適當的資料庫中搜索您的作者的出版物。

2) 使用 DUPLICATE 命令從組合的答案集中刪除重複項。

3) 使用 SELECT CIT 建立一組引文搜尋關鍵字。

4) 搜尋結果 E# 在 CAPLUS 和 SCISEARCH 中以找到一組引用參考。對答案集進行重複資料刪除,您將獲得引用的最終數量。

5) 如果您的作者想知道是誰引用了,或者年份分佈,或者引用了哪些文章,請使用 ANALYZE 命令生成作者或出版年份或命中參考的表格。

警告:這種方法雖然快速且(相對)便宜,但會錯過大部分錯誤引用(錯誤的被引用作者、錯誤的卷號、錯誤的頁碼、錯誤的出版年份),因此引文總數會偏低。

公司或組織名稱搜尋

[edit | edit source]

可以在 SciSearch 中執行“公司來源索引”上的搜尋。例如,在 STN 上,搜尋語句

=> S DOW FREEPORT/CS

將產生道化學公司弗裡波特分公司研究人員的出版物。

如以下所示,也可以在 Web of Science 上進行公司搜尋。常規搜尋包括一個地址選項,可以輸入地理地名和郵政編碼,以及公司名稱中的詞語。在下面的示例中,我們正在尋找印第安納州布盧明頓(郵編 = 47405)印第安納大學化學系人員發表的所有文章。請注意使用相同的運算子以將所有詞語保留在同一個邏輯單元(句子)中。但是,這種方法顯然不會涵蓋教師訪問另一個機構(例如,在休假期間)並從該位置發表文章的情況。

在 Web of Science 搜尋頁面上,在搜尋框中鍵入“Indiana SAME Chem SAME 47405”,然後從下拉選單中選擇地址

印刷版化學文摘中的作者和公司搜尋

[edit | edit source]

可以搜尋印刷版化學文摘CA)一直追溯到 1907 年,並且整個時期都有作者索引。實際上,化學文摘的五年和十年累計索引使作者搜尋變得容易。

要有效地使用印刷版 CA 作者索引,您必須知道,即使索引中列出了全名,但名稱的字母順序排列僅考慮了名字的首字母(名字和中間名)。因此,我們在索引中發現以下名稱順序

Davidson, Eugene Abraham
Davidson, Ernest Roy
Davidson, Elizabeth West

這與如果所有名稱的所有部分的所有字母都包含在字母順序中所期望的結果完全相反。確定姓名在化學文摘作者索引中的位置還有許多其他規則,您可以參考該作品本身以瞭解這些規則。

CA 的涵蓋範圍遠不止科學和技術期刊(自第二次世界大戰以來的大部分時期內,期刊數量是科學引文索引的兩倍多)。它還涵蓋論文、會議論文集、報告、專利、技術報告和其他主要文獻。1995 年,化學文摘社開始在 CAPlus 檔案中包含電子期刊文章的條目。

CA 中發現的一種特殊型別的作者條目是專利權人,即申請並獲得專利的人。CAS 還索引專利受讓人,通常是專利權人工作所在公司。專利權人不在科學引文索引的“來源索引”中找到,因為該產品僅涵蓋主要期刊,但專利約佔每年新增到 CA 資料庫的文件的 1/6。在印刷版CA 索引中,字母“P”插入卷號和作者索引中的摘要號之間以指示文件是專利,例如

103:P160286w.

公司機構也在 CA 作者索引中被索引。請記住,包含人名的公司將在印刷版作者索引中反轉名稱,例如“Lilly, Eli, and Co.”。

CAS 資料庫中的作者搜尋

[edit | edit source]

SciFinder 中的“作者姓名”搜尋選項是主要的搜尋探索選項之一,它也是在產品上以其他方式搜尋後細化檢索到的答案集的一種選擇。

印刷版 CA 的歸檔習慣通常不會在 STN 或其他版本的 CA 資料庫中出現問題。在 SciFinder 中,演算法會找到與搜尋條件匹配的可能候選人。如果您搜尋作者“Hieftje, G M”,並且選中了查詢姓氏的替代拼寫前面的框,搜尋引擎將找到“Hieftje”的拼寫錯誤,如“Heiftje”。(但是,它可能不會找到諸如“Hleftje”之類的打字錯誤。)

幾年前,化學文摘社將引文搜尋引入了 SciFinder 產品線。現在可以透過使用“引用參考”選項細化搜尋來查詢 1997 年至今發表的新文章。例如,假設您想知道 1997 年或之後發表的哪些文章引用了 Gary M. Hieftje 博士 1994 年發表的文章

Wu, Min; Madrid, Yolanda; Auxier, Jake A.; Hieftje, Gary M.. 流動注射等離子體發射光譜法的新型霧室。Analytica Chimica Acta (1994), 286(2), 155-67. CODEN: ACACAM ISSN:0003-2670. CAN 120:234885 AN 1994:234885 CAPLUS

當您檢視該條目的完整記錄時,點選記錄頂部的“獲取引用”選項。然後,您將在下一頁獲得引用原始文章的新文章。

Reaxys 中的作者搜尋

[edit | edit source]

Reaxys 資料庫涵蓋了有機化學文獻,最早可以追溯到18世紀的最後三分之一。因此,它是化學文摘和科學引文索引資料庫的有用補充。但是,該檔案並非真正為作者搜尋而設計,因此必須謹慎地包含可能為所需作者的姓名,即使只在資料庫中輸入了姓氏。(在**文獻資料**部分搜尋**作者**)

其他資料庫中的作者或機構名稱搜尋

[編輯 | 編輯原始碼]

某些專利資料庫使用程式碼表示公司名稱(專利受讓人程式碼)。例如,德溫特的全球專利索引為全球約 21,000 家擁有 50 項或更多專利的公司分配了程式碼。母公司、子公司和相關公司均會被檢索到。對於羅氏公司,程式碼為 39424。

NLM 的 PubMed(Medline 資料庫的一個版本)包含“相關文獻”。雖然與真正的引文搜尋略有不同,但效果類似。

可以使用 CiteSeer 進行公共領域引文搜尋。CiteSeer 透過搜尋已釋出在 Web 上的科學文章版本來建立數字圖書館。

自 19 世紀以來,科學期刊文章的作者搜尋一直可用。幾乎所有摘要或索引服務以及大多數其他型別的二手文獻都提供作者搜尋功能。許多服務甚至允許您搜尋公司或其他機構。查詢新期刊文獻的獨特方法是進行引文搜尋,使用來自感興趣的較舊文件的文獻資訊。

CIIM 連結,用於進一步學習

SIRCh 連結,用於作者和引文搜尋

關於此主題的習題集

華夏公益教科書