化學資訊來源/化學名稱和式搜尋
儘管結構搜尋通常是搜尋化學物質的唯一確定方法,但透過物質識別符號(化學名稱和各種識別號)或分子式進行搜尋可能很方便,或者在某些情況下,對於缺乏結構搜尋功能的印刷來源和電子來源來說是必要的。當然,輸入“阿司匹林”比繪製其結構快得多。但是,根據資料庫的不同,名稱搜尋可能需要完全匹配,直到標點符號和空格。更復雜的化學物質可能只有系統名稱,這些名稱往往很長,或者搜尋的特定同義詞可能不在正在查詢的資料庫中。此外,密切相關的化合物可能會被遺漏。搜尋“1,2-二氯乙烯”可能不會找到順式和反式異構體的記錄,而只會找到通用的混合異構體或未指定物質的記錄。在提供化學名稱片段/片段搜尋功能的地方,有時可能會檢索到太多記錄。
儘管許多資源都有分子式搜尋選項,但分子式遠非唯一,檢索到的化合物數量從幾個到幾千個不等。分子式約定因資料庫而異,特別是在無機物和多組分物質(如鹽、有機金屬化合物、聚合物和複雜氧化物)方面。在計算原子數或將分子式輸入搜尋框時也很容易出錯。但是,分子式搜尋的一個優點是,可以找到化合物的所有微小變化,例如同位素、互變異構體、礦物形式和立體異構體差異。
有許多優秀的物質識別符號程式碼系統,其中 CAS登記號 (CAS RN) 和 InChI程式碼 (IUPAC) 目前是最突出的系統。每個系統都為特定結構或命名物質分配一個唯一的識別程式碼。儘管這些系統非常有用,但必須牢記,結構的任何微小變化(同位素、立體化學、比例等)都會被分配不同的程式碼號。因此,這些識別程式碼的精確性既是它們最大的優勢,有時也是它們最大的劣勢。但是,它們通常是一種快速而全面的方法,可以檢索有關特定結構或命名物質(如商標商業材料)的所有資訊。
許多物質,特別是在商業中,沒有已知的、明確的或完全定義的結構或分子式。在這種情況下,必須依靠命名法和物質識別符號程式碼,如 CAS RN。
由於格式、搜尋功能和資料庫約定的差異很大,強烈建議使用者
1) 諮詢搜尋幫助文件,瞭解他們正在搜尋的任何資源,以及 2) 透過搜尋物質識別符號或分子式來測試系統,例如甲醛或阿司匹林等簡單且常見的化合物,以確保以正確的方式搜尋系統並檢索到適當的記錄。
如果 a) 物質識別符號或分子式搜尋未能檢索到任何匹配項,b) 已知化合物的結構,以及 c) 該資源具有結構搜尋功能,則應執行結構搜尋以驗證資料庫是否不包含有關所需化合物的任何資訊。
訂閱資料庫提供經過精心策劃的專業維護資訊。
化學文摘社 (CAS) 提供世界上分佈最廣、最著名的化學資料庫。他們在許多不同的平臺上提供他們的主要物質(File REGISTRY)和主要文獻資料庫(File CAplus),包括第三方系統和他們直接參與的系統。CAS 贊助的平臺是
1) SciFinder,一個易於使用、功能強大、固定費率的平臺,廣泛關注化學、材料科學和生物醫學資訊,並提供給學術機構、非營利組織和企業機構
2) STN International,一個基於廣泛平臺的平臺,包含來自眾多供應商(包括 CAS)的眾多資料庫,這些資料庫透過一個功能齊全、高度複雜的搜尋系統結合在一起,允許在需要時使用完整的布林邏輯來組合術語和多個搜尋集以形成複雜模式。
這兩個平臺上的物質資訊都源自 File REGISTRY 資料,儘管在 SciFinder 中,可以透過標記為“探索物質”的連結訪問此資料庫。SciFinder 旨在供化學家直接使用,在學術界和工業界都很常見。本節的其餘部分將假設透過廣泛使用的 SciFinder 介面訪問 CAS 內容。
儘管 SciFinder 介面功能強大,但 STN International 為更專業的使用者提供了 SciFinder 中沒有的更高階搜尋功能,例如搜尋元素組成、材料組成表(包括重量百分比範圍)、環系統資料(如環數)以及直接訪問所有化合物類別識別符號,包括未完全定義的物質。這些特殊的強大技術超出了本章的介紹範圍。STN International 使用者應諮詢有關 File REGISTRY 的文件,例如 STN 資料庫摘要表。
在 SciFinder 中,在“探索物質”搜尋選項下,“物質識別符號”搜尋詞包括 CAS 登記號、化學名稱或名稱片段以及程式碼。透過在單獨的行上輸入每個詞,可以同時搜尋多個詞(最多 25 個)。CAS 提供互動式教程和“操作指南”,包括
儘管 CAS 可能提供了世界上最大、構建最完善的已知物質清單,但需要進行全面搜尋以確定專利目的的結構新穎性的搜尋者建議諮詢儘可能多的其他來源,包括 Markush 結構可搜尋資料庫、專利資料庫和 Reaxys,這些資料庫可能包含化合物,特別是那些在 1907 年之前被報道但未在 1907 年之後被報道在文獻中的化合物。
化學文摘社登記檔案 (CAS REGISTRY) 是用於識別化學物質的最大單一資料集合。
CAS 登記號 (CAS RN) 是一個格式為 Y-XX-X 的數字,其中 Y 可以是兩位或多位數字,而 X 是一個校驗位,例如 494-12-2。CAS 登記是最終權威,因為它是唯一一個將已替換或更正的 CAS RN 連結到當前和正確 CAS 登記記錄的資料庫。
CAS 登記的覆蓋範圍最初基於從 1957 年至今從科學文獻中識別的物質,其中某些類別(含氟和含矽化合物)可以追溯到 20 世紀初。最近,CAS 追溯性地為從 1907 年到 1966 年的 CAplus 檔案中索引的已識別物質分配了登記號,但只分配了 CAS 角色 PREP。一個 資料庫計數器 提供有關已註冊物質和生物序列的累積數量的資訊。
CAS RN 是 CAS 登記簿記錄的唯一識別符號,這些記錄是為以下物質建立的:有機和無機物質、金屬、合金、礦物、聚合物、配位化合物(2)、元素、同位素、肽、酶、生物分子序列和核粒子。
簡短的 CAS 登記簿記錄顯示 CAS RN、結構圖、分子式和 CA 索引名稱,以及指向所有參考文獻(CAplus 檔案記錄)、反應(CAS REACT)、商業來源(CHEMCATS)、監管資訊(CHEMLIST)、光譜和實驗性質的連結。
點選簡短記錄的 CAS RN 會顯示完整的 CAS 登記簿記錄,其中包括其他 CA 索引名稱和同義詞、已刪除的登記號、指向參考文獻的連結,以及 CAS 角色的表格顯示,用於限制檢索(例如製備、用途等)、預測的(ACD/Labs)性質和實驗性質(包括 NMR、IR 和質譜),以及文獻參考。
無機化合物和合金記錄可能會顯示成分表,而生物分子記錄可能會顯示蛋白質或核酸序列。
因此,可以使用 CAS 登記簿來查詢
• 與該物質相關的文獻參考 • 實驗和預測的物理性質資料 • 商業可用性 • 製備方法 • 光譜(MS、IR、NMR、UV) • 來自國際來源的監管資訊
有些 CASRN 沒有任何文獻參考。這是因為公司可以在該物質出現在文獻中之前獲得 CASRN(透過 CAS 客戶服務),或者因為 CASRN 被分配給來自化學目錄、網路上的外部物質集合或從編譯化學清單(例如,EPA 的 TSCA)中的物質,或者當 CAS 從期刊或專利文獻來源註冊化合物時,該化合物是鹽,會建立兩個登記號:一個用於鹽,另一個用於母體化合物。參考連結僅顯示在鹽上,而不是在母體化合物上。
CAS RN(與它們的 CA 登記簿檔案記錄相關聯)出現在 CAplus 檔案記錄的物質索引中,而不是 CA 索引名稱。例如,107326-35-2 而不是
1H-吡啶並[3,4-b]吲哚-1-羧酸,2-(3-丁烯基)-2,3,4,9-四氫-
索引物質的決定基於 CA 的索引理念,該理念側重於新資訊和文章的主要要點。這可能會導致意想不到的結果。例如,在一篇關於“不同陽離子對 Mo(CN)8 配合物的紅外光譜的影響”的文章中(CAN 111:122893),每種單獨的鹽(例如,三鉀八氰合鉬酸(3-) 三水合物)都被索引。然而,一篇關於“高錳酸根離子-八氰合鉬酸(IV) 反應動力學”的文章(CAN 80:137539)中,僅索引了八氰合鉬酸(IV) 離子,而不是標題中提到的八氰合鉬酸(IV) 鉀鹽。
CASRN 通常出現在化學手冊(例如,Merck Index、CRC 化學和物理手冊、Lange 手冊、綜合化學詞典等)、化學供應商目錄(例如 Sigma-Aldrich、Strem、Lancaster 等)和期刊文章中。它們是特定化學物質的優秀檢索詞。
然而,CASRN 僅僅是登入號。因此,化學衍生物、鹽等與它們的母體化合物無關,因為它們在可免費搜尋的 綜合化學詞典 中。
鉬酸(3-),八(氰基-κC)-,鉀(1:3),(DD-8-11111111)或更常見的名稱,八氰合鉬酸(V) 鉀 < K3Mo(CN)8 > 是全面搜尋各種鹽的難點的一個很好的例子,因為 CAS 已分別註冊了該鹽,包括它的水合物和陰離子
| CASRN | 物質 | |
|---|---|---|
| 19442-23-0 | 八氰合鉬酸(V) 鉀 | |
| 123711-63-7 | 二水合物 | |
| 116188-33-1 | 三水合物 | |
| 17845-99-7 | 八氰合鉬酸(V) [陰離子] |
類似的困難出現在異構體中,因為每種異構體、外消旋混合物和未指定的“通用”化合物將具有不同的登記號
| CASRN | 物質 | |
|---|---|---|
| 62309-51-7 | 丙醇 [未指定] | |
| 71-23-8 | 1-丙醇 | |
| 67-63-0 | 2-丙醇 |
糖被註冊為開鏈結構和環狀結構,具有不同的 CASRN
| CASRN | 物質 | |
|---|---|---|
| 58367-01-4 | 葡萄糖 | |
| 50-99-7 | D-葡萄糖 | |
| 492-61-5 | β-D-葡萄糖 |
2008 年,CAS 與維基百科合作,為廣泛的公眾興趣的化學物質提供 CAS 登記號。結果是 Common Chemistry,這是一個網路資源,可以免費透過化學名稱或 CAS 登記號搜尋大約 7,900 種物質。輸入靛紅(Isatin)的 CAS RN,91-56-5,會顯示一個記錄,其中包含 CAS 首選名稱、1H-吲哚-2,3-二酮、靛紅的 18 個其他名稱、分子式、2D 結構圖以及指向維基百科關於靛紅的文章的連結。
化學名稱/名稱片段搜尋
[edit | edit source]CAS 物質詞典(在 SciFinder 中探索物質,以及 STN International 中的登記簿檔案)是現存最大的化學名稱單一來源。它包括商品名稱、通用名稱、倒置名稱、非倒置名稱、實驗室程式碼、過時名稱和官方 CAS 索引名稱。可以搜尋完整名稱和名稱片段(段),具體程度取決於使用的搜尋平臺。通常,必須遵循某些協議來處理名稱中的一部分特殊字元。例如,希臘字元會完整拼寫出來,並在希臘字元部分的名稱前後加一個句點。請注意,在 SciFinder 系統中,搜尋將使用或不使用希臘字母周圍的句點,但在 STN 命令語言搜尋中,句點是必須的。
正如本節的其餘部分將清楚地表明,搜尋化學名稱很棘手。零結果並不意味著該化合物不在資料庫中。該名稱可能不在資料庫中,或者輸入了簡單的錯別字,或者意外地沒有遵循搜尋約定。只有正確執行的結構搜尋、CAS 登記號或分子式搜尋才是結論性的。
化學文摘 (CA) 的化學命名法自 1907 年以來一直在不斷變化。因此,物質可能具有多個 CA 索引名稱,以及文獻和商業中使用的同義詞。在 2006 年底之前,主要更改僅在每個集體索引期的開始時進行。然而,從 2007 年開始,對 CA 索引名稱的更改根據需要進行。
在印刷版 CA 中,化學物質索引 (CSI) 將 CA 索引名稱的縮排形式(例如,苯,疊氮基-)連結到相關的摘要。然而,化合物類名稱(例如,芳基疊氮化物)在通用主題索引中被索引,同義詞和商品/通用名稱僅透過 CA 索引指南相關聯。
有關 CA 索引名稱的一些背景資訊,請參見:Charles H. Davis 的 化學命名法 Lite。
CAS 登記簿記錄可能包含各種舊的 CA 索引名稱、同義詞和程式碼,尤其是對於商業化學品而言。例如,苯的 CAS 登記簿記錄還包含以下可搜尋詞:1,3,5-環己三烯;苯;苯;煤焦油;環己三烯;NSC67315;菲;苯基氫化物;焦苯;焦苯;以及 [6]環戊二烯。
上標/下標被搜尋為普通字元,希臘字母被拼寫出來
Dicholormethane-d2 for Dichloromethane-d2
alpha-Acetylnaphthalene for α-Acetylnaphthalene
在搜尋 SciFinder 時,首先搜尋“化學名稱”以與 CA 索引名稱或同義詞完全匹配,如果找不到,則截斷或分割搜尋詞,然後再次搜尋。在使用 CA 索引名稱搜尋時,必須搜尋所有字元
Benzene, 1,4-dibromo- not Benzene, 1,4-dibromo
即使是相當複雜的名稱也可以搜尋。例如
“2-(3-丁烯基)-2,3,4,9-四氫-1H-吡啶並[3,4-b]吲哚-1-羧酸”
不是 CA 索引名稱,也不是作為同義詞列出,儘管它是 CA 索引名稱的直接形式。因此,它被分解,搜尋檢索到 8 個 CAS 登記簿記錄,包括具有 CA 索引名稱的記錄
“1H-吡啶並[3,4-b]吲哚-1-羧酸,2-(3-丁烯-1-基)-2,3,4,9-四氫-”
Care must be taken when searching with synonyms. For example, a search for ‘Potassium Octacyanomolybdate’ retrieves 11 substances. Some examples are:
- 鋁鉀八氰合鉬酸(IV)
- 鈷鉀八氰合鉬酸(IV)
- 鎵鉀八氰合鉬酸(IV)
- 鐵鉀八氰合鉬酸(V)
- 鎳鉀八氰合鉬酸(IV)
- 鉀八氰合鉬酸(IV)
但是,它不會檢索所有相關物質,因為術語“鉀”和“八氰合鉬酸”可能並不總是存在於同義詞名稱中。
然而,由於所有與“八氰合鉬酸(V) 鉀”相關的物質將具有類似的 CA 索引名稱,因此一種技術是顯示它的 CA 索引名稱:鉬酸(3-),八(氰基-κC)-,鉀(1:3),(DD-8-11111111)-,然後搜尋各種 CA 索引名稱片段
- 鉬酸(3-),八(氰基-κC)-,鉀檢索到八氰合鉬酸(V) 鉀及其二水合物和三水合物。
- 鉬酸(3-),八(氰基-κC)-檢索到大約 28 種物質,包括各種陽離子和 Mo(CN)8 陰離子。
- 鉬酸(3-),八(氰基-κC)-,(DD-8-11111111)檢索到大約 9 種物質,包括各種有機陽離子和 Mo(CN)8 陰離子
- 鉬酸(3-),八(氰基-κC)-,(DD-8-11111111)-僅檢索到 Mo(CN)8 陰離子
搜尋同義詞片段
‘octacyanomolybdate’ retrieves ~68 substances.
‘octacyanomolybdate(IV) retrieves ~14 substances.
‘octacyanomolybdate(V) retrieves only the anion
搜尋同義詞片段不可靠,因為同義詞不會新增到所有 CAS 登記簿記錄中。這些名稱片段搜尋結果通常包含各種無機鹽組合、水合物、陰離子和與有機化合物混合的鹽。
類似地,搜尋“葡萄糖”只會檢索到開鏈物質:葡萄糖和 D-葡萄糖,因為它是兩種物質的完整名稱同義詞。然而,葡萄糖不是 β-葡萄糖(環狀異構體)的同義詞。類似地,搜尋“丙醇”只會檢索到:丙醇 [未指定] 和 1-丙醇,而不會檢索到 2-丙醇,其同義詞是異丙醇。
也可以搜尋名稱字串;例如,“鉬,與鎳的化合物”。
總的來說,結構搜尋是首選,因為物質識別符號搜尋需要完全匹配,並且可能經常無法檢索到所有相關物質。
程式碼包括 GenBank 編號、酶委員會編號、色標編號等。CAS 對程式碼編號有標準政策。
• 字母后跟數字需要空格 [URB597 --> URB 597]。
• 類似 [數字-數字或字母-字母] 之間的標點符號保留,儘管 1,000 的逗號被刪除。
• 數字後跟字母需要合起來。
• 不相似 [字母-數字或數字-字母] 之間的標點符號被刪除,除了上面 1 中的情況。當數字明顯指定為定位符時,連字元保留;例如,2,4-D。
• Smiles 和 InChI 字串在結構編輯器中用於生成結構。
分子式搜尋通常會檢索到不止一種物質,因為可能存在異構體化合物。例如,CAS 登記處列出了超過 1600 種分子式為 C22H24FN3O2 的物質。
印刷版 CA 提供了分子式索引,將化學式連結到其倒置的 CA 索引名稱及其相關摘要。印刷版 CA 中的分子式搜尋基於 Hill 系統。Hill 系統列出碳(如果有的話),然後是氫,然後是按字母順序排列的任何其他元素(例如,C22 H24 F N3 O2)。在沒有碳的情況下,所有元素都按字母順序排列(例如,Al6 Ca5 O14)。這會導致與文獻中常見的慣例截然不同的分子式,例如 H2O4S 而不是 H2SO$ 用於硫酸。
然而,SciFinder 被設計為搜尋物質,不考慮元素順序或元素之間的空格。例如,H4SiO4、H4O4Si 和 H4 Si O4 都是可接受的搜尋詞,C22H24FN3O2 的任何組合也是如此。有時,系統會要求輸入空格或大小寫來消除歧義,例如,“COS”可以是Cobalt-Sulfur 或 Carbon-Oxygen-Sulfur。
瞭解鹽的點斷開式分子式(例如,C15 H24 N2 . 2 Cl H)、加成化合物(C6 H6 . C6 N4)和混合物的概念對於分子式搜尋至關重要。額外的規則/約定涵蓋聚合物、配位化合物和配位化合物的一個重要子集,有機金屬化合物。苯基鋰(MF:C6 H5 Li)是有機金屬化合物的一個例子。
化學文摘資料庫中分子式分配和搜尋的約定很複雜,特別是對於複雜物質(如複雜鹽和聚合物)。當物質收到點斷開式(多組分)分子式時,並不總是顯而易見。正確查詢的表述還取決於所使用的搜尋平臺。重要的是要查閱特定於所用平臺的文件以及本章末尾列出的其他資源。
也可以搜尋嵌入在化學名稱中的分子式(即作為物質識別符號),但前提是搜尋檢索結果少於 100 條記錄(例如,CuSO4 約 15 條,而 NaCl > 100 條,結果為零)
- 1. 鹽
像氯化鈉這樣的簡單鹽被搜尋為:< NaCl > 或 < ClNa >
像硫酸鈣或磷酸鋇這樣的無機含氧酸鹽必須搜尋為:< Ca . H2 O4 S > 或 < Ba . 2/3 H3 O4 P >。這反映了印刷卷的政策,例如,所有硫酸或磷酸的鹽都列在酸的分子式(H2O4S 或 H3O4P)下。
此政策也適用於像苯甲酸鈉這樣的簡單有機鹽,其搜尋方式為:< C7H6O2 . Na >,同樣,苯甲酸的 MF 是一個搜尋詞。
複雜的的有機/有機金屬鹽透過輸入陽離子的 MF . x(陰離子的 MF)進行搜尋,其中 x=陰離子的數量。
例如
| 物質 | 分子式 |
|---|---|
| 三 (2,2'-聯吡啶) 鐵 (2+) 雙 (四氟硼酸鹽) | C30 H24 Fe N6 . 2BF4 |
| 四 (四丁基銨) 八氰合鉬酸鹽 (4-) | C16 H36 N . 1/4C8MoN8 |
從上面的兩個例子可以看出
- 有機部分被視為中性分子,包括酸性氫原子。
- 金屬被視為一個獨立的、未連線的片段。
- 表示有機酸和金屬原子之間的比例。(如果未知,則比例表示為“x”。)
其他鹽 MF 的例子
- 未知比例:C6 H8 O7 . x Na
- 混合金屬鹽:C6 H8 O7 . Ca . Na
- 醇的金屬鹽:C6 H6 O2 . 1/2 Ba
- 2. 多組分物質
多組分物質包括鹽、水合物、加成化合物、混合物、合金、礦物和金屬間化合物,其中每個具有已知結構的組分可能具有自己的連線表,即結構。但是,這些組分結構可能不會指示組分是如何相互鍵合在一起的。
礦物和合金是多組分物質的例子。高嶺石“Al2 H4 O9 Si2”的分子式搜尋將檢索到礦物(高嶺石、葉蠟石、迪開石)和非礦物物質。
具有固定數量元素的合金使用點斷開式分子式進行搜尋。例如,[Fe . Mn . Ni] 檢索到超過 1000 種物質,每種物質的百分比組成各不相同(例如,“鎳合金,基體,Ni 70,Fe 20,Mn 10”,這是一個可搜尋的 CA 索引名稱)。
表格無機物質包括氫氧化鐵,它是一個例子,說明 CAS 如何索引具有不確定或多價陽離子的物質。例如,要搜尋所有氫氧化鐵
< Fe . H O > 檢索到 8 種物質 [例如氫氧化鐵 (Fe5(OH)12)]
有關更多資訊,請參見:http://library.caltech.edu/learning/classhandouts/scifinder.pdf
- 3. 元素組成搜尋
儘管 SciFinder 介面功能強大,但某些更高階的搜尋功能僅在專為更專業的搜尋人員設計的平臺(如 STN International)上可用。元素組成搜尋說明了這一點。以下示例使用 STN International 語法,源自分子式欄位
- 元素符號,指示元素的存在 (/ELS),例如,=> S B/ELS 和 H/ELS
- 元素計數,指定組分或物質中唯一元素的數量 (/ELC 或 /ELC.SUB)
- 元素式,組分的分子式,不包括表示比例的數字 (/ELF),例如,=> S AL CO LA O/ELF
- 週期族,元素的列和行標註,例如,=> S B6/PC 或 => S LNTH/PG
SciFinder 的主搜尋查詢螢幕允許搜尋根據化學文摘服務定義的某些類別(但並非所有類別)的物質進行限制。但是,所有這些類別都可以直接搜尋並用於將一組化合物限制為特定類別或類別。
| 類別名稱 | 程式碼 |
|---|---|
| 合金 | AYS |
| 配位化合物 | CCS |
| 註冊概念 | CTS |
| 通用註冊 | GRS |
| 未完全定義的物質 | IDS |
| 手動註冊物質 | MAN |
| 礦物 | MNS |
| 混合物 | MXS |
| 聚合物 | PMS |
| 自由基離子 | RIS |
| 環母體 | RPS |
CI 欄位在 STN International 搜尋中的一個使用示例是:=> SEARCH PMS/CI(檢索聚合物)
此類搜尋與其他登記檔案搜尋結合使用,以縮小答案集。有關其他可能性,請參見 登記資料庫摘要表。
角色是 CAS 標準索引術語,分配給每個索引物質以及化合物類別的受控索引術語。這些角色指定了在給定文獻引用中關於物質提供的資訊的型別。最初的九種角色是分析研究;生物學研究;非製備形成、雜項、出現、製備、性質、反應和用途。在舊版印刷化學物質索引中,這些角色用於細分在更常用的物質下列出的摘要號的長列表。
在 SciFinder 中,這些角色已擴充套件到 15 個,並追溯分配回 1967 年。製備角色追溯到資料庫的開始,1907 年。每當根據一組檢索到的物質請求文獻引用時,都會有一個選項限制為任何角色或一組角色。這些角色的定義在 SciFinder 的 檢索引用時物質的角色定義 中給出。
在 STN International,15 個角色被細分為可搜尋的細化類別。例如,現在可以指定不只是製備,而是具體地指定較小規模的合成製備或工業製造。STN 文件中列出了所有角色和子角色(稱為“超級角色”和“特定角色”)的完整列表,位於 CAS 角色在 CA/CAplus 快速參考卡 的最後一頁。
1. Wagner, A.B. 2011. 在 SciFinder 中搜索配位化合物和有機金屬化合物。科學與技術圖書館學問題 67 (2011 年秋季)。[網際網路]。[引用日期:2012 年 3 月 17 日]。可從以下網址獲取:http://www.istl.org/11-fall/tips.html
2a. Kozlowski, A.W. 1986. 配位化合物的介紹。在搜尋配位化合物中,第 2 章,第 5-10 頁。[網際網路]。化學文摘社,1986 年;[引用日期:3/15/12]。可從以下網址獲取:http://www.cas.org/File Library/Training/STN/User Docs/searchcoordcomp.pdf
2b. Kozlowski, A.W. 1986. 配位化合物的結構和登記政策。在搜尋配位化合物中,第 2 章,第 11-22 頁。[網際網路]。化學文摘社;[引用日期:3/15/12]。可從以下網址獲取:http://www.cas.org/File Library/Training/STN/User Docs/searchcoordcomp.pdf
3. Wagner, A.B. 2011. 在 SciFinder 中搜索無機物質。科學與技術圖書館學問題 64 (2011 年冬季)。[網際網路]。[引用日期:2012 年 3 月 17 日]。可從以下網址獲取:http://www.istl.org/11-winter/tips.html
Reaxys 是一個可透過網路訪問的化學化合物資料庫,它結合了
- 最初由德國研究所建立的 Beilstein 和 Gmelin 資料庫的線上版本,這些研究所分別以這些名稱命名
- 由各種組織在愛思唯爾(現擁有 Reaxys)的贊助下提供的更新材料
- 一個新的英語語言(有機)專利化學資料庫。
Beilstein 基於 Beilstein's Handbuch der Organischen Chemie (1771-1980),自 1981 年以來,透過來自 200 多種有機化學期刊的文章進行更新。Gmelin 基於 Gmelin's Handbuch der Anorganischen Chemie (1771-1994),自 1995 年以來,透過來自 100 多種無機/有機金屬化學期刊的文章進行更新。一些印刷版的 Gmelin 卷沒有包括在內。專利化學資料庫僅限於英語語言的美國(US,1976+)、世界智慧財產權組織(WO,1978+)和歐洲專利局(EP,1978+)專利,分配給國際專利分類程式碼 C07(有機化學)、A61K(藥品、化妝品和相關產品)和 C09B(染料)。愛思唯爾釋出了 Reaxys 涵蓋的期刊和專利列表。
其他專利覆蓋範圍(1869-1980)來自 Beilstein 和 Gmelin 記錄。請注意,許多外國專利可能在 SciFinder 中有美國和/或英國等效專利。有關更多資訊,請參閱加州理工學院圖書館的 專利和標準/商標 LibGuide。
由於 Beilstein 和 Gmelin 是化學化合物資料庫,因此首選對有機化合物進行結構搜尋,對無機化合物進行公式搜尋。然而,這兩類化合物都可以使用化學名稱或公式進行搜尋。
Reaxys 在其基於表單和高階屬性查詢螢幕上提供大量搜尋選項。透過單擊“[+]”符號生成分層下拉列表,顯示搜尋選項。
在更簡單的“屬性(基於表單)/標識資料”下,可以使用 Reaxys 和 CAS 登記號、包括同義詞的化學名稱以及分子式(MF)進行搜尋。在“屬性(高階)/標識資料”下,還可以透過許多其他方式進行搜尋,包括化學名稱片段、MF 範圍和片段、元素計數、元素或成分數量、分子量、合金成分以及特定於單個配體的欄位。對於每個搜尋欄位,單擊“[…]”框會顯示內部字典、搜尋框和可選擇的搜尋詞。Reaxys 對截斷(萬用字元符號)功能的替代方案是“化學名稱片段”欄位。
可以對單片段和多片段化合物的精確希爾順序分子式進行分子式搜尋。對於鹽類,陰離子的分子式用星號與陽離子隔開。例如,鄰苯二甲醯亞胺銅鹽的 MF 是 C8H4NO2*Cu。
請注意,許多研究級科學圖書館員擁有印刷版的原始 Gmelin 和 Beilstein 卷,這些卷可能被存放在倉庫中,尤其是當機構訂閱了 REAXYS 時。一旦人們瞭解了印刷卷的組織和索引方式,就可以執行高效有效的搜尋,儘管它不是最新的。Beilstein 在部分涵蓋了 1979 年以前的文獻後,停止了印刷版出版。 Gmelin 在 1997 年停止印刷版出版。
有關更多資訊,請參閱
- 透過分子子式搜尋物質(Reaxys 線上教程) - 5 分鐘
- 透過化學名稱或同義詞搜尋物質(Reaxys 線上教程) - 5 分鐘
- Reaxys - 2012 Beilstein/Gmelin/有機專利(加州理工學院)
- Reaxys 配體搜尋示例(加州理工學院)
- Reaxys 快速參考指南
在過去十年中,網際網路上公開提供的免費化學資訊資源的數量和質量都有了很大的提高。以下是一些最好的來源。其他高質量的來源可以透過查閱主要學術研究型大學的圖書館指南找到,例如布法羅大學的 化學:網際網路資源指南。
ChemIDplus
[編輯 | 編輯原始碼]ChemIDplus Lite 和 ChemIDplus Advanced 是大約 400,000 種物質(約 70% 具有結構資料)的免費可用的結構和命名權威檔案,這些物質在國家醫學圖書館 (NLM) 資料庫中被引用。搜尋欄位包括化學名稱、同義詞、CAS RN 和分子式。
有兩個搜尋選項
- ChemIDplus Lite 僅用於搜尋化學名稱或 CAS RN
- ChemIDplus Advanced 用於搜尋化學名稱、CAS RN、結構、分子式、毒性、物理性質範圍和定位碼。
來自這兩個介面的結果都包含檔案定位碼,這些碼在物質或網站級別上超連結到 NLM 的生物醫學資料庫、網際網路資源以及 超級列表 聯邦和州監管機構的彙編。
ChemIDplus Lite 提供有限的“基本資訊”和“搜尋導航”,而 ChemIDplus Advanced 具有擴充套件的列表,它提供
- 一個“放大結構”連結,該連結重新顯示化學結構,並帶有選中框以“顯示 3D 模型”,
- 一個“結構”連結(在基本資訊下),該連結重新顯示化學結構,提供 3D 表示,以及 InChI 和 SMILES 結構描述符符號,
ChemIDplus 雖然僅列出了大約 400,000 種化合物,但包含大量可搜尋的常見和商品名同義詞。
有關更多資訊,請參閱
ChemIDplus 常見問題解答(NLM)
PubChem 是 NCBI 的 Entrez 資訊檢索系統的一部分,旨在提供有關小分子(通常是分子量小於 500 道爾頓的分子)的生物活性資訊。PubChem 由三個關聯的資料庫組成
- PubChem Compound - 這是用於搜尋的預設資料庫,包括所有具有計算特性的獨特結構。這些化合物是從 PubChem Substance 資料庫中提取的。
- PubChem Substance - 包含對 800 多萬種已提交物質的描述;即從各種來源提交到 PubChem 的化學樣品。這些樣品中所有獨特且可明確識別的化合物都會被提取出來並連結到 PubChem Compound 記錄中。
- PubChem Bioassay - 是一個數據庫,包含 PubChem Substance 中描述的化學物質的生物活性篩選結果。包括來自各種來源的 180 多種生物測定法。
PubChem 將其記錄連結到 PubMed 和 NCBI 的 蛋白質 3D 結構資源 中的生物學性質資訊。
使用預設的基本查詢螢幕,可以使用化學名稱、同義詞、分子式或 CAS RN 搜尋 PubChem Compound 記錄。廣泛的“高階搜尋”提供原子計數、化學性質範圍、立體化學、生物測定範圍、到 Entrez 資料庫的連結,以及搜尋包含特定元素的分子選項。還可以將搜尋限制在資料庫中的大量特定欄位列表中。請注意,在搜尋螢幕上,有單獨的選項卡或下拉選單可用於切換到 Substance 和 Bioassay 資料庫。
有關更多資訊,請參閱
PubChem 課室講義(加州理工學院圖書館)PubChem 幫助(NLM) - 關於該系統的資訊全面且組織良好。
ChemSpider
[編輯 | 編輯原始碼]ChemSpider 現由英國皇家化學學會 (RSC) 贊助和維護,是一個免費可搜尋的化學結構資料庫,擁有來自數百個資料來源的超過 2600 萬個結構,提供三個查詢介面:簡單搜尋、結構搜尋和高階搜尋。
簡單搜尋需要“與分子相關的”文字字串,例如系統名稱、同義詞、商品名、註冊號、SMILES、InChI 或 ChemSpider ID (CSID)。儘管搜尋框下顯示的示例中未指出,但也可以輸入和搜尋分子式。高階搜尋介面允許進行更復雜和特定於欄位的查詢,包括指定化合物中可能存在、必須存在或一定不存在哪些元素。
搜尋結果包括名稱、同義詞、資料庫識別符號、預測性質(ACD、EPA/EPI、ChemAxon)、光譜;CIF、維基百科文章、專利、藥理學連結等,視情況而定。ChemSpider 化合物與 SureChem(一個專利資料庫)以及來自各種來源的期刊文章和書籍相連結,包括 RSC、PubMed 和 Google 圖書。
化合物也連結回 ChemSpider,但僅從 RSC 文章登入頁面(透過“化合物”選項卡)。單擊“化合物”選項卡將提供來自 SureChem 的專利選擇(美國專利商標局授予的專利和申請、歐洲授予的專利和申請、WO/PCT 和日本摘要)、RSC 文章以及化合物性質。記錄也可能包含指向 ChemSpider 合成頁面 中的反應的連結。
有關更多資訊,請參閱
- ChemSpider(維基百科文章)
- 什麼是 ChemSpider? (RSC) – 包含影片介紹。
免費搜尋;需要訂閱資料
[edit | edit source]化學字典合集 (CCD) 包含超過 160,000 個條目,包含超過 540,000 種化合物。CCD 以及《化學和物理手冊》都是免費可搜尋的,但需要訂閱才能檢視資料。非訂閱使用者可以使用網頁版本作為其在許多圖書館和實驗室中儲存的相應印刷卷的索引。
CCD 整合了以下可單獨搜尋的資料庫的內容
- 碳水化合物詞典
- 無機和有機金屬化合物詞典
- 天然產物詞典
- 有機化合物詞典
- 藥物詞典(以前稱為 PharmaSource)
CCD 同時支援化學名稱(包括同義詞和 CAS 註冊號)和分子式搜尋。它還具有“按元素進行的分子式”搜尋,允許搜尋資料庫中具有特定數量元素的所有化合物(例如,3 As)。
每個條目都提供有關化學、物理和生物性質的描述性資料和數值資料;系統名稱和通用名稱;文獻參考;結構圖、衍生物和異構體。CCD 的獨特之處在於它提供了來自參考來源和資料庫的各種獨特的文獻參考,這些參考未涵蓋在 Reaxys 或 SciFinder 中(例如,Aldrich 光譜目錄;Fieser & Fieser 的試劑……;Ullmann 和 Kirk-Othmer 百科全書;《藥典外編》;Bretherick 的《反應性化學危險手冊》;RSC 的《實驗室中的危害》;Sax 的《危險性質》……;Browning 的《毒性和代謝》……);或在 Reaxys 中(例如,《有機合成》,該書在 1980 年到 2008 年之間沒有被索引;《化學合成試劑百科全書》;以及對書籍章節的引用)。
有關更多資訊,請參閱
- 化學字典合集課堂講義(加州理工學院圖書館)
- 化學字典合集線上介紹(CRC 出版社)
總結
[edit | edit source]化學命名法是當今很少有化學家聲稱的專業領域,但資料庫和印刷參考作品中存在強大的搜尋功能,這些功能利用了化學名稱,包括普通名稱和正式名稱。另一方面,所有化學家都使用分子式,而 Hill 系統等系統用於排列索引中的分子式提供了有用的、儘管通常不唯一的檢索機制。化學文摘社 (CAS) 和許多第三方使用註冊號來索引參考作品和資料庫中的文件。註冊號搜尋的精確度無與倫比。CAS 資料庫和愛思唯爾的 REAXYS 是非常龐大、健壯的資料庫,它們相互競爭,並在許多方面相互補充。像 PubChem 和 ChemSpider 這樣的免費資源越來越多,使每個人都能獲得關於物質的廣泛、高質量的資訊。