最佳分類/Rypka 方法
外觀
< 最佳分類
Rypka[1]方法[2]使用理論和經驗分離方程(如下所示)來執行最佳分類任務。該方法找到最少屬性的最佳順序,這些屬性組合定義了元素的有界類。
該方法的應用從在真值表[3]或電子表格形式中構建屬性值系統開始,其中元素在第二行開始的左most列中列出。特徵[4]在第二列開始的第一行中列出,屬性標題在左most單元格中。通常,資料的檔名被賦予元素類別的標題。將連線每個特徵與每個元素的值放置在交叉單元格中。選擇所有元素都共有的特徵可能是建立能夠利用此方法的資料庫中最困難的部分。
首先按照它們的真值表值對元素進行排序,該值是根據每個元素的現有特徵序列和值計算的。降序。整個有界類的重複真值表值或多重集表明要麼需要消除重複元素,要麼需要包含額外的特徵。
為集合中的每個特徵計算一個經驗分離值,並將具有最大經驗分離值的特徵與佔據最顯著屬性位置的特徵交換。
接下來,透過計算每個剩餘特徵與第一個特徵的組合的經驗分離值,找到第二重要的特徵。產生最大分離值的特徵隨後與佔據第二顯著屬性位置的特徵交換。
接下來,透過計算每個剩餘特徵與第一和第二個特徵的組合的經驗分離值,找到第三重要的特徵。產生最大經驗分離值的特徵隨後與佔據第三顯著屬性位置的特徵交換。此過程可以繼續進行,直到所有特徵都被處理,或者直到元素的百分之百分離得到實現。
較大的基數將允許透過排除每個特徵的更高百分比的元素來更快地識別。例如,二進位制基數只排除每個特徵的百分之五十的元素,而五進位制基數則排除每個特徵的百分之八十的元素。[5]以下是矩陣和分離方程的解釋。[6]
- ↑ :Eugene Weston Rypka 於 2006 年 4 月 27 日去世。Gene 於 1925 年 5 月 6 日出生於明尼蘇達州奧瓦託納,父母是 Charles Frederick 和 Ethel Marie Rypka。他在二戰期間作為一名醫務兵在硫磺島服役,並獲得了多個獎章和嘉獎。1958 年,Gene 獲得了斯坦福大學的醫學微生物學博士學位。他擁有漫長而傑出的職業生涯,包括與洛夫萊斯醫療中心和新墨西哥大學的俄羅斯科學家合作。腳踏車比賽是他一生的愛好和職業,在後來的幾年裡,他還學習了武術。
- ↑ 主要參考文獻: 由 R.J. Pankhurst 編輯的生物識別與計算機,英國博物館(自然歷史)倫敦,英國,1973 年 9 月 27 日和 28 日在劍橋國王學院舉行的系統學協會特別卷號 7 會議的論文集,由學術出版社於 1975 年出版,其中提到了 Eugene W. Rypka 的工作,洛夫萊斯健康科學中心微生物學系,新墨西哥州阿爾伯克基,"模式識別與微生物識別"。ISBN 0125448503
- ↑
- ↑ 特徵和屬性可以互換使用。
- ↑ 參見主要參考文獻第 158 頁的表格 II。
- ↑ 應查閱主要參考文獻以獲得該方法更詳細和深入的解釋。