跳轉到內容

R 中的資料探勘演算法/包/RWeka/評估 Weka 分類器

來自 Wikibooks,開放世界中的開放書籍

計算擬合的 Weka 分類器的模型效能統計資料。

evaluate_Weka_classifier(object, newdata = NULL, cost = NULL, numFolds = 0, complexity = FALSE, class = FALSE, seed = NULL, ...)

object,一個 Weka_classifier 物件。

newdata,一個可選的資料框,用於查詢用於評估的變數。如果省略或為 NULL,則使用訓練例項。

cost,一個 (錯) 分類成本的方陣。

numFolds,交叉驗證中使用的摺疊數。

complexity,選項,用於包含基於熵的統計資料。

class,選項,用於包含類別統計資料。

seed,交叉驗證的可選種子。

傳遞給其他方法的其他引數。

該函式計算並提取一組非冗餘的效能統計資料,適用於模型解釋。預設情況下,統計資料是在訓練資料上計算的。

其他引數僅支援邏輯變數 normalize,它告訴 Weka 規範化成本矩陣,以便正確分類的成本為零。

返回值

[編輯 | 編輯原始碼]

一個 Weka_classifier_evaluation 類的物件,包含以下元件的列表

string character,效能統計資料字串表示形式的連線。

details vector,基本統計資料,例如,正確分類的例項的百分比等。

detailsComplexity vector,基於熵的統計資料。

detailsClass matrix,類別統計資料,例如,每個響應變數級別的真陽性率等。

confusionMatrix table,真實類別和預測類別的交叉分類。

   w <- read.arff(system.file("arff","mytest.arff",package = "RWeka"))
   m <- J48(play~., data = w)
   e <- evaluate_Weka_classifier(m,cost = matrix(c(0,2,1,0), ncol = 2),numFolds = 10, complexity = TRUE,seed = 123, class = TRUE)
華夏公益教科書