跳轉到內容

R 中的資料探勘演算法/包/RWeka/Weka 分類器規則

來自 Wikibooks,開放的書籍,為開放的世界

R 中對 Weka 規則學習器的介面。

JRip(formula, data, subset, na.action, control = Weka_control(), options = NULL)

M5Rules(formula, data, subset, na.action, control = Weka_control(), options = NULL)

OneR(formula, data, subset, na.action, control = Weka_control(), options = NULL)

PART(formula, data, subset, na.action, control = Weka_control(), options = NULL)

formula,模型擬合的符號描述。

data,可選資料框,包含模型中的變數。

subset,可選向量,指定擬合過程中要使用的觀測值子集。

na.action,一個函式,指示當資料包含 NA 時應該發生什麼。

control,一個 Weka_control 類物件,用於傳遞給 Weka 學習器的選項。

options,一個命名列表,包含其他選項,或 NULL(預設)。

存在一個用於預測擬合模型的 predict 方法,以及一個基於 evaluate_Weka_classifier 的 summary 方法。

JRip 實現了一個命題規則學習器,“重複增量剪枝以產生誤差減少”(RIPPER),由 Cohen (1995) 提出。

M5Rules 使用分治法為迴歸問題生成決策列表。在每次迭代中,它使用 M5 構建一個模型樹,並將“最佳”葉節點變成一個規則。

OneR 構建一個簡單的 1-R 分類器,參見 Holte (1993)。

PART 使用 Frank 和 Witten (1998) 的方法生成 PART 決策列表。

模型公式應該只使用“+”和“-”運算子來分別指示要包含或不包含的變數。引數 options 允許進一步自定義。目前,options model 和 instances(或它們的區域性匹配)被使用:如果設定為 TRUE,模型框架或相應的 Weka 例項將被包含在擬合模型物件中,這可能會加速對該物件的後續計算。

返回值

[編輯 | 編輯原始碼]

一個繼承自 Weka_rules 和 Weka_classifiers 類的列表,包含以下元件

classifier,一個對 Java 物件的引用(jobjRef 類),該物件是透過將 Weka buildClassifier 方法應用於使用給定的控制選項構建指定的模型而獲得的。

predictions,一個數值向量或因子,包含對訓練例項的模型預測(透過對已構建的分類器和每個例項呼叫 Weka classifyInstance 方法的結果)。

call,匹配的呼叫。

   M5Rules(mpg ~ ., data = mtcars)
   m <- PART(Species ~ ., data = iris)
   summary(m)
華夏公益教科書