R 中的資料探勘演算法/包/RWeka/Weka 分類器函式

描述

R 介面到 Weka 迴歸和分類函式學習器。

用法

LinearRegression(formula, data, subset, na.action, control = Weka_control(), options = NULL)

Logistic(formula, data, subset, na.action, control = Weka_control(), options = NULL)

SMO(formula, data, subset, na.action, control = Weka_control(), options = NULL)

引數

formula，要擬合模型的符號描述。

data，可選的資料框，包含模型中的變數。

subset，可選的向量，指定擬合過程中要使用的觀測子集。

na.action，一個函式，指示當資料包含 NA 時應該發生什麼。

control，一個 Weka_control 類物件，用於傳遞給 Weka 學習器的選項。

options，一個命名的進一步選項列表，或 NULL（預設）。

細節

存在用於從擬合模型預測的 predict 方法，以及基於 evaluate_Weka_classifier 的 summary 方法。LinearRegression 使用 Akaike 準則進行模型選擇，構建合適的線性迴歸模型。Logistic 基於嶺估計構建多項式邏輯迴歸模型。SMO 實現 John C. Platt 的序列最小最佳化演算法，使用多項式或 RBF 核訓練支援向量分類器。多類問題透過成對分類解決。

模型公式應僅使用“+”和“-”運算子分別指示要包含或不包含的變數。引數 options 允許進一步自定義。目前，選項 model 和 instances（或這些選項的部分匹配）被使用：如果設定為 TRUE，則模型框架或相應的 Weka 例項將分別包含在擬合模型物件中，這可能會加快對該物件的後續計算。

返回值

一個繼承自 Weka_functions 和 Weka_classifiers 類的列表，其元件包括：classifier，一個對 Java 物件的引用（jobjRef 類），該物件是透過將 Weka buildClassifier 方法應用於使用給定的控制選項構建指定模型而獲得的。

predictions，一個數值向量或因子，包含訓練例項的模型預測（對構建的分類器和每個例項呼叫 Weka classifyInstance 方法的結果）。

call，匹配的呼叫。

示例

   LinearRegression(mpg ~ ., data = mtcars)
   step(lm(mpg ~ ., data = mtcars), trace = 0)
   LinearRegression(weight ~ feed, data = chickwts)
   STATUS <- factor(infert$case, labels = c("control", "case"))
   Logistic(STATUS ~ spontaneous + induced, data = infert)
   glm(STATUS ~ spontaneous + induced, data = infert, family = binomial())
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("weka.classifiers.functions.supportVector.RBFKernel", G = 2)))
   SMO(Species ~ ., data = iris, control = Weka_control(K = list("RBFKernel", G = 2)))