R 中的資料探勘演算法/包/RWeka/Weka 分類器函式
R 介面到 Weka 迴歸和分類函式學習器。
LinearRegression(formula, data, subset, na.action, control = Weka_control(), options = NULL)
Logistic(formula, data, subset, na.action, control = Weka_control(), options = NULL)
SMO(formula, data, subset, na.action, control = Weka_control(), options = NULL)
formula,要擬合模型的符號描述。
data,可選的資料框,包含模型中的變數。
subset,可選的向量,指定擬合過程中要使用的觀測子集。
na.action,一個函式,指示當資料包含 NA 時應該發生什麼。
control,一個 Weka_control 類物件,用於傳遞給 Weka 學習器的選項。
options,一個命名的進一步選項列表,或 NULL(預設)。
存在用於從擬合模型預測的 predict 方法,以及基於 evaluate_Weka_classifier 的 summary 方法。LinearRegression 使用 Akaike 準則進行模型選擇,構建合適的線性迴歸模型。Logistic 基於嶺估計構建多項式邏輯迴歸模型。SMO 實現 John C. Platt 的序列最小最佳化演算法,使用多項式或 RBF 核訓練支援向量分類器。多類問題透過成對分類解決。
模型公式應僅使用“+”和“-”運算子分別指示要包含或不包含的變數。引數 options 允許進一步自定義。目前,選項 model 和 instances(或這些選項的部分匹配)被使用:如果設定為 TRUE,則模型框架或相應的 Weka 例項將分別包含在擬合模型物件中,這可能會加快對該物件的後續計算。
一個繼承自 Weka_functions 和 Weka_classifiers 類的列表,其元件包括:classifier,一個對 Java 物件的引用(jobjRef 類),該物件是透過將 Weka buildClassifier 方法應用於使用給定的控制選項構建指定模型而獲得的。
predictions,一個數值向量或因子,包含訓練例項的模型預測(對構建的分類器和每個例項呼叫 Weka classifyInstance 方法的結果)。
call,匹配的呼叫。
LinearRegression(mpg ~ ., data = mtcars)
step(lm(mpg ~ ., data = mtcars), trace = 0)
LinearRegression(weight ~ feed, data = chickwts)
STATUS <- factor(infert$case, labels = c("control", "case"))
Logistic(STATUS ~ spontaneous + induced, data = infert)
glm(STATUS ~ spontaneous + induced, data = infert, family = binomial())
SMO(Species ~ ., data = iris, control = Weka_control(K = list("weka.classifiers.functions.supportVector.RBFKernel", G = 2)))
SMO(Species ~ ., data = iris, control = Weka_control(K = list("RBFKernel", G = 2)))