R 中的資料探勘演算法/包/RWeka/Weka 聚類器
外觀
R 對 Weka 聚類演算法的介面。
Cobweb(x, control = NULL)
FarthestFirst(x, control = NULL)
SimpleKMeans(x, control = NULL)
XMeans(x, control = NULL)
DBScan(x, control = NULL)
x,一個包含要聚類的資料的 R 物件。
control,一個 Weka_control 類物件,或一個控制選項的字元向量,或 NULL(預設)。
有一個用於從擬合的聚類器預測類 ID 或成員資格的預測方法。
Cobweb 實現 Cobweb(Fisher,1987)和 Classit(Gennari 等,1989)聚類演算法。
FarthestFirst 提供了 Hochbaum 和 Shmoys 的“最遠優先遍歷演算法”,它作為一種快速的簡單近似聚類器,模仿簡單的 k 均值。
SimpleKMeans 使用 k 均值演算法提供聚類。
XMeans 透過“改進結構部分”擴充套件了 k 均值,並自動確定聚類數量。
DBScan 提供了 Ester、Kriegel、Sander 和 Xu 的“基於密度的聚類演算法”。請注意,噪聲點被分配給 NA。
一個繼承自 Weka_clusterers 類的列表,其元件包括
clusterer,對使用給定控制選項將 Weka buildClusterer 方法應用於訓練例項獲得的 Java 物件的引用(jobjRef 類)。
class_ids,一個整數向量,指示每個訓練例項分配到的類(呼叫為已構建的聚類器和每個例項的 Weka clusterInstance 方法的結果)。
cl1 <- SimpleKMeans(iris[, -5], Weka_control(N = 3))
table(predict(cl1), iris$Species)
cl2 <- XMeans(iris[, -5],
c("-L", 3, "-H", 7, "-use-kdtree", "-K", "weka.core.neighboursearch.KDTree -P"))
table(predict(cl2), iris$Species)