跳轉到內容

R 中的資料探勘演算法/包/RWeka/Weka 聚類器

來自華夏公益教科書

R 對 Weka 聚類演算法的介面。

Cobweb(x, control = NULL)

FarthestFirst(x, control = NULL)

SimpleKMeans(x, control = NULL)

XMeans(x, control = NULL)

DBScan(x, control = NULL)

x,一個包含要聚類的資料的 R 物件。

control,一個 Weka_control 類物件,或一個控制選項的字元向量,或 NULL(預設)。

有一個用於從擬合的聚類器預測類 ID 或成員資格的預測方法。

Cobweb 實現 Cobweb(Fisher,1987)和 Classit(Gennari 等,1989)聚類演算法。

FarthestFirst 提供了 Hochbaum 和 Shmoys 的“最遠優先遍歷演算法”,它作為一種快速的簡單近似聚類器,模仿簡單的 k 均值。

SimpleKMeans 使用 k 均值演算法提供聚類。

XMeans 透過“改進結構部分”擴充套件了 k 均值,並自動確定聚類數量。

DBScan 提供了 Ester、Kriegel、Sander 和 Xu 的“基於密度的聚類演算法”。請注意,噪聲點被分配給 NA。

一個繼承自 Weka_clusterers 類的列表,其元件包括

clusterer,對使用給定控制選項將 Weka buildClusterer 方法應用於訓練例項獲得的 Java 物件的引用(jobjRef 類)。

class_ids,一個整數向量,指示每個訓練例項分配到的類(呼叫為已構建的聚類器和每個例項的 Weka clusterInstance 方法的結果)。

   cl1 <- SimpleKMeans(iris[, -5], Weka_control(N = 3))
   table(predict(cl1), iris$Species)
   cl2 <- XMeans(iris[, -5],
   c("-L", 3, "-H", 7, "-use-kdtree", "-K", "weka.core.neighboursearch.KDTree -P"))
   table(predict(cl2), iris$Species)
華夏公益教科書