R 中的資料探勘演算法/包/RWeka/Weka 聚類器

描述

R 對 Weka 聚類演算法的介面。

用法

Cobweb(x, control = NULL)

FarthestFirst(x, control = NULL)

SimpleKMeans(x, control = NULL)

XMeans(x, control = NULL)

DBScan(x, control = NULL)

引數

x，一個包含要聚類的資料的 R 物件。

control，一個 Weka_control 類物件，或一個控制選項的字元向量，或 NULL（預設）。

詳情

有一個用於從擬合的聚類器預測類 ID 或成員資格的預測方法。

Cobweb 實現 Cobweb（Fisher，1987）和 Classit（Gennari 等，1989）聚類演算法。

FarthestFirst 提供了 Hochbaum 和 Shmoys 的“最遠優先遍歷演算法”，它作為一種快速的簡單近似聚類器，模仿簡單的 k 均值。

SimpleKMeans 使用 k 均值演算法提供聚類。

XMeans 透過“改進結構部分”擴充套件了 k 均值，並自動確定聚類數量。

DBScan 提供了 Ester、Kriegel、Sander 和 Xu 的“基於密度的聚類演算法”。請注意，噪聲點被分配給 NA。

值

一個繼承自 Weka_clusterers 類的列表，其元件包括

clusterer，對使用給定控制選項將 Weka buildClusterer 方法應用於訓練例項獲得的 Java 物件的引用（jobjRef 類）。

class_ids，一個整數向量，指示每個訓練例項分配到的類（呼叫為已構建的聚類器和每個例項的 Weka clusterInstance 方法的結果）。

示例

   cl1 <- SimpleKMeans(iris[, -5], Weka_control(N = 3))
   table(predict(cl1), iris$Species)
   cl2 <- XMeans(iris[, -5],
   c("-L", 3, "-H", 7, "-use-kdtree", "-K", "weka.core.neighboursearch.KDTree -P"))
   table(predict(cl2), iris$Species)