R語言資料探勘演算法
外觀

R語言資料探勘演算法
使用R探索資料集
一般來說,資料探勘 包含從大型資料集中確定有趣模式的技術和演算法。目前有數百種演算法可用於執行諸如頻繁模式挖掘、聚類和分類等任務。理解這些演算法的工作原理以及如何有效地使用它們是資料探勘分析師、研究人員和實踐者持續面臨的挑戰,特別是因為演算法行為和它提供的模式可能會隨著其引數的變化而發生顯著變化。在實踐中,大多數資料探勘文獻對於演算法的實際使用過於抽象,而引數調整通常是一項令人沮喪的任務。另一方面,有大量的實現可用,例如R專案中的實現,但它們的文件主要關注實現細節,而沒有對與每個實現相關的引數相關權衡進行很好的討論。
本華夏公益教科書旨在透過為每種技術整合三部分資訊來填補這一空白:描述和基本原理、實現細節以及用例。每種技術的描述和基本原理為理解實現並將其實用於實際場景提供了必要的背景。實現細節不僅展示了演算法設計,而且還根據先前提供的基本原理解釋了其引數。最後,用例提供了在合成數據集和真實資料集上使用演算法的經驗。
選擇R專案作為與本華夏公益教科書相關的計算平臺源於其流行程度(因此具有臨界質量)、易於程式設計、良好的效能以及在生物資訊學和金融等多個領域中日益增長的使用。
如果您想學習如何在R語言中程式設計,請閱讀《R 程式設計》這本書。