R語言資料探勘演算法/聚類/期望最大化(即將推出)
外觀
< R語言資料探勘演算法 | 聚類
在統計學中,最佳化問題用於在一個特定空間中最大化或最小化一個函式及其變數。由於這些最佳化問題可能具有各種不同的型別,並且每種型別都有其自身的特徵,因此存在許多技術來解決其中的一些問題。
最大似然法是這些技術之一,其主要目標是使用特定資料集調整統計模型,估計其未知引數,以便該函式可以描述資料集中所有引數。換句話說,該方法將根據資料集或已知分佈調整統計模型的一些變數,以便模型可以“描述”每個資料樣本並估計其他樣本。這種技術在資料探勘和知識發現領域非常重要,因為它可以作為大多數複雜且強大的方法的基礎。
期望最大化方法是從最大似然法發展而來的一種方法,試圖在某些變數未觀察到的情況下估計似然。該方法於1977年由[2]首次記錄,儘管正如作者所建議的那樣,該技術在文獻中被非正式地提出過。因此,這項工作是其在文獻中的第一次正式化。
該函式可以透過迭代過程近似計算引數,該過程稱為期望步驟(E步驟)和最大化步驟(M步驟),分別執行以找到未觀察到的變數並重新估計最大似然的引數。下一節將更詳細地描述該方法,並提供一個包含函式計算所有步驟的演算法。
(正在建設中:翻譯)
(正在建設中:翻譯)
(正在建設中:翻譯)
(正在建設中:翻譯)
(正在建設中:翻譯)