統計/曲線擬合
在嘗試評估收集的資料時,通常會出現模式,例如在繪製 的光線光學散點圖時,會出現 -1 斜率。通常的目標是找到一個“擬合”資料的數學函式。也就是說,一個函式,它的值在相應的自變數和因變數的值上接近資料值。這通常被稱為“最小二乘”,其原因將在後面解釋。
一家商店以 P=3.49 的價格出售某種商品,每天平均銷售量為 V=100。因此,總收入 T=P 乘以 V=349.00 ..... 如果價格降低,那麼也許會賣出更多商品,但 T 可能更多或更少。顯然,如果 P=0,那麼 T 也會為零。以下是結果
P V T
2.99 130 388.70
3.29 123 404.67
3.49 100 349.00
顯然,“最佳”價格介於 2.99 和 3.49 之間。 ..... 曲線擬合 提供了 T 與 P 之間的方程式,用於比較許多可用的模型。
線性模型基於“最佳”直線。使用可以執行 迴歸 的計算器,我們發現對於上述資料,顯示 T 與 P 之間關係的圖的最近直線是
- T=605.268605263 - 68.9289473684 * P,並且該模型的相關性顯示為約 60%。
讓我們更詳細地研究它
P Actual T Calculated T Difference Difference2
2.99 388.70 399.17105263159 - 10.4710526316 109.642943214 3.29 404.67 378.49236842106 26.1776315789 685.268395081 3.49 349.00 364.70657894738 - 15.7065789474 246.696622231
將差異加起來,我們發現它們的總和幾乎為零,表明這是“最佳”線性模型。對負數求平方總是得到正數。因此,平方和將告訴我們擬合優度。這裡,平方和為 1041.60796053,我們可以比較不同的模型,最終選擇平方和最小的模型。
如果你沒有計算器或可以執行迴歸的計算機,那麼.....
在直線方程 y=a+b*x 中尋找 a 和 b
在上面的示例中,我們有
x x2 y y2 xy 2.99 8.9401 388.70 151087.69 1162.213 3.29 10.8241 404.67 163757.8089 1331.3643 3.49 12.1801 349.00 121801 1218.01 ---- ------- ------- ----------- --------- 9.77 31.9443 1142.37 436646.4989 3711.5873
我們有:n = 點數 = 3
ax=x 的平均值=9.77/3=3.256
ay=y 的平均值=1142.37/3=380.79
x1=x 的總和=9.77
x2=x2 的總和=31.9443
y1=y 的總和=1142.37
y2=y2 的總和=436646.4989
s1=xy 的總和=3711.5873
z1=s1-(x1*y1/n)=3711.5873-(9.77*1142.37/3)= -8.731
z2=x2-(x12/n)=31.9443-9.772/3=0.126
b=z1/z2=-68.9289473682
a=ay-b*ax=380.79-(-68.9289473682)*3.256=605.268605263
Thus we have y=605.268605263-68.92894736828*x as the best line to fit the given points of this example.
如果我們有 n 個點,那麼 (n-1) 次多項式將精確擬合這 n 個點。在這個示例中,我們有 3 個點,2 次多項式(拋物線)應該給我們一個精確的擬合。計算器提供了方程
(-663.1666666653)x2 + 4217.91999999x-6294.10448332,給我們
P Actual T Calculated T Difference
2.99 388.70 388.6999999956 4.4E-9 = zero plus rounding error 3.29 404.67 404.6699999951 4.9E-9 = zero plus rounding error 3.49 349.00 348.999999995 5.0E-8 = zero plus rounding error
這是一個完美的擬合,平方和最小表明應該使用此模型。
許多其他模型中的一些基於指數函式、對數以及自變數和/或因變數的各種操作。通常,“最佳擬合”是提供平方和最小的擬合。另外,當圖上的某些點比其他點更重要(例如,可能是端點)時,可以使用資料的加權。
- 注意:一些計算器可能要求曲線擬合連續的、等間隔的自變數。始終將原始圖與“擬合”圖進行比較。