跳轉到內容

統計/曲線擬合

來自華夏公益教科書,開放的書籍,為開放的世界
(重定向自 曲線擬合)

在嘗試評估收集的資料時,通常會出現模式,例如在繪製 的光線光學散點圖時,會出現 -1 斜率。通常的目標是找到一個“擬合”資料的數學函式。也就是說,一個函式,它的值在相應的自變數和因變數的值上接近資料值。這通常被稱為“最小二乘”,其原因將在後面解釋。

銷售示例

[編輯 | 編輯原始碼]

一家商店以 P=3.49 的價格出售某種商品,每天平均銷售量為 V=100。因此,總收入 T=P 乘以 V=349.00 ..... 如果價格降低,那麼也許會賣出更多商品,但 T 可能更多或更少。顯然,如果 P=0,那麼 T 也會為零。以下是結果

        P          V           T
      2.99        130        388.70
      3.29        123        404.67
      3.49        100        349.00

顯然,“最佳”價格介於 2.99 和 3.49 之間。 ..... 曲線擬合 提供了 T 與 P 之間的方程式,用於比較許多可用的模型。

線性模型

[編輯 | 編輯原始碼]

線性模型基於“最佳”直線。使用可以執行 迴歸 的計算器,我們發現對於上述資料,顯示 T 與 P 之間關係的圖的最近直線是

T=605.268605263 - 68.9289473684 * P,並且該模型的相關性顯示為約 60%。

讓我們更詳細地研究它

   P    Actual T   Calculated T       Difference     Difference2
2.99 388.70 399.17105263159 - 10.4710526316 109.642943214 3.29 404.67 378.49236842106 26.1776315789 685.268395081 3.49 349.00 364.70657894738 - 15.7065789474 246.696622231

將差異加起來,我們發現它們的總和幾乎為零,表明這是“最佳”線性模型。對負數求平方總是得到正數。因此,平方和將告訴我們擬合優度。這裡,平方和為 1041.60796053,我們可以比較不同的模型,最終選擇平方和最小的模型。


如果你沒有計算器或可以執行迴歸的計算機,那麼.....

計算擬合給定點的最小二乘直線

[編輯 | 編輯原始碼]

在直線方程 y=a+b*x 中尋找 a 和 b

在上面的示例中,我們有

    x       x2      y       y2             xy

  2.99   8.9401  388.70  151087.69     1162.213
  3.29  10.8241  404.67  163757.8089   1331.3643
  3.49  12.1801  349.00  121801        1218.01
  ----  ------- -------  -----------   ---------
  9.77  31.9443 1142.37  436646.4989   3711.5873

我們有:n = 點數 = 3
ax=x 的平均值=9.77/3=3.256
ay=y 的平均值=1142.37/3=380.79
x1=x 的總和=9.77
x2=x2 的總和=31.9443
y1=y 的總和=1142.37
y2=y2 的總和=436646.4989
s1=xy 的總和=3711.5873
z1=s1-(x1*y1/n)=3711.5873-(9.77*1142.37/3)= -8.731
z2=x2-(x12/n)=31.9443-9.772/3=0.126
b=z1/z2=-68.9289473682

a=ay-b*ax=380.79-(-68.9289473682)*3.256=605.268605263

Thus we have y=605.268605263-68.92894736828*x as the best line to fit the given points of this example.

拋物線模型

[編輯 | 編輯原始碼]

如果我們有 n 個點,那麼 (n-1) 次多項式將精確擬合這 n 個點。在這個示例中,我們有 3 個點,2 次多項式(拋物線)應該給我們一個精確的擬合。計算器提供了方程
(-663.1666666653)x2 + 4217.91999999x-6294.10448332,給我們

   P    Actual T   Calculated T       Difference
2.99 388.70 388.6999999956 4.4E-9 = zero plus rounding error 3.29 404.67 404.6699999951 4.9E-9 = zero plus rounding error 3.49 349.00 348.999999995 5.0E-8 = zero plus rounding error

這是一個完美的擬合,平方和最小表明應該使用此模型。

其他模型

[編輯 | 編輯原始碼]

許多其他模型中的一些基於指數函式、對數以及自變數和/或因變數的各種操作。通常,“最佳擬合”是提供平方和最小的擬合。另外,當圖上的某些點比其他點更重要(例如,可能是端點)時,可以使用資料的加權。

注意:一些計算器可能要求曲線擬合連續的、等間隔的自變數。始終將原始圖與“擬合”圖進行比較。
華夏公益教科書