跳轉到內容

統計學/分佈/離散

來自華夏公益教科書,開放的書籍,面向開放的世界

“離散”資料是指假設某些離散和量化值的​​資料。例如,是非答案是離散的,因為只有兩種可能的選項。閥門設定,如“高/中/低”,可以被視為離散值。作為一般規則,如果資料可以在實踐中被計數,那麼它們可以被認為是離散的。

為了說明這一點,讓我們考慮世界人口。這是一個離散數字,因為平民人數在理論上是可以計數的。但是由於這在實踐中不可行,統計學家通常將此資料視為連續的。也就是說,我們認為人口處於一個數字範圍內,而不是一個單獨的點。

對於好奇的人來說,截至 2006 年 8 月 9 日,世界人口為 6,533,596,139。請注意,統計學家並沒有透過計數單個居民來得出這個數字。他們使用了人口中更小的樣本估計了整體。回到第一章,這是一個學習統計學的絕佳理由 - 我們只需要更小的資料樣本就可以對整個人口進行智慧描述!

離散分佈是透過繪製本質上離散的資料的頻率分佈而得到的。

一般性質

[編輯 | 編輯原始碼]

累積分佈函式

[編輯 | 編輯原始碼]

離散隨機變數具有累積分佈函式,它描述了隨機變數低於該點的機率。累積分佈必須向 1 遞增。根據隨機變數的不同,它可能在有限數量時達到 1,也可能不會。cdf 用大寫 F 表示。

ń====機率質量函式====

離散隨機變數具有機率質量函式,它描述了隨機變數在特定點上的可能性。機率質量函式的總和必須為 1,並且加起來等於 cdf。pmf 用小寫 f 表示。

特殊值

[編輯 | 編輯原始碼]

離散變數的期望值為

離散變數的任何函式 g() 的期望值為

方差等於

外部連結

模擬二項式、超幾何和泊松分佈:離散分佈

華夏公益教科書