統計學/分佈/離散
外觀
“離散”資料是指假設某些離散和量化值的資料。例如,是非答案是離散的,因為只有兩種可能的選項。閥門設定,如“高/中/低”,可以被視為離散值。作為一般規則,如果資料可以在實踐中被計數,那麼它們可以被認為是離散的。
為了說明這一點,讓我們考慮世界人口。這是一個離散數字,因為平民人數在理論上是可以計數的。但是由於這在實踐中不可行,統計學家通常將此資料視為連續的。也就是說,我們認為人口處於一個數字範圍內,而不是一個單獨的點。
對於好奇的人來說,截至 2006 年 8 月 9 日,世界人口為 6,533,596,139。請注意,統計學家並沒有透過計數單個居民來得出這個數字。他們使用了人口中更小的樣本估計了整體。回到第一章,這是一個學習統計學的絕佳理由 - 我們只需要更小的資料樣本就可以對整個人口進行智慧描述!
離散分佈是透過繪製本質上離散的資料的頻率分佈而得到的。
離散隨機變數具有累積分佈函式,它描述了隨機變數低於該點的機率。累積分佈必須向 1 遞增。根據隨機變數的不同,它可能在有限數量時達到 1,也可能不會。cdf 用大寫 F 表示。
ń====機率質量函式====
離散隨機變數具有機率質量函式,它描述了隨機變數在特定點上的可能性。機率質量函式的總和必須為 1,並且加起來等於 cdf。pmf 用小寫 f 表示。
離散變數的期望值為
離散變數的任何函式 g() 的期望值為
方差等於
外部連結
模擬二項式、超幾何和泊松分佈:離散分佈