跳轉到內容

統計/資料視覺化/箱線圖

來自華夏公益教科書

箱線圖

[編輯 | 編輯原始碼]
圖 1. 麥克爾遜-莫雷實驗資料的箱線圖

箱線圖(也稱為盒須圖)是單變數樣本的關鍵特徵的簡單視覺化表示。

箱體位於樣本範圍內的垂直軸上。通常,箱體的頂部放置在第 1 四分位數,底部放置在第 3 四分位數。箱體的寬度是任意的,因為沒有 x 軸(儘管請參見下面的小提琴圖)。

在箱體的頂部和底部之間,是某種對集中趨勢的表示。一種常見的版本是在中位數處放置一條水平線,將箱體分成兩部分。此外,在箱體的水平方向上,中心位置放置一個星號或星號來表示均值。

另一個常見的擴充套件是“箱須圖”。這在圖的頂部和底部添加了垂直線,擴充套件到例如最大值和最小值。例如,均值上下 2 個標準差內的最遠值。或者,須線可以擴充套件到第 2.5 和第 97.5 百分位數。最後,在箱須圖中,通常用星號顯示在須線末端之外的單個值,表示離群值(無論定義如何)。

小提琴圖是箱線圖的擴充套件,它利用水平資訊來呈現更多資料。它們顯示了對CDF的某種估計,而不是一個箱子,儘管分佈的分位數仍然顯示出來。

華夏公益教科書