集中趨勢的統(tǒng)計量
一維資料的集中趨勢可能有以下數(shù)種統(tǒng)計方法。在某些情況下,經(jīng)轉(zhuǎn)型(data transformation)后的資料才采用以下的方法。
算數(shù)平均數(shù)觀測值的總和除以觀測值的個數(shù),即 。常簡稱為平均數(shù),也往往是背后機(jī)率分布的期望值之不偏估計。
中位數(shù)將所有觀測值按大小排序后在順序上居中的數(shù)值。
眾數(shù)出現(xiàn)最多次的觀測值。
幾何平均數(shù)觀測值的乘積之觀測值個數(shù)方根,即
調(diào)和平均數(shù)觀測值個數(shù)除以觀測值倒數(shù)的總和,即
加權(quán)平均數(shù)考慮不同群資料貢獻(xiàn)程度不同時的算數(shù)平均數(shù)。
截尾平均數(shù)(truncated mean)忽略特定比例或特定數(shù)值之外的極端值后所得的平均數(shù)。例如,四分平均數(shù)(interquartile mean)正是忽略25%前及75%后的資料后所得的算數(shù)平均數(shù)。
全距中點(midrange)最大值與最小值的算數(shù)平均數(shù),即
中樞紐(midhinge)第一四分位數(shù)與第三四分位數(shù)的算數(shù)平均數(shù),即
三均值(trimean)考慮三個四分位數(shù)的加權(quán)平均數(shù),即
極端值調(diào)整平均數(shù)(winsorized mean)以最接近的觀測值取代特定比例的極端值后取得的算數(shù)平均數(shù)。舉例來說,考慮10個觀測值(由小到大排列為至
)的情況下,10%的極端值調(diào)整平均數(shù)為
其中分別以
和
取代了
和
。
以上的統(tǒng)計量在多維變數(shù)中仍可單獨地被套用在各個維度上進(jìn)行,但并不能保證在轉(zhuǎn)軸后仍維持一致的結(jié)果。12
平均數(shù)、中位數(shù)與眾數(shù)的關(guān)系在左右對稱的機(jī)率分布中,不同的集中趨勢統(tǒng)計量有相同結(jié)果,但在偏度遠(yuǎn)離0時則可能不一致。在單峰型的機(jī)率分布(unimodal probability distribution)中,平均數(shù)(μ)、中位數(shù)(ν)與眾數(shù)(θ)的關(guān)系如下:
其中σ為標(biāo)準(zhǔn)偏差。至于任一機(jī)率分布,
。3