什麼是標準偏差公式?

標準偏差是對數據集相對於平均值的可變性的測量。

計算標準偏差的方程是:

表達數據集中數據可變性的另一個指標是平均絕對偏差。在平均絕對偏差中,計算每個數據點和平均值之間的絕對差。在計算標準偏差的方程式中,添加數據點和均值之間差的平方,然後找到平方根。在標準偏差計算中,偏離平均值的數據點將更加突出。這個概念可以用一個例子來解釋。


考慮兩個數據集:

a = {200,197,198,203,202}

b = {0,0,0,0,1000}

各個數據集的手段將是:

平均絕對偏差將是:

標準偏差將是:

在此示例中,A是一個數據集,其中值更接近均值。但是在B中,所有數據點都遠離兩個方向的平均值。對於數據集A,平均絕對偏差和標準偏差之間的差異可忽略不計。但是,集合B的平均絕對偏差與標準偏差之間的差異要高得多。數據集中數據點的巨大差異已導致標準偏差明顯更高。當數據點的數量增加時,MAD和標準偏差之間的差異將會分歧。


高斯分布,68.2%的數據點將在平均兩側的一個標準偏差之內。超過95%的數據點將在平均兩側的兩個標準偏差之內。幾乎所有(99.7%)的數據點將位於平均兩側的三個標準偏差之內。

Baidu
map