標準偏差
エクセルで、標準偏差を計算する関数が「STDEV.S」と「STDEV.P」の2つあります。
どちらをどう使えばよいか分からず、時間かけて調べてしまったのでメモしておきます。
手っ取り早く例えで
ヘルプや解説サイトを見ても よく分からないので、手っ取り早く知るために 下図のようなデータの場合を例にして示します。
「STDEV.S」を使う場合
上記の10個のデータが、1万個のデータの中から抜き取ったサンプル(標本)のデータのとき。つまり、たくさんのデータの中からサンプリングした(標本)データを使って、標準偏差を計算するときは、「STDEV.S」を使う。
「STDEV.P」を使う場合
データ自体が全部で10個あって、この全データ10個のデータ(母集団全体)を使うとき。つまり、全データを使って、標準偏差を計算するときは、「STDEV.P」を使う。
エクセルのヘルプの内容
上記の例えをふまえると、エクセルのヘルプも なんとなく理解できます。
STDEV.S
引数を標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します
引数を標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します
STDEV.P
引数を母集団全体であると見なして、母集団の標準偏差を返します
引数を母集団全体であると見なして、母集団の標準偏差を返します
計算式の違い
標準偏差は、分散の正の平方根なんですが、、
分散に「不偏分散」と「分散」の種類があるので、エクセルでは標準偏差を計算する関数が2つあります。
「不偏分散」と「分散」の計算の違いは、(n-1)で割るか、nで割るかです。
なぜ、こうなるかの詳細は、検索するなど調べてください。ここでは、手っ取り早く、ざっくりということで。
コメント
エクセルのヘルプの内容ではよく書いてありますが、
下記の違いはプログラムで記載すると分かるのですが…。
標準偏差がズレる予測で悪値の算出
STDEV.S
標準偏差
STDEV.P
STDEV.SとSTDEV.Pとの比率は下記のようになっています。
個数が少ないほど悪い方(標準偏差が大きい)値を返すようになっています。
2個 1.414213562倍
3個 1.224744871倍
4個 1.154700538倍
5個 1.118033989倍
6個 1.095445115倍
7個 1.08012345倍
8個 1.069044968倍
9個 1.060660172倍
10個 1.054092553倍
11個 1.048808848倍
計算式
SQRT(n/(n-1))= 2個目 SQRT(2/1)=1.414213..