標準偏差とは?サルでもわかるように簡単に説明

統計
スポンサーリンク




主婦

よく±2SDって見るけどなんですか?

 

上級医

標準偏差のことですね
ばらつきを知る上で重要です

学校の試験が返ってきたときに気になることはなんですか?

もちろん点数は気になると思いますが

もう一つ気になることはありませんか?

そうですね

周りの人と比較して自分がどの程度できたのかということですよね

80点の答案が返ってきて嬉しくて友達に自慢したところ

周りの友達はみんな90点以上でした・・・(親にはみんなの点数はだまっておこう)

ちなみに偏差値もこの標準偏差を用いて計算された数字です

 

この周りと比較するときにばらつき・分布を知る必要があります

ばらつきを示すものとして

標準偏差:standard deviation,SD

範囲:range」

四分位範囲:inter-quartile range」

があります

3つもあるんですか?もう自分には無理なので諦めま・・・

諦めたらそこで試合終了ですよ?

大丈夫です

サルでもわかるように簡単に説明します

この記事を読んで出来るようになること

・標準偏差の意味がわかる
・標準偏差の使い方がわかる
・標準偏差が使えない状況がわかる
・標準偏差が使えない状況にも対応できる




標準偏差:SD

標準偏差は平均値の後に書かれています

今回調査した対象の年齢 33±6歳

また次のように書かれていることもあります

今回調査した対象の年齢 33(SD:6)歳
どちらも同じ意味です

それでは具体的な例を用いて考えてみましょう

あなたが今30人のクラスにいるとしましょう

身体測定を行いました結果は以下のようになりました

身長 平均値 170.3cm 標準偏差 4.5cm

ここでポイントのおさらいをしましょう

標準偏差はデータのばらつきを表す数値の1つです

標準偏差の使い道

得られたデータの95%は
平均値ー標準偏差×2〜平均値+標準偏差×2の間に存在する

どうですか?

思っていたよりも単純ではありませんか?

もちろん標準偏差を求める式だの考えると話は難しくなりますが

まずは標準偏差というものが何を意味するのか

そしてどのように使えるかを知ることが大事です

YouTube:動画を見ることができるサイト

使い方:暇つぶしや勉強に使える

これで十分です

YouTubeに動画をUpする方法を知らなくても困りませんよね?

つまり先程の例に戻ると標準偏差を使うことで

クラスの学生の95%は

170.3ー2×4.5から170.3+2×4.5cm

つまり

161.3〜179.3cmの間の身長であることがわかります

それでは試しに次のクラスの身長の分布を考えてみてください

クラスA 平均 170cm 標準偏差 2.5cm
クラスB 平均 170cm 標準偏差 5cm
クラスC 平均 170cm 標準偏差10cm

計算できましたか?

クラスAの95%は165〜175cmの間の身長である(分布の幅10cm)

クラスBの95%は160〜180cmの間の身長である(分布の幅20cm)

クラスCの95%は150〜190cmの間の身長である(分布の幅40cm)

この3つのクラスを比較して気がつくことがありませんか?

そうです

標準偏差が大きくなるほど分布の幅は広くなる

さらに標準偏差には他の使い道があります

例えばある学校の男子と女子の身長を測定したところ次のようになりました
男子 平均 170cm  標準偏差 3cm
女子 平均 158cm  標準偏差 2cm

男子の95%は164〜176cm

女子の95%は154〜162cm

女子よりも男子の方が身長が高いことが予想できます

一方で

男子 平均 170cm 標準偏差 5cm
女子 平均 158cm 標準偏差 3cm

この場合

男子の95%は160〜180cm

女子の95%は152〜164cm

女子よりも男子の方が身長が高そうですが

重なる部分もあるのでハッキリとは言えないですね

このように平均値と標準偏差がわかると
グループ間に差があるかどうかをある程度推測することができます

標準偏差が使えない状況

さて勘の鋭いヒトなら気がついたかもしれませんが

平均値があるということは中央値の場合は使えるのか?という疑問が出て来ますね

「平均値と中央値って同じことじゃないの?」と思ったヒトはこちらをご覧ください

学会発表で知らずに恥をかいているかも?今さら聞けない平均と中央値の違いを簡単に解説【統計】
平均と中央値の違いを説明できますか?学会発表などで間違えて使っていると結構恥ずかしいです。この記事では平均と中央値を誰にでもわかるように解説しています。平均300万円と平均500万円の会社なら後者を迷いなく選んだあなた、これまでの人生騙されていませんか?

平均値はデータに偏りがない時

中央値はデータに偏りがある時に使いましたね?

つまりデータに偏りがある

平均値が使えない状況では

先程までの便利な標準偏差は全く役に立ちません(これまでの時間返せ!!)

実際に考えてみましょう

クラス10人のお年玉を考えてみましょう

5,000円が2人

7,000円が3人

10,000円が4人

100,000円が1人(IT企業の社長の息子)

データに偏りがありますね

計算すると

平均値は17,100円 標準偏差は27,700円となります

お年玉でもらっている金額の95%は-38,300円〜72,500円の間になります

・・・

もはや意味がわかりませんね

このようにデータに偏りがあると使えないんです

 

安心してください!そんな時の対応も教えますよ!

 

四分位範囲

これは得られたデータの小さい方25%と大きい方25%のデータを捨て

残った中央50%のデータ範囲を求めたものです

ピンと来ませんよね?

先程のお年玉の例をみていきましょう

計算すると

中央値は8,500円

小さい方25%は7,000円

大きい方75%は10,000円です

ここで一番簡単な「範囲」もついでに説明します

範囲」は最小〜最大を示したものです

お年玉 中央値8,500円(範囲5,000円〜100,000円)

これを見るとこのクラスでは

一番少ないヒトは5,000円

一番多いヒトは100,000円

8,500円程度もらっているヒトが多いんだなとわかります

さらに四分位範囲を用いると

お年玉 中央値8,500円(四分位範囲7,000円〜10,000円)(範囲5,000円〜100,000円)

クラスの半分のヒトは7,000〜10,000円もらっていることがわかります

 

データに偏りがない場合 平均値と標準偏差でバラつきがわかる
データに偏りがある場合 中央値と四分位範囲でバラつきがわかる

参考文献

コメント

タイトルとURLをコピーしました