学会発表で知らずに恥をかいているかも?今さら聞けない平均と中央値の違いを簡単に解説【統計】

統計
スポンサーリンク




研修医

研修医

平均って普段から馴染みがあるけど、論文で見かける中央値と同じですか?

上級医
上級医

平均=中央値もあれば平均≠中央値もあります

一緒に勉強していきましょう

こんにちは、小児科のタコスです

統計が大の苦手でした

統計を勉強する前の私は

平均値(俗語)中央値(正式名称)と思っていました

論文を読むだけならまだ被害は少ないですが

自分の学会発表で間違えて使用していると

それだけで「こいつわかっていない」と

レッテルを貼られ

それ以外がどんなにいい発表でも

全く評価されません

知らずに恥をかく前に勉強していきましょう

この記事でわかること
✔︎平均値と中央値の違いがわかる
✔︎平均値と中央値を正しく使用できる
✔︎平均値を使った過大広告に騙されないようになる




平均と中央値

あなたが研修病院を探す時どちらを選びますか?(お金で選ぶことはないと思いますが・・・)

平均年収1000万円のA病院

平均年収800万円のB病院

同じ研修を受けられるのであれば平均年収の高いA病院を選んだあなた

統計を勉強した方が良いですよ

これまでにすでに騙されている可能性があります

平均年収は1000万円ですが、あなたの年収は200万円です

同じ平均年収1000万円ですが、あなたの年収は600万円です

もし中央値で比較していたとすると

A病院の年収の中央値は500万円 B病院の中央値は850万円となります

この条件を提示されていたらB病院を選びますよね

さぁどんな時に平均、中央値を使い分けたらよいか考えていきましょう

平均

平均とはデータ値の総和を人数で割った値です(小学生でも知っています)

問題

Aクラスの試験平均点はいくつですか

71点,72点,72点,73点,73点,73点,74点,75点,77点

73.3点になります

Bクラスの試験平均点はいくつですか

71点,72点,72点,73点,73点,73点,74点,75点,100点

75.8点になります

あなたがBクラスで75点をとって張り切って家に帰っても母親に

「あんた平均点もとれてないやないの!!」

となぜかクラス2位にもかかわらず怒られてしまいます

この場合、平均点ってしっくりこないですよね

実は平均が使える条件は、下記のようにデータの分布が偏っていない時なんです正規分布

中央値

中央値はデータを大きい順に並べ、真ん中の順番になった人の値です

先程の試験結果を中央値で考えてみましょう

 

Aクラスの試験の中央値はいくつですか

71点,72点,72点,73点,73点,73点,74点,75点,77点

クラスで5番目の点数なので73点

Bクラスの試験の中央値はいくつですか

71点,72点,72点,73点,73点,73点,74点,75点,100点

クラスで5番目の点数なので73点になります

これなら75点で怒られることはないはずです

このように中央値はデータの分布が偏った時も使えます

 

冒頭で述べた平均=中央値となるパターンはデータの偏りがない時で

平均≠中央値となるパターンはデータの偏りがある時です

データに偏りがあると、平均と中央値は大きくずれる可能性がある

 

なら全部中央値でいいじゃないか!!と声が聞こえそうですが

私たちは小さい頃から平均で慣れ親しんで来ているので

正規分布の場合であれば理解しやすい平均が示されます

データが偏っていない 平均
データが偏っている  中央値
平均や中央値は論文の背景比較の部位でよく見かけます
正規分布と考えてよい論文のデータには年齢、身長、血圧などが挙げられます
他のCRPなどの検査値は中央値で書いてあります(適当な論文を見てみてください)
最後に
平均のマジックを理解出来た今、下記のような広告をどう感じますか?
この記事を読むまでは飛びついてクリックした人も
そもそも何人のデータ?
データの偏りはない?
元々高収入の人が多いだけじゃない?など
これまでの楽観的な視点だけでなく、批判的な視点を持つことで、
物事をよく吟味することができるようになるわけです
(この広告を決して批判しているわけではありません)
さて、平均、中央値がわかったところで
次の時間は背景比較にある年齢、身長の後に書いてある±◯◯に関して勉強していきましょう
参考文献

コメント

タイトルとURLをコピーしました