”統計上は…”、”統計的には…” とうい表現は嫌というほど耳にします。
企業人はもちろん、学生のちょっとしたレポートですら避けては通れない道です。
確かにデータを数学的に解釈できれば、かっこいいし論理的根拠にもなるのですが…統計学に慣れていない人にとっては
数式ばかりでてきて何を言っているのかわからない。。。
私も修士課程の頃までは、Rという統計ソフトウェアのテンプレに逃げてばかりでした。
そこで、こちらの『統計学』というカテゴリーでは、
「統計の基本」として可能な限りわかりやすく数式を用いずに、必要な知識だけ提供していきたいと考えています。
今回は『平均と中央値ー日本人の平均給与って高すぎない?』として簡単に説明するので、音楽でも聴きながら気楽にお読みください。
スポンサーリンク
平均と中央値|日本人の平均給与って高すぎない?
平均と中央値|データ(分布)の中心を示す指標
1、平均値
「平均」なんて何をいまさら…と思わずお付き合いください。
この「平均」という概念は多くの統計分析の基礎となる最も重要な概念です。
今後の説明を分かりやすくするために、1つ例をだしておきましょう。
とあるブラック企業の給与体系を例に挙げます。
フリーター ⇒ 年収100万円
新入社員 ⇒ 年収200万円
係長 ⇒ 年収300万円
部長 ⇒ 年収400万円
社長 ⇒ 年収2,000万円
だったとします。
この場合、給料の合計は3,000万円(=100+200+300+400+1,000万円)なので、平均は600万円(3,000万円÷5人)ですね。
なんとも理不尽な給与体系です。
次は中央値をみていきます。
2、中央値
「中央値」とはデータを小さい順(または大きい順)に並べていったときに、ちょうど真ん中にくる値のことをいいます。
上記の例では、真ん中は係長さんなので、年収400万円が「中央値」です。
ここで、「平均」と「中央値」を比べてみると
「平均」が600万円なのに対し「中央値」は400万円で、200万円もの差が生じています。
これが、「日本人の平均給与は高いのに、自分の給料はやたら低いな…」と感じる1つの要因です。
一部の方が大儲けしているために「平均」が跳ね上がっているのですね。
よって、高額所得者がいる場合(=データのばらつきが大きい場合)には、「中央値」の方がより実態を反映する傾向にあります。
続いて、少し蛇足になりますが、実際の日本人の給与実態をご紹介しましょう。
スポンサーリンク
平均と中央値|日本人の平均給与のからくり
ここからは、平成25年度の国税庁公表「民間給与の実態調査結果」データに基づきます。
まず、日本人の平均給与は414万円(男性511万円、272万円)と公表されています。
なんか高いな…と思うのも当然です。
多くのからくりの基に成り立っています。
「平均値」414万円ですが、肝心の「中央値」をみていきましょう。
と言いたいところですが、こちらのデータは国税局が発表しておらず、正確な算出は不可能です。
そこで、煩わしい計算は抜きにして簡単に推定してみましょう。
年収別の人口割合は計算できるので、そこを参照します。
100万円以下 ⇒ 9.1%
100~200万円 ⇒ 15.0%(200万円以下 ⇒ 24.1%)
200~300万円 ⇒ 16.8%(300万円以下 ⇒ 40.9%)
300~400万円 ⇒ 17.4%(400万円以下 ⇒ 58.3%)
ここで全体の半分を超えました。
よって、少なくとも300~400万円の範囲に「中央値」がありますね。
300万円以下の人が41%いるので、だいたい「中央値」は350万円といったところでしょうか。
社会保険情報からもう少し正確に算出すると320-350万円の範囲内だと推定されます。
ただし、実際にはパートやアルバイトの方の多くが社会保険に加入していないため、「中央値」はもっと下がりそうですね。
平均給与を平均で見ると414万円ですが、中央値では350万円以下という結果になりました。
これがまさに統計のからくりです。
給与の例のように、数学的に理解・判断できることが統計メリットであり、怖いところでもあります。
少し統計の知識があれば、いい結果だけを強調したり、知識のない方を騙すことは容易です。
よって、統計量のデータに関しては、提示された情報をただ鵜呑みにするのではなく、別の角度から疑ってみることが肝要です。
実際に国税局は給与の「中央値」は決して公表しませんから…。。。
以上、「平均と中央値ー日本人の平均給与って高すぎない?」でした!
次の章では、「分散」と「偏差」という最初のつまづきポイントをわかりやすく解説します。
⇒ 次章『分散と標準偏差/データのひろがりと”データ数ー1”の理由』へ
「平均と中央値ー日本人の平均給与って高すぎない?」まとめ
1、データの中心を示す指標には、「平均」と「中央値(:真ん中の順位にくる値)」の2種類ある
2、情報を素直に受け入れるのではなく、別の角度から分析してみよう