統計数字を疑う

読後は統計を見る目が変わりました。ちなみに統計学の本を読んだのは初めてです。

統計数字を疑う なぜ実感とズレるのか?
統計数字を疑う なぜ実感とズレるのか?
このサイトから - が購入しました
全体で -人 がクリック

posted with amazlet on 07.02.11
門倉 貴史
光文社
売り上げランキング: 1293
おすすめ度の平均: 5.0

5 基本的に良書。「標準正規分布の累積確率」を知っているレベルの人には、あまり新知識はないかも。
5 数値データの信憑性
5 統計を扱うことの難しさがよくわかる1冊

平均貯蓄残高1728万円の怪

総務省の家計調査報告(貯蓄・負債編)によると、2005年の一世帯あたりの平均貯蓄残高(全世帯)は1728万円で、前年比2.1%増となった。

読者のみなさんは、この数字を見てどういう印象を持たれたであろうか?

きっと「なんだ、なんだ!お金がない、お金がないと言いつつ、みんな結構お金を貯めているではないか。ウチは平均値と比べて貯蓄残高がかなり少ないぞ。なんかすごくあせってきたぞ・・・・・・。もっとがんばって貯蓄していかなくては!」と思ったのではないか。

実際、筆者の身の回りのに人に聞いても、「平均貯蓄残高が1728万円というのは実感と合わない」という回答が圧倒的多数を占めた。

なぜ、統計数字と実感が大きくズレてしまうのだろう。実は、この統計数字と実感のズレは「平均」のマジックによって生じている。

(中略)

実は、この「平均」が私たちの実感とぴったり合うのは、データの分布が図2の正規分布という特殊な分布に従う場合だけである。(p25)

正規分布の図はWikipediaの正規分布の右上のグラフの緑の線を見てください。

これはなんとなく「富豪が平均を押し上げているんじゃない?」というのは誰しも思うところではありますが、そういうことよりも、「多くの人はこれくらい」という情報として平均が有効な情報になるのは正規分布という特殊な分布のときだけ、というのが重要です。

メディアンとモード

(貯蓄残高という)こうしたいびつな分布を平均値で見ることには、あまり意味がない。「メディアン」や「モード」でみるほうが私たちの実感に近づく。

「メディアン」とは、中央値のことで、データを小さい順に並べたときにちょうど真ん中に来るデータの値である。

先ほどの貯蓄残高でメディアンを見ると、1052万円になっており、平均値の1728万円からはずっと金額が下がってくる。

一方、「モード」は、最頻値のことで、最も多い頻度で出てくるデータの値である。

先ほどの貯蓄残高のデータでモードを見ると、最も世帯数が多い階級は200万円未満の階級となっている。そこには、全体の4.1%もの世帯が含まれているのだ。この金額はかなり実感に近いのではないだろうか。

貯蓄残高の分布では、平均、メディアン、モードがそれぞれ大きく離れているが、厳密な正規分布では、平均、メディアン、モードの値が全て一致する。(p28)

「平均」を語る際は「メディアン」と「モード」もあわせて。

男性の初婚年齢が25年前とほとんど変わらぬ理由

(中略:平均初婚年齢が25年前と2歳程度の差しかない話)

ここで注意すべきことは、平均初婚年齢はその年に結婚した夫婦を母集団として平均年齢を算出している点だ。まだ結婚していない男女は、そもそも母集団の中に含まれていないのだ。

一生独身で人生を終える人は、常に平均初婚年齢を押し上げる潜在的要因になっているにもかかわらず、結婚をしないために、そもそも実際の平均初婚年齢には反映されないのである。(p48)

そもそものデータの取り方が非常に重要な例です。平均値を見る場合、母集団の性質をよく考える必要があります。

*愛知万博の経済効果は本当にあったのか

(中略)

たとえば、神奈川県在住のAさんの、愛知万博開催期間中の行動を考えてみよう。

Aさんは、毎年5月のゴールデン・ウィークになると、軽井沢にゴルフに出かけるのが習慣であった。しかし、その年は愛知万博が開催されているから、軽井沢はやめにして万博を訪れることに決めた。

このような場合、Aさんが毎年ゴルフで軽井沢に落としていたお金は、愛知万博のほうに流れていってしまったことになる。(p118)

「経済効果」を計るときは、範囲と、それをやらなかった場合はどうだったのかを考える必要があるということ。

※淘汰されるシンクタンクを見分けるには?

(中略)

読者のみなさんが、世に乱立するシンクタンクの真価を見極めるにあたって、ひとつアドバイスをさせていただくと、とりあえず「○○の経済効果」といったオモシロ・ネタを中心にレポートを出しているシンクタンクは、あまり信用しない方がいい。(p144)

シンクタンク調査員の強いモチベーションはマスコミに掲載されることであり、良い調査報告を出すことが二の次になる場合が少なくないので、そのあたりを割り引いて見る必要があるそうです。実際にかなりの数のいいかげんなレポートがあるとか。

ちなみに、シンクタンクとは政策立案・意思決定の調査と分析を行う機関のことです。Wikipediaのシンクタンクの項目をざっと目を通すとよいです。

数式を極力少なめに全体的にテンポよく書かれているので、とりあえず統計に惑わされないぞマインドを身につけるのに良い本だと思いました。

統計数字を疑う なぜ実感とズレるのか?
統計数字を疑う なぜ実感とズレるのか?
このサイトから - が購入しました
全体で -人 がクリック

posted with amazlet on 07.02.11
門倉 貴史
光文社
売り上げランキング: 1293
おすすめ度の平均: 5.0

5 基本的に良書。「標準正規分布の累積確率」を知っているレベルの人には、あまり新知識はないかも。
5 数値データの信憑性
5 統計を扱うことの難しさがよくわかる1冊

コメント / トラックバック

コメント / トラックバック 1 件

  1. んがえ より:

    愛知万博の話で思ったのはプロ野球で「阪神が優勝したときの経済効果」みたいな話。

    いや、、、
    毎年 必ず 絶対に どっかの球団が優勝するから ってのを考えに入れてないでしょ。
    って、こと。