2010年10月6日水曜日

平均を疑え

個別の論について反対したい訳ではないので、とりあえずざっくりと経緯をご紹介する。とあるブログでこのような論があった。

日本人の成人の平均年齢は50代だが、とある司法判断に携わったメンバーの平均年齢が「30.9歳」というのは変。

私は平均を持ち出す議論はまず疑ってかかる。平均「だけ」で論を組み立てようとするのは、極論をすれば怠慢か欺瞞かの何れかだと思っている。これはその論を否定する訳ではなく、論として成立しないだろうという意味である。件の論も、ひょっとしたら本当におかしいという結論に至るかも知れない。だがその根拠が「平均年齢」だけってのはあまりにもお粗末に過ぎるという事だ。

まず最低限、平均を語る時に考えないといけないのは分布だろう。分布まではいかなくても、分散くらいは確認しておきたい。更に規模が全く違うもの、あるいは性質の全く異なる集合同士では、そもそもある属性値の統計量で比較すること自体が適切ではない可能性もある訳だ。今回の場合は、そもそも「年齢」という属性が本当に大きな要因になるのだろうか。問題となる司法判断に関係するのは年齢ではなく、平均余命かもしれない。そんな属性は全く関係なく、年収が関係あるのかもしれない。いやいや、そもそも定量化可能な属性には意味が無い可能性もある。一体その論を組み立てる為に、年齢がどの程度の意味がある事なのか。因みに件の論に関しては、私は年齢をメトリクスに取った意味を余り感じられなかった。

数字、定量的なデータに基づいた論は、何となく説得力があるように思う。一つにはそれが検証可能であるからで、客観性という意味では数字やデータに基づいた論を展開する事は重要な事だと思う。だが実のところ、数字があれば説得力があるのかと言えばそれは全然別問題。平均を取るなんてのは、データ分析を何もやっていないに等しいのだ。

論を補強する為に正しいメトリクスを選んで、正しい分析をする事。それが出来て初めてデータに基づいて論を組み立てたと言える。

0 件のコメント:

コメントを投稿