「夫子憮然曰、鳥獣不可與同羣。吾非斯人之徒與、而誰與。
「論語」微子、第十八、六

2014/05/05

ラオ「統計学とは何か」第4章について

連休三日目。今日も何の予定もなく、閑暇に憩う一日。湯船で「統計学とは何か」(C.R.ラオ著/藤越康祝・柳井晴夫・田栗正章訳/ちくま学芸文庫)より、第4章「重み付き分布」を読む。

ラオのこの本は、一般読者向けに統計学の本質と意義を解説する易しい本だが、その中の第4章だけ、非常にテクニカルで数学的な内容になっている。私は長い間、これはずいぶんとアンバランスだなあ、と思ってきた(それにほとんどの読者がこの章で挫折するのではないか、とも)。そもそも他の章の表題が「不確実性を飼いならす」とか「統計学による真理探求」なのに、それと並んで「重み付き分布」は変ではないか。この理論はラオによって開拓されたので、我田引水しちゃったのかなあ、とさえ思っていたのだが、最近は考えを改めた。

基本的にこの章は、一つの数学的手法について書いているのではなく、データ自体に内在する偏り(観測誤差ではない)を議論する章だと考えるべきなのだろう。そう思って読むと、データ取得自体に自然に歪みが忍び込む興味深いケースが色々紹介されていて、それをどうモデル化するか、どう結果を解釈するかが、具体例を通して論じられている。これは統計学の根幹に関わる問題だし、特に応用の上で重要だろう。

例えば、我々はあまりにしばしば、ゼロ値をデータに数えることを忘れ、観測され易いものほどより多くデータになることを失念したままモデル化する。これは統計家や科学者だけでなく、我々の日常的な判断にひそむ問題でもある。そのような一般的で重要な問題に一章を割いても、当然だろう。