2010年7月15日木曜日

実験と統計の話

実験をして、常にデータの処理とその解釈に追われることになるのが我々の日常で、その解釈は常にある一定の材料と条件のもとで同じことを繰り返し行なってみて、何度やっても同様の傾向が確かめられることをもってそのデータを「どうやら確からしい」と受け入れることから始まる。
過去の論文で提唱されている実験結果の中に存在しているどうも納得できない部分というのは実は無数に存在していて、論文のディスカッションの中でも明らかにそこの部分の討論に対してフォーカスを合わせることをわざと避けたようなものはいくらでもそのあたりの論文に見つけることが出来ます。
そのような曖昧な記述の中に実は次の発見が隠れていることがほとんどで、そのような部分に何らかの納得のいく整合性を求めて仮説に基づいた実験を繰り返していくことになります。(実際には曖昧にした部分には実験者自身が次の発見を隠して見せていないこともよく有ります。)ですから、繰り返した実験によってデータをきちんと処理していくことが大変大切なわけですが、世の中を時々騒がせるデータの捏造論文というのは、こういった地道な作業とは流れを異にしており
  • データを自分の仮説に都合よく解釈したり(それは絶対に無いでしょうという空想科学小説レベルのものから、ちょっとその解釈は強引すぎませんかという要討論レベルのものまで幅はありますが。)
  • データ自体を有りもしないのに画像や数値で捏造したり(これは再現性がなくて直ぐにアウトになるものなのに、世界中で毎月のようにマスコミを賑わせてますよね。有名無名の論文を問わず!
  • アウトプットは正しく測定していても、それを産み出す為の条件を極端に恣意的に曲げたり(よく見ます。)
等という感じのモノが多いようですが、どれもこれも科学者の倫理が崩壊するときに起きるものです。(まあ、知性の欠如でそうなっているのは論外ですが、、、。)
自分自身が陥る落とし穴というのは実験の上でここぞというときにいくらでも待ち構えていて、我々自身がどんなに明確な倫理を持ちあわせて実験を行っていても、歴史が何度も繰り返し明確に証明しているように、間違った解釈というのはいつでもどこででも発生するわけです。
特に例外的な観察事象を無視、もしくは見逃したところに、重大な隠された真実が存在していることがあることは普通です。また、我々は現時点では解釈できずにさらなる実験をまたなければいけないということで、討論部分を用いて、判っている事実から仮説を組み立て、いろいろと(言い訳を(笑))書き連ねて次の実験に持ち越さねばならないことも多くなります。
しかしそれは上記のような捏造とは明確に異なり、次の発見へのステップとなるわけで、まあ捏造とは違います。予算獲得のプレッシャーや、名声への渇望でデータ捏造をする極一部の人が存在することは確かですが、そんなことはしない人が大部分だということを私は信じたいです。まあ、長くなりましたが、統計というのは提示されたデータの嘘を見抜く大事な道具だということを実験のお話を通して言いたかっただけなんです。ちょっと話飛びすぎ&長すぎました。(笑)

統計局のウェブページの中に何とも分かりやすいお子様向けの統計解釈におけるピットフォールを説明したものがあった。難しい話は端折ってあるが、統計を勉強したことのない人にもよく解るようなかなりの出来栄えではないかと思っている。この本当に簡単なページに散りばめられたコンテンツをザッと理解するだけでも日本国民の統計というものに対する理解の質というのは相当に底上げ出来るのではないかと思うのです。

0 件のコメント: