- ベストアンサー
データはすべて信頼できるのか
●●したひとの95%は■であるなどというデータが巷でもっともらしく飛び交っています。 でもデータと言うのは本当に信頼できるのでしょうか。 「野球をすると長生きする」と言うデータがあるとします。 たしかに世界ではアメリカ、韓国、日本など最高クラスの先進国が野球を盛んにしてます。 先進国→医療や食生活がゆたか→長生き。と言うのが真相で信頼性がある気がします。 「野球をすると長生きする」と言うデータを必ずしも信頼できないと思うんですが。 そのデータが本当に信頼できるかどうか科学の世界ではどのように評価するのですか。 お時間あるときで結構ですのでよろしくお願いします。
- みんなの回答 (10)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
そういうものは、ほとんどが相関関係を述べています。しかも、たいていはある一つの相関研究です。 某所で流された非常に困ったものがありました。「睡眠時間が7時間が最も健康で長生き」という相関関係研究の一例が、「」内の言葉だけが、「科学的な研究で」という形容と共に流されました。 研究一例とはいえ、この相関関係結果が出たのは事実でしょう。そして、それ自体は私の知る限りでは、おおむね正しいのです。 しかし、「睡眠時間を7時間にすれば、健康になり長生きできる」ではありません。 7時間未満の短時間睡眠者には、多数の「寝る暇もないほど忙しい過労の人々」が含まれます。 7時間以上の長時間睡眠者には、多数の「睡眠自体に問題がある程の疾病者」が含まれます。 相関関係は、そういう事実を洗い出したに過ぎません。 なお、健康でもアスリートなどでは、肉体を大変に疲労させますので、8時間以上の睡眠が必要な人も多数います。そういう人が睡眠時間を減らすと、当然ですが、心身に問題が起こってきます。 ですので、「睡眠時間を7時間にすれば、健康になり長生きできる」はデマ、それも有害なもので 一部の事実を知る人々が火消しにかかったんですが、非常に手がかかりました。それでも、今なお信じている人はいるでしょう。 馬鹿馬鹿しい例では、戦後しばらくして、牛乳を飲むとガンになるという珍説を熱心に主張する人がいました。 これも因果関係は分かっています。牛乳を不自由なく飲めるほど食糧事情が改善し、当然ですが栄養状態が良くなり、国内医療技術の進歩・普及に伴って、長生きするのが当たり前になったからでした。 ガンは高齢で多くなります。要は、「ガンになるくらいの年齢まで長生きするのが普通になった」ということでした。 健康にいい保養地ほど病死率が高い。確かにそういう相関関係はあります。 これも、いろいろの疾病の重症患者が、その地の病院を入院先に選ぶ等、健康に少しでも良い条件を求めて集まって来るからです。そういう土地にいると罹病しやすいわけではありません(むしろ逆)。 野球と平均寿命に相関があるにしても、因果関係ではないでしょうね。野球を当たり前に楽しめる、それくらい豊かな国では長生きが普通ということでしょう。 こういうことは枚挙にいとまがありません。 >先進国→医療や食生活がゆたか→長生き。と言うのが真相で信頼性がある気がします。 というご理解で間違いありません。 逆の有名な例もあります。脚気の原因が特定される以前です。 日本海軍では、麦飯を食べる人に脚気がないことから、軍隊食に麦飯を取り入れ、戦争で長期出生する兵士に脚気はありませんでした。 日本陸軍では、軍医だった森鴎外が脚気病原菌説に固執し、それを証明するためか、麦飯を禁止しました。結果、出征兵士に戦死・戦傷ではない脚気による被害が多数出ました。 こういうことも多数あります。 ですから、判断基準は単純ではありません。 しかし、経験に学ぶやり方は、まさに経験から知っています。それを常識と呼んでもいいでしょう。 相関があっても、因果関係が専門家でも分からないなら、今まで通り、常識で判断すればいい。それだけですね。
その他の回答 (9)
- el156
- ベストアンサー率52% (116/220)
仮説検定ということをします。 例えばグループAから100人の標本を取った時95人が長寿、グループBから100人の標本を取った時85人が長寿だとした場合、グループAとグループBの長寿比率は本来等しい(違いは標本の取り方の偶然による)、という仮説を立てて、その仮説がどのくらいあり得ないかを計算します。この例で計算すると、グループAとグループBの長寿比率が本来等しいという可能性は1.8%となります。常識的にはこれが5%以下なら仮説は誤っている、即ちグループAとグループBの長寿比率には違いがある、と判断します。当然ですが、比率の差が大きい程、又同じ比率でも標本数が多い程、グループAとグループBの長寿比率が等しい可能性は低くなります。もちろんこの確率が極めて低かったとしても、グループAとグループBの長寿比率が本来同じだということは確率的に殆どありえない、というだけで、何故グループAとグループBの長寿比率が違うのかは何も説明しません。統計は確かに違いがあるかどうかを言うだけです。 このような検定を、比率の差の検定と言います。上記では結果を「長寿か長寿でないか」の2値に分けましたが、グループAとグループBの寿命の平均と標準偏差を使って平均寿命に違いがあると言えるかどうかを検定することも可能です。こちらはt検定と言います。
- Tacosan
- ベストアンサー率23% (3656/15482)
他の人も言われていますが, 「データそのもの」と「データを解釈した結果」とはきちんと区別する必要があります. 「『野球をすること』と『寿命が長いこと』の間に正の相関がある」というのは (このこと自身が正しいかどうかは知りませんが) 「得られたデータを統計的に処理した」だけであって, その限りにおいて「正しい」ということができます. しかし, 「野球をすること』と『寿命が長いこと』の間に正の相関がある」ということと「野球をすると長生きする」とは全く別のことです. 統計は「相関がある/ない」ということまでしか言いません. そこから先, 「因果関係」については「データ処理」ではなく違う方法で示さなければなりません. それを怠ると「アルミニウムがアルツハイマー病を引き起こす」といった誤った情報の流布につながってしまいます.
- Mokuzo100nenn
- ベストアンサー率18% (2123/11344)
>アメリカ、韓国、日本など最高クラスの先進国 アメリカと日本は先進国ですが、大韓民国は途上国です。 このような基本的事項の誤認が判断を誤らせます。
- under12
- ベストアンサー率12% (202/1670)
95%がどうとか言うのは大概が裏付けのない占いですな。信頼性を求めるならば、 因果関係を立証すればいい。逆に言えば、そういう論理的思考ができない者ばかりが 占いに飛びつきます。そして他者から肯定されていると勘違いして、根拠のない安堵感を 得たがるのです。 科学というのは因果関係を明確にする事です。 >>アメリカ、韓国、日本など最高クラスの先進国が~ こういう言い方は、全ての起源は韓国にあるという妄言を吐く一部の韓国人が 多用します。あなたはそういう類ですか? 違いますよね?w
- raiden787
- ベストアンサー率37% (179/473)
他の回答者様も仰っておりますが「野球をすると長生きする」はデータではありません。データから導き出された解釈ですね。 データとは客観性のある数値や記録された現象(例えば病院のレントゲン写真など)などや、これらを理解しやすいように加工したものです。データは万人が同じように認識できるものでなくてはなりません。 野球と長生きの例で言えば、仮に「プロ野球選手の平均寿命はプロ野球選手ではない人々の平均寿命より10年長い」という統計的数値があればこれはデータです。平均寿命という数値は誰が見ても変わらない客観的なものだからです。 ただし寿命の計測が正しいかは別問題ですね。戸籍や誕生日、死亡届が出された日が間違ってたら当然寿命は本来のものとはずれますし。 なのでデータが信頼できるかはそのデータを具体的にどのように取ったかを調べて判断する必要があります。 寿命に関して言えば出産届や死亡届をみんなきちんと出してるか、とか役所はその記録を正しく管理してるか、とか平均寿命を出す計算で計算ミスはしてないかとか。 データが正しいか、データの扱いは正しいか、データの解釈は妥当か、科学の場ではこれらを判定することは重要です。 しかしながらテレビとかCMとかで「○○する人の95パーセントが~~」とかいうのは大抵適当なのであまり信用なさらないほうがよろしいかと。 マスコミやテレビ番組のスタッフの大半は科学の科の字もしらないし、知ってても視聴率のために堂々と無視します。
- patent123
- ベストアンサー率36% (260/719)
「野球をすると長生きする」という主張は 「サッカーをすると長生きする」という主張と比較したくなります。 統計の処理がキチンとできていると信用性があるのですが... 日本では、統計処理をキチンとせず、主張に合わせて 数字を操作することが比較的多いです。 キューバなど、中米も野球が盛んですが、 寿命は長いのでしょうかね? また、日本、米国でも野球をする人もいるし、 野球をしない人もいます。 そこをどう考えるのでしょうか?
- phobos
- ベストアンサー率49% (515/1032)
> ●●したひとの95%は■であるなどというデータが巷でもっともらしく飛び交っています。 質問者さんがここで「データ」と言っているのは、正しくは「統計から導き出した解釈(の一つ)」と言うべきでしょう。 質問者さんがあげた例で言えば、 「○○国では国民が最も好むスポーツは野球であり、○○%の人が野球を第1位にあげている。野球愛効率は世界第○位である」 「○○国では世界第○位の長寿国である」 ……という個々の事実と数字が「データ」です。 このデータ(統計)を元にした一つの解釈が「野球をすると長生きする」ということになりますが、その結論はもちろん間違っています。 これに対して「何かヘンだぞ」と感じて、質問者さんのように > 先進国→医療や食生活がゆたか→長生き。と言うのが真相で信頼性がある気がします。 と考えていくことが、つまり原因と結果との関係を正しく見抜いてデータを解釈していくことが、科学的な統計分析のやり方だと思います。 元になるデータ(数字)が正しくても、因果関係の考え方や解釈のしかたを間違える(あるいはわざとゴマかす)と、間違った結論に至ることは、ありがちなことです。 例えば、以前文部省のホームページに「朝食をきちんと食べる子は学校の成績も良い子が多い。きちんと朝ご飯を食べましょう」と調査データ入りで載っていましたが、これが小中学校では「朝ご飯を食べると子供の成績が上がる」と伝わって来まして、私などはPTAで「それは違うでしょ」と保護者同士で話し合ったものでした。 言うまでも無いことですが、これは「朝ご飯をきちんと食べる生活習慣が身についている子は宿題など家での勉強もちゃんとやるので成績も上がる」と解釈すべきで、大事なのは朝ご飯を食べるかどうかよりも(それも含めて)生活習慣をつけることなのだ、と言う結論になるべきです。 話がそれましたが、ご興味があるなら 「統計でウソをつく法」(ダレル・ハフ著、高木秀玄訳)講談社ブルーバックス http://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E3%81%A7%E3%82%A6%E3%82%BD%E3%82%92%E3%81%A4%E3%81%8F%E6%B3%95-%E3%83%96%E3%83%AB%E3%83%BC%E3%83%90%E3%83%83%E3%82%AF%E3%82%B9-%E3%83%80%E3%83%AC%E3%83%AB%E3%83%BB%E3%83%8F%E3%83%95/dp/4061177206/ref=pd_sim_b_4 が参考になると思います。
- sphenis
- ベストアンサー率50% (50/100)
「野球をすると長生きする」 この仮定に対しきちんとした調査をしようと思うなら、まず野球をする人の寿命としない人の寿命、それぞれの十分な量のデータが必要です。 サンプルの数が少なければ、それは科学的に信頼性のあるデータとはなり得ません。 また、全員を調べる訳にはいきませんから、サンプルの抽出も完全にランダムである必要があります。 つまり、男でも女でも、裕福でも貧乏でも、またどんな職業の人でもどこの国籍の人でも、「えこひいきなし」のデータの集め方をしなくてはなりません。(どの人を調べるか「選り好み」しては駄目という事です) これらは、統計学的に重要な事柄の基本です。 サンプルとして抽出した人達の寿命を「野球をする人」「しない人」それぞれについて平均し、その差に意味があるか調べます。 差が小さすぎるなら、その差は「偶然」である可能性がありますから…。(きちんとした検定の仕方がありますが、長くなるので省略します) より厳密にやろうとするなら「いつ」「どの程度」野球をしたのか(例えば、中高の部活で6年間、退職後地域のスポーツクラブで週一回3年間、等)という事まで考慮すべきでしょうが…まあそれは置いておきます。 しかし、データに意味がある事が分かっても、確実に言えるのは「野球をすると長生きする」可能性がある、という事だけです。 単純な事を調べるなら良いのですが、この様な様々な原因が考えられる問題に関しては、データを集めて平均を出しただけで結論を出すのは早計というものでしょう。 例えば、野球をする人はある食べ物が好きな傾向があって、長生きはその食べ物のお陰かもしれません。 ある一つの事柄について突き詰めて検証しようとするならば、様々な角度からのアプローチが不可欠です。 しかし、実際に「野球をすると長生きする」のかもしれませんから、ある一つの結論について「その可能性は高いかもしれないが、そうでない可能性も考えられる」という考え方を頭に少しでも置いておく、『鵜呑みにはしない』姿勢が大切なのではないでしょうか。
- dsdna
- ベストアンサー率24% (308/1281)
>そのデータが本当に信頼できるかどうか科学の世界ではどのように評価するのですか。 再現性を確認したりとか客観性を判断したりとか検定を行ってみたりとかして評価します。 あなたの質問文にある「●●したひとの95%は■である」はデータと思われますが「「野球をすると長生きする」は結論だと思われます。結論はデータではありませんので、混同しないよう、留意してください。
お礼
すばらしい。相関と因果の違いためになりました。牛乳の普及と癌の発生が同じように起きていたということですね。