• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:pearsonの相関の計算の不適切さ(統計学))

pearsonの相関の計算の不適切さ(統計学)

このQ&Aのポイント
  • pearsonの相関計算についての説明と、この質問文における結果の解釈について解説します。
  • ポアソン分布について説明し、統計学と生命科学の関係について触れます。
  • 10匹の実験動物のデータに基づいて、pearsonの相関の計算方法と不適切さについて詳しく解説します。

質問者が選んだベストアンサー

  • ベストアンサー
  • trytobe
  • ベストアンサー率36% (3457/9591)
回答No.1

9個のデータは、活性が1~2付近の桁で取られているのに、最後の1個のデータが10と桁違いのデータが入っているので、相関係数を取るときに最後の10のデータ(プロット)にフィッティングするように計算されてしまい、9個のデータが固まってる1~2付近の点と、1個のデータがある10の点を結ぶような直線として近似され、数値的には相関係数r=0.991という正の相関があるようなことになってしまっているのです。 実際は、9個のデータを見ると、酵素Aの活性と酵素Bの活性にほとんど相関関係はないので、 ・ pearsonの相関を計算するならば、データ1~9までで計算すべき(離れた数値は除外すべき) ・ そうすると、データ1~9では相関がほとんど見られないはずなので、相関で議論せず、データのプロットだけをして、平均値や標準偏差という統計値のみを記すべき という2つの解析のおける見直すべき点があるかと思います。(後者は自信がありません)

ligase
質問者

お礼

とてもわかりやすいご説明ありがとうございます。 あと意図していることが無知な私でもわかりやすいように説明くださり本当に嬉しく存じます。

その他の回答 (1)

noname#227064
noname#227064
回答No.2

#1さんの回答に付け加えさせてもらうと、一つ目は10番目のデータを恣意的に外すのは良くないということです。 このデータを除外するには、その実験の手順やデータの誤記等がないかを再確認します。 問題が見つかったデータは問答無用で外します。 そうでなければ、外れ値の検定を行い外していいかどうかを検討します。 二つ目は、そもそもデータを外す必要のないノンパラメトリック検定を使うことです。 今回の場合なら、スピアマン又はケンドールの順位相関係数を使えば良いでしょう。 ちなみに、平均値も標準偏差も外れ値に影響を受けやすいので、これだけで解析するのはお勧めできません。

関連するQ&A