• 締切済み

スピアマンの順位相関係数について教えてください

論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

みんなの回答

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.3

> retrospectiveにみてどのような相関/有意差がある/なしを知り それならば検定や有意差にこだわる必要はないはずです.自分さえ納得すれば良いので. > 「身長が高いほど体のだるさが出やすい」 と仮定した場合どんな統計処理を まずやってみるのは,横軸に身長,縦軸にだるさをとって散布図を描くことです.それで相関がありそうなら,直線回帰をやってみる. > 身長を3群から4群に分けて「身長が何センチから何センチまでの人がだるくなりやすい」ということを証明するには > randomized controlled studyのように前向きなものではなく Randomization を考慮した実験でないなら,「証明」は難しいでしょう.

kos1005
質問者

お礼

さらにありがとうございます Retrospectiveにみて自分が納得しても、相関/有意差がでないことを今後やっても無意味な気がしますが。 散布図書いてみます。 なるほどRandomization を考慮し今後に新たに考えてみたいと思います。

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.2

> どんな統計処理を 統計処理以前の,実験計画の問題だと思います.どういう意思決定をするために,どんなモデルを立てるのか.そのパラメタを効率よく推定するためには,どんな実験をするか.ここをきっちり考えないで「データがあるから検定してみた」では何も出なくてあたりまえで,何か出ても信用はされません.大概は randomization すら考慮されていないからです. > 今後も同じような実験をする ということでしたら,細かい手法がどうこうよりも,着想から論文採択に至るまでの workflow http://ja.wikipedia.org/wiki/ワークフロー 整備を勧めます.数をこなさないとうまくならないし,研究者の評価も現状では残念ながら内容よりも数ですから.特に時間を争う場面では workflow の良し悪しで勝負がつきます. 普通は着想,実験計画,提案,資金調達,実験,解析,資金源への報告,学会発表,論文というように進みます.この全体を能率よく進める環境を整備しておきます.単独でやることは稀なので,共同しやすいことが重要です. 文書は LaTeX が標準です.統計関係はいろんな派閥があるのですけど,私は R http://ja.wikipedia.org/wiki/R言語 を薦めます.実験計画段階から論文作成までを通して R を使います."desing of experiments", R で検索すれば,実験計画関連の文献はたくさんあります.英語は避けて通れません.

kos1005
質問者

お礼

ありがとうございました。 その理念はよく理解できます。 有意差を出すために研究であれば、その答えに一喜一憂するかもしれません。 しかし、私が現材取り組んでいるの randomized controlled studyのように前向きなものではなく、ごく日常的な業務の中にある疑問をもってそれがretrospectiveにみてどのような相関/有意差がある/なしを知り、どう対処するかを考えるようなものです。科(化)学的・工学的なものではありません。 ネットの場でなく実際に統計を一から勉強してみます。 色々ありがとうございました。

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.1

> 検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 順位相関は nonparametric と呼ばれる手法のひとつです.一般論は http://ja.wikipedia.org/wiki/ノンパラメトリック手法 より: --- ノンパラメトリック検定は、対応するパラメトリック検定(もし前提条件が満たされていれば)と比べて「パワー」が弱い。つまりパラメトリック検定と同じ「信頼」を得ようとした場合、ノンパラメトリック手法ではより多くの標本数を要することになる。 --- ですから parametric 検定で有意差が出ないから nonparametric でやってみようというのは,大概はむだです. 「高価な実験をしたんだけど有意差が出ない.これじゃ報告できないから,何とか有意差を出してくれ」という相談はよく受けますけど,ほとんどの場合,手遅れです.実験計画時に「有意差が出なかったら」を考えておかないと. 可能性があるとしたら,仮説検定でなくモデル同定の枠組みに持込むことだろうと思います.「身長はだるさに無関係」という帰無仮説に対応するモデルと「身長はだるさにこれこれの関係がある」という特定の対立仮説を立てて,後者の方が観測値を説明するモデルとしてはより適切だ,と言おうとするわけです.対立仮説が「無関係とは言えない」ではなく「これこれの具体的な関係がある」となっていることが重要です.検定が有意でなくてもここまでなら言えることが(たまには)あります. ただ,モデル同定の話は初歩の教科書には出てきませんから,初心者には難しいでしょう.標本も,かなりいります.

kos1005
質問者

お礼

非常にわかりやすく説明いただきありがとうございました。 造詣が深い方にとおみうけいたしますので、もう一つ質問させて下さい。 (同じ質問になってたらすいません) この条件で 「身長が高いほど体のだるさが出やすい」 と仮定した場合どんな統計処理を行えばよろしいでしょうか? 今後も同じような実験をすると思いますのでお願いします。 申し訳ないですがもう一つ 身長を3群から4群に分けて「身長が何センチから何センチまでの人がだるくなりやすい」ということを証明するにはどのような統計処理が必要でしょうか。 統計を少しでも基礎から勉強しろというお叱りの言葉が聞こえてきそうですが、お願いいたします。