- ベストアンサー
エクセル統計での単変量解析の仕方
- エクセル統計(2010)での単変量解析の仕方を教えていただきたくメールしています。
- エクセル統計2010を使用した場合、単変量解析のやり方を教えていただければ幸いです。各調査項目に関してハザード比、95%CI、検定結果(p値)として標記したいと思っています。
- 多変量解析をする前に、患者背景の雑多な因子を単変量解析にて検討して多重共線性を解析した上でCox比例ハザードモデルで多変量解析したいと考えています。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
ご質問の内容から、30歳くらいの医師もしくは薬剤師の「ご研究」で、この解析結果を学会等でご発表すると推察します。それだと、これ以上の回答は、研究者の倫理に反します。 発表会場から、「その方法は間違っている」と指摘され、「このようにすれば教えて貰った」と返答した時に「誰から」と問われても返答できません。間違っている、と指摘するのが私かもしれません。 発表などが、連名でなく、お一人での研究なら、倫理違反ではないのですが。他の方の回答が無いのは、回答することその行為自体が研究者としての倫理に反する危惧があるかも。というわけで、昔の私の状態を思い出すので、他人事とも思えないので、以下独り言。 まず、統計は、自分の理解できる範囲でしかやりません。多変量解析は、理解不能なのでしません。それで困ったことはありません。 相関分析は、超有名大学の教員が「医学のあゆみ」に投稿した論文を「間違い」と指摘できます。なぜなら、散布図に二本の直線を引いてるからです。もちろんその説明はありません。多変量解析は、「有意差あり」とは書いてあっても、なぜそんな関係になるのか、は述べていないものがほとんどです。その理由が科学であって、記述が無いのはドキュメントにすぎません。というわけで、私は、背伸びをしません。 >「有意水準0.1として単変量解析を行い、独立変数同士の多重共線性を検討した。Cramerの独立変数0.8以上で有意水準0.05未満の場合、一方の変数を削除した。」 統計は、難しいので真似から始めました。真似るのは賛成ですが、理解できていないものを真似ても役には立ちません。学会で質問されると、立ち往生。 上記の文は、私は理解できません。私なら、「多重共線性を回避するため、独立変数同士の単回帰分析と相関分析を行い、相関係数が0.1以上のものは、一方の変数を除いた」と書きます。 目的から、いきなり多変量解析は必要ないのでは。例えば、効果が男女であるかどうかは、私ならχ2乗検定をします。 ただ、実験動物なら、雄と雌の条件を揃えることができるでしょう。が、人の場合は、年齢、体重、既往歴、年収、などなどを同一にするのが困難なので、「A群とB群に差は無い」とする帰無仮説が成立するのか、この出発点が不安です。 不安ついでに、エクセルては、単回帰分析はできても、重回帰分析はできません(そのハズ)。アドインソフトをお持ちでしょうか。
その他の回答 (1)
- kgu-2
- ベストアンサー率49% (787/1592)
他のソフトを使った方が良いと思いますが。 私は、以下の手順で(2007だと分かりやすかったの手すが、他にスッキリがあるのかも) 1)散布図を描く 2)グラフ上のマーカーを右クリック、近似式の表示を選択 3)ウインドの中から回帰式の種類を選択 4)下の方の近似式とR-2のボックスをチェック 5)R-2の値から、統計学の教科書で有意差判定(これは、エクセルでもできるらしい) 分からなければ、どの段階か書き込んで下さい。 >各調査項目に関してハザード比、95%CI、 これは、相関分析とは、無関係では また、多重共線性の解決の定説は知りません。確立されているのでしょうか。それと、多変量解析では、因子を並列です。しかし、現実社会では、上下関関係もあります。例えば、所得と新聞購読なら、所得が原因で新聞は結果。しかし、GNPとエネルギー消費量なら、どちらが原因でしょうか。 因子の関係が、並列なのか、上下関係にあるのか塾慮されないと、多変量解析はドツボに入ります。初心者と言いながら、いきなり多変量解析に行く人を読んで『ナント大胆な』と感心を通りこして呆れています。質問者は、慎重なので好意をもち、書きこみました。 相関分析は、結果の解釈を専門家でも間違っています。論文でも『これは』というものを指摘できます。結果がでても、もういちど冷静な判断が必要かも。
お礼
ありがとうございます。お礼が遅くなりすみません。 多変量解析や単変量解析というものに関してほとんど知識もなくやっていたので、ご指摘いただいた文章の意味があまり飲み込めず、いろいろと思案している間に時間を取ってしまいました。 性別、喫煙歴などの患者背景因子を説明変数として治療効果(ある薬剤の投与後疾患の増悪までの期間;日数)を従属変数として単変量解析をしたいと思っています。その方法がご指摘いただいた 散布図を描く・・・の方法でよいということでしょうか? 散布図を描こうにも横軸がカテゴリーデータのため散布図にならない気がします。 重回帰分析のところから、性別、治療効果(ある薬剤の投与後疾患の増悪までの期間;日数)データを用いて(説明変数を1個で)解析するというのは誤りでしょうか? そもそも疾患増悪というイベントの有無を従属変数にすべきなのか(エクセル上では0 or 1)、疾患の増悪までの期間;日数という連続変数を従属変数にすべきなのかなど、基本的なところでの混乱が解消されません。 (2)各調査項目に関してハザード比、95%CI、 これは、相関分析とは、無関係では →に関してですが、類似の文献を見ますと単変量解析の結果にもハザード比、95%CIが書かれており、さらにp値も記載があります。「有意水準0.1として単変量解析を行い、独立変数同士の多重共線性を検討した。Cramerの独立変数0.8以上で有意水準0.05未満の場合、一方の変数を削除した。」というのが文献に詳細に書かれている単変量解析の方法です。その後有意差が得られたものをCox比例ハザードモデルにて解析したとなっています。 すでにカプランマイヤー曲線を書いてLog rank testにて薬剤併用群と非併用群で差はないという統計上の結果は出ていますが、後ろ向き研究なので、背景因子の交絡を少しでも考慮するべく多変量解析をどうしても行って詳細を見たいと思っている次第です。 不明な点がありすぎて質問自体もわかりづらい点があるかと思いますが何卒ご教示いただければ幸いです。
お礼
早速のご返答ありがとうございます。 ご指摘のとおり自分できちんと理解できる範囲での統計を用いるべきと思いました。統計の原理そのものを理解できないまでも、少なくともどういう理由でその解析方法を用いたのかということについては明確に説明ができる状態で初めて発表に移せると思います。 後ろ向き研究の難しさを最近ひしひしと感じている次第です。ただ、相談できる(統計を理解していて教えてくれる人)人がいないことも事実で、やむを得ず質問させていただいたという経緯もございます。 ちなみにアドインソフト(エクセル統計)は持っていますので、現在それで解析をしていたところです。 ご面倒をおかけいたしました。いろいろと再度本を読んでみて理解した上で最終的に多変量解析などしてみるかどうかを検討したいと思います。