- ベストアンサー
最適な分析方法は?
様々な気象要素(量的)の値から、量的なある事例数及び事例の有無を予測するための統計学的手法について、どなたか教えていただけないでしょうか? 統計学の素人で、主にエクセルしか手元にありません。 求めたい事項は、 (1)事例(及び事例数)に対してどのような要素を説明変数とすべきか? (2)どのような手法で分析をすべきか です。 漠然と重回帰分析で、危険度から順に削除していく方法かなと思っていますが、ある方からロジスティック回帰分析が良いのではといわれました。ロジスティック回帰分析については知識がないため良く分かりません。 まとまりがない質問で申し訳ありませんがよろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
質問の内容が漠然としすぎている気がします。 求めたい事項に関しては、事例が分からないと、説明変数を決めることが出来ません。明日の降水量を予測するのに、株価を使ってもほとんど意味がないですしね。また、分析手法も解析する対象によって様々です。 ですが、量的な気象要素の値から、事例の有無を予測する統計的手法については、確かにロジスティック回帰分析がよさそうです。 ロジスティック回帰分析を使うと、量的な説明変数から、質的な事例の確率を解析できるからです。例えば、東京の気圧がいくらの場合、雨が降る確率はいくらか、ということが解析できます。 このあたりの具体的な解析手段は、様々な書籍やネット上でも閲覧できるので、そちらを参考にしてください。個人的には、「自然科学の統計学」(東京大学出版会)が、最初に勉強するには良かったと感じています。 ただし、統計学を利用して結果を解析した後は、その結果が本当に正しいものかどうか検討をよろしくお願いします。たまに、単に闇雲に行った統計解析を見ることがあります。まあ、これは蛇足かもしれません。
その他の回答 (2)
- kgu-2
- ベストアンサー率49% (787/1592)
No2です。事情が分りました、失礼な表現はご容赦を。 というのも、重回帰、ロジスティクなど統計学では上級者の単語がでてくるが、(1)と(2)のような初心者のご質問で、『学生が、卒論に困って…』を推測しましたので。 偉そうに書きましたが、私も初心者です。私の例が参考になるかどうか。 推計学のテストは、白紙状態。仕事上、最初に必要だったのは、標準偏差の計算。目的は理解できていませんでしたが、動物相手の実験なので、平均と標準偏差を計算せねばなりませんでした。40年近くも前のこと。ナショナルの電卓に、標準偏差の計算機能があり、給与が8万円の時に、13000円ほどだったと記憶しています。 次が、t検定。有意差を見つける、というやつ。これもとにかく、計算するだけ。そのうち、なんとなくわかるように。たとえば、2つの群は3匹以上必要、3つの群は対象外などが。3群以上は、t検定では無理で、流行りの多重比較。私には理解不能なのでしません。どうするか。t検定でできるように、工夫しています。 以上、統計につまづく人が多い検定は、習うより慣れろ。しかも、今では計算はパソコンがやってくれるので、それほど難しくはない。 回帰分析と相関分析は、世間ではごちゃまてぜになっていますが、区別した方が分かりやすいと思います。区別していないと、右上がりの株価などに騙されます。 手順は、まさに書き込まれた(1)(2)です。(1)がポイントで、研究では、アイデアと言われます。これが分かれば、あとはマニュアルどおり。そのポイントの(1)をご質問されれたので、失礼な書き込みをしました。というのも、アイデアは研究者の命。それをくれ、というのは、「現金をくれ」と等しいからです。ここまではやったが、何かアドバイス、ならまだ許せますが。 身長と体重の関係など、分りやすい(直線回帰ではないので注意)ものからご経験をつまれ、慣れてください。 相関分析や回帰分析は、面白いのです。 私の最初は、「平均寿命は、経済で決まる」。これを学術雑誌に投稿しました。先に発表ががあるなら納得できますが、「科学的でない」と拒否されました(私の知る限りでは、プレストンが最初。プレストンは対数回帰、私は直線回帰。そうなると説明が違ってくる)。それでは、何で決まるのでしょうか。まさか、神か仏。そうすると、信心の薄い日本人の平均寿命が世界で一番長いことと矛盾しますが。
お礼
回帰分析は奥がふかそうと感じました。 無理せず楽しみながら(前向きに)経験をつんでいきたいと思います。 貴重なアドバイスをありがとうございました。
- kgu-2
- ベストアンサー率49% (787/1592)
>まとまりがない質問 (1)と(2)がわかっていれば、学術論文のデータがでます。あとは論文を書くだけ。どのようなお立場か知りませんが、まとまりではなく、●投げで『節操が無い』というのが、感想。 『研究するのに、どうしたら良いかわからない、アイデアと方法を頂戴」というのに等しい。アイデアをもらいましたは、指導者に失礼です。方法を教えてもらえば、学術論文だと、謝辞を記述するのは最低のマナー。そんな配慮が少しもない書き込みを多数見ますが。 というのは、(1)が分かれば、あとは解析をするだけ。相関分析と回帰分析を知っていれば、誰でもできるから。単なる趣味なのか研究なのか、その場合指導者がいるのかいないのか、まず書きこんで下さい。 簡単にできそうなので、『やってみようか』という気になっています。もっとも、交通事故なら警察に行けば、データはありそうですが。 >(2)どのような手法で分析をすべきか 相関分析や回帰分析の最も困難な点は、結果はパソコンで簡単にだせますが、結果の解釈です。結果の説明については、学術論文でも誤りのものをいつくも指摘できます。単回帰分析で、擬相関をクリアできるようになってから、重回帰分析にアップされることをお勧めします。擬相関をクリアできれば、重回帰の多重共線性の問題をクリアできるかも。 この場合、事故数に限界が無いので、ロジスティクは不適だと判断します。それとも最大は100%などの限界があるのでしょうか。また、アドインソフトにはあるかもしれませんが、市販のオフイスにはロジスティク曲線は入っていないと思います。
お礼
●投げで『節操が無い』というご指摘。はずかしい限りです。 統計に興味を持ち、勉強をしてみたいと思ったのがきっかけで、とりあえず、身近な例題から取り組もうとしました。その矢先にロジスティック回帰分析なる言葉を聞いたので、整理をつけずに質問をしてしまいました。 自分の考え方のレベルの低さに対して情けなく思い、反省しています。失礼な質問をしてご迷惑をおかけしました。今後気をつけます。 今の段階では、擬相関の理解度など、まずは基本的なことを十分勉強する事が先決だと実感しました。 市販のオフイスの情報に感謝いたします。
お礼
質問の内容が漠然としすぎて申し訳ありませんでした。 まずは、「自然科学の統計学」(東京大学出版会)を購入し勉強することにしました。 ご指摘いただいた注意点は肝に銘じておきたいと思います。