• ベストアンサー

回帰分析って何ですか?

卒論で結果を出すために回帰分析というものをやらなくてはいけないらしいのですが、調べてもバリバリ文系の私には難しすぎてさっぱり理解不能です。 どなたか、回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.12

>最後にもう一度アドバイスを テーマとしてはなかなか面白いと思いますし,社会的な意義もある研究ですね。どこかの官庁がやっているかもしれませんが。ただ,当初の質問の趣旨と随分外れているようですから,一度閉めて,再質問をされた方が良いのでは?

gunform
質問者

お礼

今まで私の稚拙な質問に付き合って頂きありがとうございます。 私なりにどうにか回帰分析を理解し、どうにか本日OKをもらいました。 本当にありがというございました!!

その他の回答 (11)

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.11

質問事項とは,ずれてきていますが,せっかくですので。 >「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」 正直,私には意味が分かりません。というのは,普通に考えて 総捕獲数=殺処分頭数+(返還数+譲渡数)ですよね。割合に直せば 殺処分頭数+(返還数+譲渡数)=1 ではないのですか?  まぁ,指導教官が回帰分析をやれと言っている以上,これ以外の何事かを分析する必要があるのでしょう。推測は付きます。おそらく,相関行列から因子分析をして,都道府県の傾向をグルーピングしろ,という意味でしょう。 ただ,ここまでやるなら,Excelで分析するのは止めた方が良いです。かなりExcelと統計解析に精通していないと,分析ができませんよ。別販売のアドオンソフトを購入するか,SPSS,Rなどきちんとした統計解析ソフトを利用すべきです。

gunform
質問者

お礼

すみません、間違えました。 各都道府県の犬の殺処分率や殺処分頭数 と 犬の予防注射率や不妊去勢手術率 との関係を明らかにする事 です。 大変厚かましいとは存じますが最後にもう一度アドバイスを頂けませんでしょうか?

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.10

#9補足(笑)ね。 あなたがどのような実験(調査)をやったのかが分かれば,もう少し詳しい話もできるのですが,#9の説明はあくまでも説明変数(結果に影響を与える要因)が1つの場合です。 例えば,気温とビヤホールの売り上げ(来客数),なんていう有名な調査があります。気温が上がれば,来客数(ビヤホールの売り上げ)は伸びるのか?,これがつまり相関の有無です。ここまでの結論を出すために,回帰分析を使う馬鹿はいません。 ともかく,単純に気温と来客数をプロットして相関係数を調べればそれで済む。ピアソンでもスピアマンでもやればいい。データ数が少なければスピアマンかケンドールでしょう。「なるほど,気温が上がるほど,来客数は伸びるんだなぁ」と分かります。 知りたいのはその先。「じゃ,今日の予想気温が31度だけど,どのくらい客が来るか,どのくらいビールを仕入れておけばいいか?」ですよね。これを知るための分析が回帰分析です。ここで,来客数(y)と気温(x)の関係が y=2500+0.3x-93(もちろん式は適当) だったら,2500人の来客があるわけだから,それくらいのビールを仕入れておこう,という話になるわけです。 (この式ではマイナスは出ませんが,実際にはyがマイナスになる場合もあります。つまり,その気温になったらビヤホールを開いていても売り上げが上がらない,という意味になりますから,いつ店を閉めたら良いかの目安を示すことになります) ところが,ビヤホールの来客数というのは,単純に気温だけが要因ではありません。湿度や天気(雨か晴か),曜日,給料日直前・直後など,売り上げを左右する要因は他にもあるでしょう。こうした複数の要因をまとめて分析するためには,「重回帰分析」という手法が必要です。マーケティングだと共分散分析かな? さらに,それぞれの要因がどの程度寄与しているのか,という寄与率の問題も検討する必要があります。 そこで冒頭の話に戻るのです。あなたの実験(調査)が説明変数1つならそれで良いですが,複数の要因があるなら単回帰分析をやっておしまいというわけにはいかないですよ。

gunform
質問者

お礼

さらに詳しい回答ありがとうございます。 私がこれからやるのは、「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」です。 もし何かアドバイスを頂けたら助かります。

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.9

どうしようかなぁと思ったのですが,若干不正確な説明がされているようなので補足。 ○回帰分析とはどのようなものか 回帰分析は直接的には,相関関係を調べるものではありませんよ。その次のステップです。相関だけだったら,相関係数を求めて,p値を確認すれば終わりです。 回帰分析は,その次,結果となる変数の動きが原因となるデータによってどの程度・どのように説明できるかを分析するものです。 事例として,他の方が身長と体重の話を出してくれていますので,それを使います。例えば,大学4年生100人の身長と体重を調べた結果, 1.身長(y)と体重(x)のデータが集まります。 2.このxとyについて,有意な相関が見られるかどうかを調べます。 (ここが,相関を調べるということ) その方法として,例えば散布図を書くなどの手法がありますが,別に散布図を書かなくたって,相関は調べられますから,必須ではありません。相関係数の求め方とp値の意味については質問から外れますから,書きません。 ここで,相関関係が見られなければ,それでおしまい。回帰分析をする必要なんか,全くありません。やったって意味がない。 相関係数の意味とは,【どの程度の】関係があるか,という強さ(量)です。 3.で,仮に相関関係が有った場合に,【どのような】相関なのかを明らかにするのが,回帰分析の意味です。 分かりますか? 【どの程度の関係】という強さ(量)を調べるのが相関係数,【どのような関係】という質を調べるのが回帰分析,2つは全く違う話です。 具体的には,例えば単回帰式を書きます。 y=a+bx+cというような式ですね。これは,一次関数となり,実際には散布図上の直線になります。先ほどの身長(y)と体重(x)の間に, y=100+0.7x+20.5という式が出たとしましょう(式は適当です)。 この式の意味は,直接的には「大学4年生の身長と体重の関係は,この式で表現できる」ということです。体重70kgの学生の身長は,式に当てはめることによって169.5cm程度だと予想することができる,ことになります。 つまり,回帰式を書く(回帰分析をする)ことによって,大学4年生の体重から,身長を予想することができるようになるのです。 実際には,この後にF検定をして,この式の妥当性(あてはまりの程度)を調べなければなりません。その際に,R二乗値・等分散性・残差分析などについての知識が無ければ歯が立たないでしょう。 その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。

gunform
質問者

お礼

親身なアドバイス、痛み入ります。 >その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。 もう時間がないのでそうしたいと思います。 ありがとうございました。

noname#120967
noname#120967
回答No.8

No.5つづきです。 回帰分析の「やり方」については、他の方が説明されているので、 回帰分析の「意味」というか、「何に使うか」をちょっと説明しておきますね。 先に高校のクラスの「身長と体重」の例を出しましたが、普通、両者には正比例のような関係があることがわかりますよね。 もう少し正確に言うと「相関関係」というんですが、この相関関係を探るための手法が回帰分析とお考えください。 もっとも、「関係を調べたら右上がりになった」というだけじゃ不十分です。 とうのは、「分布がどの程度右上がりか」という要素の他に、「分布がどの程度密集しているか」と言う要素もあるからです。 つまり、一つ一つの点が密集していれば「相関が強い」ことになるし、けっこうバラバラで、 身長が低いのに体重がある人が多かったり、高いのに軽い人が多かったりすれば「相関が弱い」ことになります。 まあ、身長と体重は相関関係が強いほうなんでしょうが、 たとえば、「学生の偏差値」と「その親の高校時代の偏差値」はどうなんでしょうね。 多少はあるんでしょうが、強い相関なのかどうか・・・。 また、「親の所得」と「子どもの偏差値」なんていうとどうなんでしょうね?あるとも言われてますが、実際調べたらどの程度の相関の強さなのか。 関係がかなり強ければ、所得の低い親を持った子は絶望的な気持ちになるでしょうし、 関係が弱ければ、いちおう右上がりの関係があっても、「例外も多いからねえ」ということで救われますね。 まあ、そういったいろいろな数字の関係を調べるのに使うのが回帰分析だと考えておけばさしあたりは大丈夫だと思います。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.7

>回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?  何度か同じような質問に回答しています。計算はエクセルで簡単。 卒論なら、指導教授に訊く だめなら、その理由を書き、3日待つ 旅先から帰って、理由をかいてあれば、教える。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.6

No.2の回答者です。 3点補足しておきますね。 1. 「回帰」のことを「最小二乗法」とも言います。 (最小自乗法ともいう) 調べ物をするときのキーワードとして覚えておくとよいですよ。 (厳密に言えば違うのですが、世の中で行われている回帰は、ほぼ100%最小二乗法です。) 2. エクセルにおいてグラフを作るとき、 グラフの種類は、折れ線グラフや棒グラフではなく「散布図」を洗濯します。 これを知らないがために最初戸惑う人が多いので、覚えておくとよいでしょう。 3. 実際の手順やグラフの例が書かれたサイトを見つけましたので、参考にしてください。 エクセルを利用した例 その1 http://szksrv.isc.chubu.ac.jp/lms/lms2.html エクセルを利用した例 その2 http://homepage1.nifty.com/gfk/sohkan-keisuu.htm 右上に四次関数のグラフに回帰した例があります。 http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%97%E6%B3%95 以上、ご参考になれば幸いです。

gunform
質問者

お礼

エクセルを利用した例のリンクを貼り付けて頂きありがとうございます! 実際に自分でやるときに大いに参考にさせて頂きます。

noname#120967
noname#120967
回答No.5

高校のクラスに男女合わせて30人の生徒がいる。 30人の平均体重を出したら55kgだった。 その場合、身長が180m、体重が65kgの生徒をつかまえて、 「あなた平均を10kgも超えてるから太りすぎ」と言うのは無意味ですね。 身長に応じた平均体重といったものを出す必要がありますから。 で、グラフ用紙に、ヨコ軸に身長、タテ軸に体重をとって、 一人ひとりの値をプロットしていくと、普通は右上がりの分布になりますね。 その分布の真ん中に右上がりの線が引けるような式を見つけるわけです。 大雑把に言えば、それが回帰分析です。 http://gucchi24.hp.infoseek.co.jp/MRA1.htm このサイトがわかりやすいかも。

gunform
質問者

お礼

わかりやすい例題ありがとうございます! 少しだけ理解できた気がします。

回答No.4

分析自体はエクセルで簡単にできます。数値を選択して,ビスタならタブのデーターの中のデーター分析を選択し,回帰分析を選択します。もしかしたら回帰分析が入っていない事があるので,その時はアドインで追加すれば大丈夫です。 経済学部であれば,高校の数学Cの教科書,新世社の統計学入門が参考書になります。エクセルで出した結果を,参考書と参照しながら学習されれば良いと思います。

gunform
質問者

お礼

詳しい解説をありがとうございます。全部が全部自分でやらなくてもいいのですね!少し救われた気持ちになりました!

  • owata-www
  • ベストアンサー率33% (645/1954)
回答No.3

#1ですが、補足として変数が2つ(つまりXとYしかない)の場合、一番手っ取り早いのは、Excelで横軸にX、縦軸にYの散布図を描いて近似曲線を引く方法です。(正直これだけやっておけばOKだと思います)

gunform
質問者

お礼

回答ありがとうございます。これから勉強してみます。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こんにちは。 統計や理科の実験をした結果を、方眼紙で点を打ったとき、 だいたい直線のようになることがありますよね。 そして、目で見た感じで、データにだいたい合うように直線を引きますよね。 すると、 見た感じで引くので、人によって直線の引き方が変わってしまうわけです。 その直線、すなわち、一次関数 y = ax + b のaとbを、全データの値から数学的に計算することを回帰分析と言います。 そして、xとyに、どれだけの相関があるか(引いた線に意味があるかどうか)を表す数値や、 各点がどれだけ直線から遠いか、近いかを表す数値(標準偏差のようなもの)も、 回帰分析の中の一つの結果として求まります。 なお、 通常、「回帰分析」という言葉は、上記のように一次関数に当てはめることを指す場合が多いですが 二次以上の関数への回帰も可能です。 (たとえば、四次関数 y = ax^4 + bx^3 + cx^2 + dx + e  とか) も同様のことができます。 以上のことは、エクセルなどの表計算ソフトで、超簡単にできます。 データを表にして、それをグラフにして、グラフの画面で「近似曲線の追加」の操作をするだけです。 便利な時代になりました。 私は、昔、自分で曲線近似のマクロを自作していました。 また、一つの現象に対して2つ以上の因子が関わっている場合も、回帰ができます。 これを「重回帰」と言います。 たとえば、3つの因子x、y、zがあるときは、 w = ax + by + cz + d です。 以上、ご参考になりましたら。

gunform
質問者

お礼

回答ありがとうございます。まだチンプンカンプンですが… これから頑張って勉強します。

関連するQ&A