• ベストアンサー

信頼区間の意味

気になってしまって、明確な答えを探し出すことができなかったので質問します。 単回帰分析などを行ったとき、信頼区間といって双曲線を画くグラフを書くと思います。 双曲線を画くのは、母回帰の中心を支点として回帰線がばらつく範囲を示していると理解しました。 まず、これはあっているでしょうか? その次に、なぜ中心のデータに重きを置いて考えるのかという意味を教えていただきたいと思います。 正規分布・X軸Y軸それぞれの平均を通る直線である ということが関係しているのかなと自分ではおぼろげながら思っています。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

第1のご質問について 「合っている」と言うべきでしょうが、信頼区間というものの本質を理解することが必要です。 真実は永久に闇の中です。しかし、ある回帰線を引いて「もしこれが真実の線であれば、このような現実のデータが出てくる確率はx%しかない」ということは言えます。xが5であるような回帰線を無数に引くと、それらは、ある双曲線に接します。 「回帰線がばらつく」という表現は、推計学では、厳密には正しくありません。この範囲であれば危険率が5%以内である、と言います。これを裏返して「95%の信頼区間」とも言います。 第2のご質問について 「不偏推定」の意味にかかわることです。あるクラスの英語の成績が平均70点であったとし、それ以外に何らのデータもないとします。このクラスの真実の平均は闇の中ですが、「75点であろう」と推定するのは無茶です。同様に「65点だ」も根拠がありません。ほかにデータがなければ「70点であろう」とするよりほかに方法がありません。これが不偏推定です。信頼区間を示す双曲線の中心がデータの中心にくるのは「ほかに方法がない」からです。もちろん面倒な証明もあるにはありますが、数学を道具として使う立場から見れば、上記のような常識で十分です。

sanarin
質問者

お礼

ご回答いただきありがとうございます。 統計学などさっぱりやったことがなく、統計の知識もなく多変量解析を始めてしまい、そこらじゅうで壁にぶち当たってしまいます。 「推計学」と言うお言葉も初めて耳にしました。 勉強不足を反省します。 教えていただいた「不偏推定」について学習しながら、意味を読み解いていこうと思います。 数学が苦手なので、使うだけの立場なのですが、どうしても「なんで!?」「どうしてそんなことがいえるの!?」が気になる部分が多く、自分でも・・・と思っています。 これからも質問させていただくと思いますが、その時もどうぞよろしくお願いいたします。 ありがとうございました。

その他の回答 (1)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 データ (x[i],y[i])に対して、モデル y=ax +b を当てはめる。このとき、残差を ε[i] = y[i] - (a x[i] + b) とし、残差二乗和 E(a,b) = Σ(ε[i] ^2) を極小にするという条件でa,bを決めたのが回帰直線でした。こうして決めたa,bをA,Bと書くことにします。すなわち、任意のa,bに対して E(A,B)≦E(a,b) です。しかし、(a,b)が(A,B)と多少違っていても、E(a,b)はほとんど増えません。では、(a,b)をどのぐらい動かしても当てはめになってると言えるのか。  このことを、例えば 「ε[i](i=1,2,…)は互いに独立な確率変数であって、どれも平均0、分散vの正規分布に従う」という帰無仮説を考え、これが一定(たとえば5%)の危険率で棄却できる条件を求む という、多次元正規分布における検定の問題として定式化する訳です。すると帰無仮説から結局、「こんなデータ(x[i],y[i])が生じることはアリエナイ」と言えるか言えないかぎりぎりの(a,b)は、ある定数cについて E(a,b) = c という条件で表されることが分かります。a,bを変数と見れば、この式は楕円の方程式になっています。で、(a,b)がこの楕円上を動くとき、直線y=ax+bの作る包絡線を描いたものが、ご質問の曲線です。  もし、 そうやって描くのは知ってるけど、描いたのが「母回帰の中心を支点」とする<形>になり、「中心のデータに重きを置いて考え」ているように<見える>のはナンデカ というのがご質問の趣旨でしたら、カンで話をしてないでまじめに式と取り組んでみれば、答が見えて来ますよ、というのがアドバイスです。

sanarin
質問者

お礼

御礼が遅くなりました。 申し訳ありません。 ありがとうございます! 「形」であり「見える」というのがキーワードかと思います。 数学、苦手ゆえキライで教えていただいた式の意味や内容を理解するのには時間をいただき自分で考えながら解いてみるのが必要かと思います。やってみます。 数学、得意な方うらやましいです。 ありがとうございました。

関連するQ&A