ベストアンサー 自由度・分散とは 2006/07/30 15:22 データ解析の母平均の区間推定の式で「自由度9」や「分散3」が出てくるのですが、これはどういう意味でしょうか? よく分からないので、分かりやすく教えて下さい。お願いします。 できれば、お早めにお願いします。 みんなの回答 (1) 専門家の回答 質問者が選んだベストアンサー ベストアンサー backs ベストアンサー率50% (410/818) 2006/07/30 23:23 回答No.1 自由度が出てくるのですから分散が未知の場合(t分布を利用する場合)と考えてよろしいのかな? この場合,自由度というのはn-1(nは標本の大きさ)で表されますし,分散は標本の値を基に計算した不偏分散です。 だから例えば,95%の信頼区間を求めるのであれば自由度9,上側確率が0.025となるパーセント点を見つけると,t(9,0.025)=2.262となります。 したがって,[(平均値)±2.262*sqrt(3)/sqrt(10)]が信頼区間になります。 質問の意味があまり良く分からないので,とりあえずこれだけ。 質問者 お礼 2006/07/31 20:27 丁寧に教えて頂き、ありがとうございました。 学校でこの問題を聞かれ、理解できず、困っていました。この問題自体がよく分かりませんよね。 本当に助かりました。 広告を見て全文表示する ログインすると、全ての回答が全文表示されます。 通報する ありがとう 0 カテゴリ 学問・教育数学・算数 関連するQ&A 自由度νが大きいときの母分散σ^2の区間推定・検定 自由度νが大きいときの母分散σ^2の区間推定・検定では、z = √(2χ^2) - √(2ν-1)が標準正規分布N(0,1)で近似できることを用いて求められるのはなぜ?そもそも近似式はどのようにして導出されたのか? Excel での母分散推定について 母平均 169.6、母分散 66.5 の正規母集団 1000 個のデータから無作為抽出した 20 個の標本の標本分散(不偏分散)s^2 は 64.2 だった。 いま、母分散σ2は未知であるとして、σ2 の信頼区間を信頼度95%で推定する。 自由度 19 のカイ二乗分布両側 0.05% 点を k1、k2 とすると k1 = CHIINV(1-0.05/2,19) ≒ 8.91(下側) k2 = CHIINV(0.05/2,19) ≒ 32.85(上側) であるから (19*64.2)/32.85 ≦σ^2 ≦ (19*64.2)/8.91 19*64.2/32.85 ≒ 37.13 19*64.2/8.91 ≒ 136.90 ∴37.13≦σ^2≦136.90 確かに母分散 66.5 はこの範囲に入っていますが、感覚的にはずいぶんアバウトに感じます。こんなものなのでしょうか? 不偏分散の分母の n-1 標本平均 Xav を求める式、 Xav = 1/nΣxi を不偏分散で用いるため自由度が1減り、不偏分散の分母が n-1 になると思います。 母平均は標本から求めるものではなく(それは標本平均になる)、既知であることが前提であるため上式は不要であり、 標本分散では自由度が減らず分母が n-1 ではなく n になる。 この考えは間違っていないでしょうか? もし間違っていないとすると、母平均は事前にわかっているものなのでしょうか? 例えば、母集団をクラス40人のテストの点数とすると(これは母集団と言わない?)、上式より母平均(?)を求めることができます。 母平均が40個のデータに独立でないため、分散の自由度は1減らす必要がある気がします。 これは結局不偏分散を求めているのでしょうか? 天文学のお話。日本ではどのように考えられていた? OKWAVE コラム 統計学(交互作用に関して) 以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上、宜しくお願い致します。 正規母集団の母分散の推定? 標本平均を使って、母平均の推定の仕方を習いました。 (母標準偏差がわかっているときです。) -1.96≦(標本平均-X)/(母標準偏差を√サンプルサイズで割った数)≦+1.96 でXについて解けば母平均の95パーセント推定範囲が出ると思うのですが この式を使って、(母平均がわかっているときに)母分散の範囲を推定することはできないのですか? 統計学の問題について教えて下さい ある物質の重さを測定した結果が次の通りであった。 28,26,21,23,16,18,15,16,17 (1)このデータに基づいて母平均と母分散の点推定を求めよ。 (2)母標準偏差が4であるときこのデータに基づいて母平均の信頼係数95%の区間推定を求めよ。 (3)母標準偏差が未知であるときこのデータに基づいて母平均の信頼係数95%の区間推定を求めよ。 全然わからないので教えて下さい 標本分散が母分散より少し小さくなる理由、不偏分散をn-1でわる理由 お世話になっております。 統計学初心者で、母平均の信頼区間の推定について勉強しています。 勉強している中で、標本分散が母分散より少し小さくなるということ、 そのため標本分散ではなく不偏分散を利用し、不偏分散の算出は偏差平方和、サンプルサイズから1引いたもので割ることを勉強しました。 しかし標本分散が母分散より少し小さくなる理由、そして、そのために不偏分散の算出においてn-1でわる理由が分かりませんでした。 わかりやすい形で教えて頂けないでしょうか? どうぞよろしくお願い申し上げます。 分散の求め方 はじめまして。分散の求め方で質問があります。 おわかりになる方、書き込みをお願いします。 測定値1,2,3,4,5について。 (1) 平均値=3、自乗の平均値=11より 分散=自乗の平均値-平均値の自乗より =11-(3×3)=11-9=2 (2) 平方和=(1×1+2×2+3×3+4×4+5×5)-5×3×3 =10 自由度=5-1=4 分散=平方和÷自由度より =10÷4=2.5 (1)、(2) どちらが正しいのでしょうか。 よろしくお願いします。 統計学(交互作用に関して) 前回と同じ質問ですが、具体性を欠いていたため、補足して再掲します。 以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上が前回の質問ですが、具体性に欠いていたため、具体例を追加致します。統計入門書から例を用います。 子どもたちの成績は、1.先生によってちがうのか、2.教えてもらう時間帯によってちがうのか、3.それらの交互作用、の3点について2元配置の分散分析を行う。尚、子どもたちは合計18名、同じような学力で3人ずつ、6つのグループに分けて実験した。授業の後で10点満点のテストを行った。 A先生 B先生 C先生 午前 3、4、5 6、7、8 3、4、5 午後 2、3、4 3、4、5 1、2、3 ちなみに、平均値に関しては、 A先生 B先生 C先生 午前 4 7 4 5.0 午後 3 4 2 3.0 3.5 5.5 3.0 交互作用に関する母分散の推定は、まず、標本平均の分散の推定値を求めます。 標本平均の分散の推定値=(4-3.5)×(4-5.0)+(7-5.5)×(7-5.0)+…+(2-3.0)×(2-3.0)/【(先生の数-1)×(時間帯の数-1)=0.5 わたしが、イメージできないと表現したのは、この「平均がたくさんあり、分散は同一(=0.5)の分布です。 (ちなみに、その後の計算は、標本平均の分散は母分散の1/nですので、3(=n)を掛けた値(=1.5)を推定母分散とします。後は、F値は推定母分散の比ですので、この値を用いて検定します)。 以上、宜しく御願い致します。 不偏分散の分布は? 不偏分散の分布について混乱していますので、ご助言頂けましたら幸甚です。 例えば母集団の分布を正規分布N(μ,σ^2)とした際、 標本平均x(=1/nΣxi)を区間推定する場合、正規分布の再帰性より、標本平均の分布はN(μ,(σ/√n)^2)となることから、μの区間推定が可能と理解しています。 また、若干やり様は異なりますが、標本分散s^2=1/nΣ(x-xi)^2に対し、ns^2/σ^2がΧ2分布に従うことから、σの導出が可能と理解しています。 ここで、上記と同様に、不偏分散(=1/n-1Σ(x-xi)^2)についての分布とは、どのような分布になるのでしょうか? おそらくΧ2分布になると推察しますが、証明できてません。 また、不偏分散の導出方法は、 E[S^2]、即ちS^2の平均と理解していますが、 S^2を確率変数とした際の分布がΧ2分布なのであれば、 このΧ2分布の平均が、不偏分散になってもよさそうですが、 Χ2分布の平均=n ですので、不偏分散とは不一致です。 上記のとおり、整理がついておりませんので、教えて頂けましたら助かります。 特に上記のとおり混乱しておりますので、現在はむしろ、「不偏分散については、点推定でのみ用いるのか?」と考えております。 自由度及び平均平方について(統計解析) お世話になります。 初歩的なことかと存じますが、ご回答いただきたくお願いいたします。 統計解析で ”平均平方=(平方和)/(自由度)”とあり、私は ”平方和”・・・ばらつきを表す指標 と理解していますが、「”平方和”を自由度で割る」ことが、何を表す 指標になるのか、理解できません。 自由度の意味を、根本的に理解できていないからかもしれません。 自由度及び平均平方について解説いただきたく、お願いいたします。 以下例題の分散分析表の、平均平方から、F値、p値へ進むに当たり 平均平方の部分で、つまづいています。 例) 要因 平方和 自由度 平均平方 F比 p値 回帰 1000.35 5 200.07 65.17 0.000 残差 78.17 26 3.01 よろしくお願いいたします。 統計学 分散について 今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。 ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。 分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。 2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。 言ってる事がいまいち伝わらないかと思いますが・・・ どなたか解説お願いします。 分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・ 日本史の転換点?:赤穂浪士、池田屋事件、禁門の変に見る武士の忠義と正義 OKWAVE コラム 確率・統計での分散について 確率統計における分散について、用語として(文字通り)分散、標本分散、母分散、不偏分散などがあります。 初等的な意味合い(すなわち計算の仕方による定義)としては特段理解が難しいものではないと思いますが、テキストによって定義に若干齟齬があるように思えます。また、エクセルでの計算の実施という意味合いでもやや疑問があるのであらためてお尋ねします。 状況を設定します。 コーヒー豆が1万個ぐらい1つの袋に入っているとします。全部を調べるのが大変なので10個だけ無作為に取り出して調べるということにします(n=10)。 それを何回やるか、また取り出して豆は元に戻すか、ということもありますが、(10個の豆のセットを)1回だけ取り出すということで、元に戻さないということを前提とします(1回だけやるなら同じですね)。 分散:平均からの偏差の2乗和の平均(状況に無関係な一般用語?) 標本分散:1つの標本(10個)に関して分散を取ったもの。10個の豆の平均からの偏差の2乗和をn(=10)で除したもの。 母分散:袋に入っている1万個の豆を全数調査して調べた分散 不偏分散:10個の標本から母分散を推定しようとして標本(10個の豆)の平均からの偏差の2乗和を9(=n-1)で除したの。 このような定義で間違いないでしょうか。確率・統計の本ってものすごくいっぱいありますから本ごとにちょっと違うことが書いてあるように思ったのでお尋ねしました。標本分散のことを不偏分散と書いてある本があったりしたのですが。 その次にエクセルの関数、varp, var についてお尋ねします。 varpは母分散を求め、varは不偏分散を求めると仕様に説明されています。そのエクセルの計算に用いるデータは取り出した1つの標本(10個の豆)しかありません。 後者(var)はいいのですが、前者(varp)は母分散を求めるという仕様で、10個の豆だけで、1万個全数調査してやっとわかる母分散が分かるはずはないと思うのですが。母分散がサンプルから求まるはずはなく、サンプルから母分散を求める努力の結果が不偏分散ということですね。たとえば、母集団(豆袋)から取り出した10個のサンプルをあらためて母集団とみなしてただ単にその分散ということなのでしょうか。そのような入れ子のような解釈をすると混乱するのでそうではないはずなのですが。 長文ですみません、よろしくお願いします。 共分散について 共分散の定義式の説明を教えてもらえませんか?? ばらつきや平均値から引く意味がわかりませんil||li_| ̄|○il||l すみませんが詳しく教えてください!! 統計学、自由度の意味がよくわかりません。 「質問」 自由度の意味がわかりません 「質問の経緯」 統計学の学習をしています。自由度という言葉の意味がよく分からず困っています。 下記はあるウェブサイトからの自由度の説明の引用です "例えば、サンプルサイズが3のデータから算出された標本平均が5であるとき、1つ目の値と2つ目の値は自由に取ることができます。例えば、4と6とします。すると、3つ目の値は標本平均が5となるようにしなくてはならないので、「5」しか取ることはできません。つまり、自由に値を取れるデータの個数が1つ分減ってしまった(1つ分の情報量を失った)ことになります。したがって、自由度は「3-1=2」となります。" 全体的によくわからないのですが、上記の文章における >>1つ目の値と2つ目の値は自由に取ることができます が特に分かりません。例えば日本人の平均身長を標本から統計的推測をしたいとします。 この時、無作為に選んだ人間の身長の平均が標本平均となるはずです。 標本の中の一つ一つのデータについて、この人は平均身長は168で、とかこのひとは170でとか 値をつけることはないはずです。しかし上記の引用した文章においては まるで標本の中のデータの値を自分で勝手に決めているように思えます。 「質問まとめ」 自由度という言葉の意味がよく分かりません。 特に"1つ目の値と2つ目の値は自由に取ることができます" という、値を自由に取ることが出来る、という言葉が分かりません。 理解の手助けとなるようなアドバイスなどがあれば教えてほしいです。 母分散が既知ならば推定しなくても良いのでは? 平均値の区間推定などにおいて、母集団の分散などが既知の場合と未知の場合とで、信頼区間の求め方が変わりますが、そもそも母集団の統計量がわかっているのならば、なぜ母集団をそのまま利用しないのでしょうか。 このような推定をする意義は何で、または適用範囲はどこなのでしょうか。 もしくはこの疑問を解消するのに参考になる市販の書籍等があれば、ご紹介いただけるとありがたいです。 絶版になっていても、国会図書館等に行ってでも調べてきます。 不偏分散の (n-1)で割る理由、、、 分散の計算では、nで割る母分散と、(n-1)で割る不偏分散がありますが なぜ(n-1)で割るのか、いまいち直感に訴える説明に出会っていません。 たいていの本では、天下り式に「(n-1)で割る」とだけしか書いて いません。たまに親切な本では計算式に平均値が入っているので自由度は nから1だけ少なくなる云々とありますが、自由度が何故1減らなければ ならないのか、いまいち理解出来ません。 もう少し高度な本になると、期待値Eやら分散Vやらが出て来て、 不偏統計量云々の「ややこしい」説明が出て来ますが、これも直感に 訴えかける説明ではありません。 数物系出身ながらお恥ずかしい質問ですが、いざ自分に問いかけてみると 納得できる説明が出来ません。「なるほど!」というご説明をいただけると 幸いです。よろしくお願いします。 【統計学基礎】自由度とは? 【統計学基礎】自由度とは? 以下の問題で自由度について答えさせられるのですが自由度とはなんでしょうか?自分はただ自由度=標本の大きさ-パラメータと考えていたのですが色々パラメータがどれを指すかによってかわってきて混乱してきています。 平均u=5、分散σ^2=4 の正規母集団より大きさn=16の無作為標本を抽出する。このときy=(n-1)s^2/σ^2は以下省略…また‐xを標準化したZは正規標準分布にしたがい、‐Xとs^2は統計的に有意であることから、z/√y/15は自由度???のt分布に従う。 という問題です。まずそもそもz/√y/15の式の意味もよくわからないのですがご回答お願いします。 理論的な多分散度 ○ラジカル重合において理論的な多分散度の限界値1.5とはどのように決まっているのか教えてください。 高分子の教科書を読んだところ、停止反応において、 重量平均重合度/数平均重合度=(2+p)/2 となり、反応率pが1に近づくとき多分散度が1.5になるのかなという気がしましたが、いかがですか? また、ラジカル重合の論文を読んでいると多分散度が1.5以上のものが登場します。多分散度が1.5以上の場合は、ラジカル重合が制御できなかったと解釈すればいいのでしょうか。 以上、よろしくお願いいたします。 分散分析の結果の見方を教えて頂けませんか?? 生データをエクセルで二元配置分散分析しましたが、結果が出ましたが、結果の見方が分からなくて、困ります。結果としては以下になりますが 因子A(発音)の平方和84.7568自由、度1、平均平方84.7568、F値24.7145、P値0.00000 因子B(意味)平方和0.2432、自由度1、平均平方18.2703、F値0.0709、P値0.7904 この結果の見方や分析し方が分かりませんが、誰かをお教えて頂けませんか。この結果を考察後もう一つのデータ結果と比較します。そのデータは以下にあります。 因子A:平方和4.1771、自由度1平均平方4.1171、F値12,6188、P値0.0007、 因子B:平方和1.0863、自由度1、平均平方1.8063、F値5.5358、P値0.0215 日本語は変なところもあるかもしれませんが、よろしくお願いします。 注目のQ&A 「You」や「I」が入った曲といえば? Part2 結婚について考えていない大学生の彼氏について 関東の方に聞きたいです 大阪万博について 駅の清涼飲料水自販機 不倫の慰謝料の請求について 新型コロナウイルスがもたらした功績について教えて 旧姓を使う理由。 回復メディアの保存方法 好きな人を諦める方法 小諸市(長野県)在住でスキーやスノボをする方の用具 カテゴリ 学問・教育 人文・社会科学 語学 自然科学 数学・算数 応用科学(農工医) 学校 受験・進学 留学 その他(学問・教育) カテゴリ一覧を見る OKWAVE コラム 突然のトラブル?プリンター・メール・LINE編 携帯料金を賢く見直す!格安SIMと端末選びのポイントは? 友達って必要?友情って何だろう 大震災時の現実とは?私たちができる備え 「結婚相談所は恥ずかしい」は時代遅れ!負け組の誤解と出会いの掴み方 あなたにピッタリな商品が見つかる! OKWAVE セレクト コスメ化粧品 化粧水・クレンジングなど 健康食品・サプリ コンブチャなど バス用品 入浴剤・アミノ酸シャンプーなど スマホアプリ マッチングアプリなど ヘアケア 白髪染めヘアカラーなど インターネット回線 プロバイダ、光回線など
お礼
丁寧に教えて頂き、ありがとうございました。 学校でこの問題を聞かれ、理解できず、困っていました。この問題自体がよく分かりませんよね。 本当に助かりました。