締切済み

サンプルの離散値化による平均値の誤差はどれくらいか

2003/03/14 13:56

先日、質問の中に「整数でサンプルを取って得た平均値は、小数点以下は意味がない」という意味の文章があったので、私は「そんなことはない」と書きました。質問者の意図からは少しずれましたが…。 (http://oshiete1.goo.ne.jp/kotaeru.php3?q=494822) それはいいのですが、その後、「サンプルで得た平均値は、真の平均値と正確に同じか？」という疑問が湧き起こってきました。事前の仮定として、確率変数は正規分布N(μ, σ^2)するとします。 (↑これも多少問題はあるけれど) サンプル数は十分に多く、連続量として取り扱えるものとします。サンプル値を四捨五入して整数として取り扱い、得られた平均μ0が、真の平均μと一致するかどうかです。正規分布は左右対称だから、 μが整数の時には一致することはわかります。またμの小数部分が0.5だったときも、同様に一致することはわかります。問題はその中間です。誤差が出るにしても、それほど大きくないことは常識でわかるのですが、真に一致するかどうかわかりません。統計学は大学の時に(簡単に)やったのですが、これについては調べられませんでした。自分で積分しようかとも思ったのですが、積分は苦手なので…。それで、質問ですが、・この値は正確に一致するのか？・誤差があるとすれば上限はどれくらいか？・これについて定理があるとすれば、その定理には何か名前が付いているか？を知りたいのです。よろしくおねがいします。

liar_adan
お礼率86% (230/265)

数学・算数
回答数4
ありがとう数2

みんなの回答 （4）
専門家の回答

みんなの回答

nubou
ベストアンサー率22% (116/506)

2003/03/16 21:16 回答No.4

質問の意味が難解なので勝手に解釈して質問と回答を提示してみます質問：確率変数Ｘの密度関数をｐ（ｘ）としたときＸを四捨五入してできる確率変数Ｙの密度関数ｑ（ｙ）と平均λを求めよ回答：ｑ（ｙ）＝ Σ（－∞＜ｎ＜∞）・δ（ｙ－ｎ）・∫（ｎ－０．５＜ｘ＜ｎ＋０．５）ｄｘ・ｐ（ｘ） λ＝∫（－∞＜ｙ＜∞）ｄｙ・ｙ・ｑ（ｙ）＝ Σ（－∞＜ｎ＜∞）・ｎ・∫（ｎ－０．５＜ｘ＜ｎ＋０．５）ｄｘ・ｐ（ｘ）なお ψ（ｎ）＝∫（ｎ－０．５＜ｘ＜ｎ＋０．５）ｄｘ・ｐ（ｘ）は数値計算するしかありません

nubou
ベストアンサー率22% (116/506)

2003/03/15 14:17 回答No.3

確率変数Ｘ１，・・・，Ｘｎが皆Ｎ（μ，σ＾２）の正規分布をとり確率変数Ｗ１，・・・，Ｗｎが皆密度関数ｗ（ｘ）の一様分布をとり（｜ｘ｜＜０．５でｗ（ｘ）＝１であり０．５＜｜ｘ｜でｗ（ｘ）＝０である）Ｘ＝（Ｘ１＋・・・＋Ｘｎ）／ｎとしＷ＝（Ｗ１＋・・・＋Ｗｎ）／ｎとしＹ＝Ｘ＋ＷとするとＸはＮ（μ，σ＾２／ｎ）の正規分布をしＷは平均０，分散１／１２／ｎの確率分布をし従ってＹは平均μ，分散（σ＾２＋１／１２）／ｎの確率分布をする従って０＜σの大きさがどうであっても小さくともｎ→∞で分散が０になりＹの密度関数→δ（ｙ－μ）でありｎが限りなく大きくなるとＹは限りなくμしかとれなくなる

nubou
ベストアンサー率22% (116/506)

2003/03/14 22:02 回答No.2

確率変数Ｘ１，・・・，Ｘｎが皆Ｎ（μ，σ＾２）の正規分布をするとＹ＝（Ｘ１＋・・・＋Ｘｎ）／ｎはＮ（μ，σ＾２／ｎ）の正規分布をしますだからｎが大きくなるとＹはμ馬鹿利を取るようになるのですつまりｎ→∞とするとＹの密度関数ｐ（ｙ）→δ（ｙ－μ）となるのです極限ではμ市か取れなくなるのですなおＮ（μ，σ＾２／ｎ）は畳み込み積分すればでます

質問者

お礼 2003/03/15 11:31

回答ありがとうございます。ですが、すみませんがこれも私の問題と違うように思います。 (＃1のお礼の続き) 考えている内に、「一致しない」例を思いつきました。真の平均μが1/8、標準偏差σも1/8とすると、 -0.5～+0.5の区間には、サンプルの約99.85％が含まれます。これらの値がすべて「0」としてカウントされるので、 μ0の値は1/8よりも0.0に非常に近くなるはずです。これは、「離散値の間隔に比べて、標準偏差がかなり狭い」条件ですが、標準偏差を使った式で誤差の最大値が決まるように予想しています。なにか上から押さえられる式があるのではと思うのですが。

pancho
ベストアンサー率35% (302/848)

2003/03/14 15:04 回答No.1

かなり前になりますが、「どんな分布を持った母集団でも、複数のサンプルを抽出してその平均を求めると、その値は正規分布する」という定理を見たことがあるのですが、ご存知でしょうか？つまり、母集団が正規分布していなくても、例えば二項分布・ポアソン分布などであっても、複数個の平均値を統計処理すると正規分布をとなるということなのですが、今考えると「複数」というのはある場合は２個、べつの場合は３個と個数自体を特定してはいけない気がします。この定理が真ならば、正規分布の平均は、元の母集団の平均と一致するので、質問の答えが「一致する」になりそうですが．．．。以上。

質問者

お礼 2003/03/15 11:20

回答ありがとうございます。ですが、私の考えている問題と少し違うようです。考えているのは、「サンプル数が無限。一方は、値を正確に(実際上は不可能だが)記入する。得られた平均値がμ。一方は、値を整数に四捨五入して記入する。得られた平均値がμ0。このときμとμ0は最大でどのくらいの差があるか」というものです。どっちかというと確率と言うよりも積分の問題ですが、ガウス記号[]が入ってくる積分なので、難しいです。統計学の方で、何か名前が付いた定理があるかなと思ったのですが…。

サンプルの離散値化による平均値の誤差はどれくらいか

みんなの回答

お礼 2003/03/15 11:31

お礼 2003/03/15 11:20

関連するQ&A

分布からみた　標準偏差、標準誤差について

平均値の桁数に関して

平均誤差についてです

日本史の転換点？：赤穂浪士、池田屋事件、禁門の変に見る武士の忠義と正義

ランダム誤差と系統誤差

測定誤差の求め方

中心極限定理　一様分布　平均値の意味

平均値の誤差の求め方は？

標準誤差と標準偏差の違いは何？

物理学実験における標準偏差、標準誤差について。

正規分布について

正規分布でない母集団の母平均の信頼区間

乱数の平均の度数分布が正規分布になるのはなぜ？

データの相対誤差について

平均値±3σについて

中心極限定理がわかりません

指数回帰分析の理論値との誤差について

「中心極限定理でサンプリング分布は元の分布の如何に関わらず正規分布に近

Rにおいて、中心極限定理を確認するために、乱数の標本平均のヒストグラム

中心極限定理について

分布と中心極限定理

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

サンプルの離散値化による平均値の誤差はどれくらいか

みんなの回答

お礼 2003/03/15 11:31

お礼 2003/03/15 11:20

関連するQ&A

分布からみた 標準偏差、標準誤差について

平均値の桁数に関して

平均誤差についてです

日本史の転換点？：赤穂浪士、池田屋事件、禁門の変に見る武士の忠義と正義

ランダム誤差と系統誤差

測定誤差の求め方

中心極限定理 一様分布 平均値の意味

平均値の誤差の求め方は？

標準誤差と標準偏差の違いは何？

物理学実験における標準偏差、標準誤差について。

正規分布について

正規分布でない母集団の母平均の信頼区間

乱数の平均の度数分布が正規分布になるのはなぜ？

データの相対誤差について

平均値±3σについて

中心極限定理がわかりません

指数回帰分析の理論値との誤差について

「中心極限定理でサンプリング分布は元の分布の如何に関わらず正規分布に近

Rにおいて、中心極限定理を確認するために、乱数の標本平均のヒストグラム

中心極限定理について

分布と中心極限定理

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

分布からみた　標準偏差、標準誤差について

中心極限定理　一様分布　平均値の意味