- ベストアンサー
「標本」と「標本点」の意味
「標本」と「標本点」という言葉の意味が分かりません。 (1)一般に「標本」と「標本点」は同じ意味だと思うのですが、これは正しいでしょうか。 (2)「共立数学公式改訂増補(共立出版1969)」p418には、要旨、「試行により現れる個々の結果を標本点または要素事象という」旨の定義があります。 一方、「チャート式数学C(数研出版)」p.165には、「本来調べたい対象全体の集まりを母集団、調査のために母集団から抜き出された要素の集合を標本という」とあります。 「共立数学公式改訂増補」には標本点は「個々の結果」とあるので、これは「標本点は1個の数値である」と言っているように思えます。一方、「チャート式数学C」には「集合を標本という」とあるので、これは「標本は複数の数値である」と行っているように思えます。すると、一方では1個であるとされ、他の一方では複数であるとされ、矛盾していると感じられるのですが、これはどう考えたらよいのでしょうか。同じ「標本」あるいは「標本点」という言葉が、場面によって異なる意味で用いられるということでしょうか。 よろしくお願いします。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
♯3です。 おそらく母集団に相当する確率論の用語はありません。母集団というのは統計独特の用語だと思います。前回の日本の家庭の預金高のモデルを例に再度簡単に説明をします。 簡単のため、日本には5家庭しかないとしましょう。それをたとえば{A,B,C,D,E}とすることもできますが、今の場合は預金高しか気にしていないのだから、たとえば{100万,1億,50万,200万,500万}としたほうがわかりやすいかも知れません。この場合、母集団={100万,1億,50万,200万,500万}です。ここから無作為に抜き出した2家庭の預金高を考える確率モデルを考えます。このとき、標本空間は{(100万,1億),(100万,50万),(100万,200万),(100万,500万),(1億,50万),(1億,200万),(1億,500万),(50万,200万),(50万,500万),(200万,500万)}の10個の2家庭の預金高の組と考えるのが妥当です。またもし1家庭の預金高を調べるというより単純なモデルであるなら、標本空間は母集団そのものと考えてもよいわけです。標本空間は考える確率モデルを変えると別のものになります。いずれにせよ今考えている確率モデルで、起こりうるすべての結果を集めたものが標本空間と考えていて問題ないと思います。 いくつか値の決まっているデータがあって、そこから抽出を行うという行為は確率モデルにはなりますが、データそのものを何の工作もしないのであれば、それはなんらランダムネスはないわけで、したがって確率論では母集団そのものには何の興味もないんですね。(少し余談ですが、母集団の平均(母平均)とか母集団の分散(母分散)とかを統計では気にしたりしますが、これらは確率変数の期待値や分散とはまったく異なるものです。ところが母集団から何かサンプルを一つ抽出するというランダムな操作をしたときの得られる値(それはランダムなのだから確率変数である)の期待値や分散というのはいわゆる確率論の期待値、分散そのものなのです。そして抽出が無作為である(一様分布に従って抽出する)とき、それらが母平均、母分散に一致するんですね。ややこしければここに書いたことは無視してください) (強引に意味づけするとしたら、上にも書きましたが、母集団とはただひとつだけを無作為抽出する確率モデルの標本空間のこと、と解釈してもよいかも知れません。)
その他の回答 (4)
- stomachman
- ベストアンサー率57% (1014/1775)
過去に質問回答の経緯があったとは知りませんでした。根が深い話だったんですね。 現実の用語としては、「標本」と「標本点」をはっきり区別してはいない。回答No.3でadinatさんがご指摘の通り、元々同じ概念なんでしょう。(ただ、順番がついているn個のデータの列x[1], x[2], … x[n]を1個のベクトルと見て「標本点」と呼ぶのは自然ですけれども、順番がない単なる「データの集合」を「標本点」と呼ぶことはないんじゃありませんかね。) 「標本」と「標本点」にはっきりした区別はないけれど、しかし、同じひとつの文章の中でごっちゃにするのだけは断然駄目です。たとえば『「標本点」を一個のデータを指すのに使う』と決めたら、標本点を「標本」と呼んだり、標本点の集合を「標本点」と呼んだりすると、文章のconsistency(首尾一貫性)が破綻してしまい、意味不明になってしまいます。 で、ご質問の文章はと言うと、別の文章(1)(2)を持って来てごっちゃにしてみたのに、(1)(2)の間に何の矛盾も生じていない。両者はconsistentであり、きちんと意味が通じています。(No.2はこのことを説明しています。) だからご質問の文章は、矛盾がない実例を示して「ほら見ろ矛盾しているぞ」と主張していることになります。実例がご主張の根拠になっておらず、このためにご質問の文章全体が首尾一貫していない。(論理学の観点からちょっと興味深い事例です。)このことを、回答No.1が指摘しています。
お礼
>現実の用語としては、「標本」と「標本点」をはっきり区別してはいない。 そうなんですか。やはり、はっきりとは区別されないんですね。 >「標本」と「標本点」にはっきりした区別はないけれど、しかし、同じひとつの文章の中でごっちゃにするのだけは断然駄目です。 それは、よく分かります。 >だからご質問の文章は、矛盾がない実例を示して「ほら見ろ矛盾しているぞ」と主張していることになります。 確かに、そのような主張になります。やっと分かりました。 有り難うございます。
- adinat
- ベストアンサー率64% (269/414)
前回の回答は納得いただけなかったのでしょうか。 前にも書きましたが、もともと確率論の言葉では、「標本」も「標本点」もまったく同じものを指す用語で複数の呼び方があるだけのものです。これを統計で流用して、若干異なるニュアンスになっているようですが、次のように解釈すれば同じだと見られるのです(前回も書きました) つまりn回の試行を行ったときに得たデータの組X=(x_1,X_2,…,x_n)(復元でも非復元でも構わない)をひとつのベクトルと見て、これを確率ベクトル(確率変数の多次元版)だと思うわけです。そうすればこれは一つの標本です。また標本は複数の数値などと書かれていますが、標本が1点になることもあります。1個だろうが、複数だろうが、あるいは無限個あろうが、それがランダムに選ばれるものであれば、それを標本(標本点)と呼ぶのです。 チャート式の標本の説明は鵜呑みにしないほうがよいと思います。不用に混乱するだけです。共立の説明のほうがより真実に近いでしょう。ただこれはどこの世界でも起こりうることですが、言葉の意味を本来のものとは異なる意味にとって用いたりすることはよくあります。そういう意味では、場面によって異なる意味で用いられる、といってもいいですが、私はチャートの理解などは誤った解釈と感じますけれど。 やや抽象的で恐縮ですが、確率論での正式な言い方は次のようになります。 (Ω,F,P)を確率空間、Xを完備可分距離空間(S,σ(S))に値を取る確率変数とするとき、ω∈Ωを標本、標本点、見本、などという。 この言い方だと確率変数Xがなくても標本などの用語が定義できそうですが、確率変数がないとあまり標本という意味がないのです(たんなる抽象的な集合Ωの元ωを指すだけだから)。標本というものが実態を持つのは確率変数Xが与えられたときの話です。また統計で使うときは、Ωは基本的には母集団に取ります。また確率変数Xは母集団からのサンプル抽出を行うもの(通常は一様分布に従う確率変数と解釈します)とすることが多いです。ただし統計をやるときはあまりこの確率空間、確率変数を意識することは少ないです。というのは、確率空間がきちんと意味を持つようなものだからです。 余談ですが、たとえばサイコロを1回投げるモデルでは確率空間は通常{{1},…,{6}}からなる6点集合を取りますが、サイコロ2回投げるモデルでは{{1},…,{6}}×{{1},…,{6}}というものを取ります。つまり直積空間です。ここでのサンプルというのは二つの数からなる組、たとえば(2,5)とか(6,6)とかですが、これを複数の数値だとは思わずに、一つの数値(ベクトル)だと思え、というような話なのです。
補足
再度の御回答、有り難うございます。 自分ではだいぶん分かってきたつもりなのですが、何分素人のためどこまで分かっているのかがはっきりしないのがつらいです。 後1つお尋ねしてもよいでしょうか。 前回の質問で上げた例ですが、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高を考えた場合には、100家庭の預金高が標本空間であるというのはよく分かりました。このとき、「日本の全家庭の預金高という母集団」は、確率論では何と(例えば、「○○空間」のような言い方をすると)言うのでしょうか。 よろしくお願いします。
- stomachman
- ベストアンサー率57% (1014/1775)
● 「調査のために母集団から抜き出された要素の集合を標本という」のだから標本とはひとつの集合Xです。 ● 一方、「試行により現れる個々の結果を標本点または要素事象という」のだから標本点はひとつのデータxです。 さてこの場合、「本来調べたい対象全体の集まり」とは実は<あらゆる試行の集まり>であり、これが母集団です。そして、「調査のために母集団から抜き出された要素」とは、「試行により現れる個々の結果」のこと、つまり標本点xです。 だから、「調査のために母集団から抜き出された要素の集合」とは「標本点xの集合」に他ならず、これを標本Xと言うんですから、 x∈X 標本Xと標本点xを混同しさえしなければ、何事の不思議もありません。
お礼
そうなんですか。 標本と標本点は違うんですね。やっと分かりました。 有り難うございます。
『「標本」と「標本点」は同じ意味だと』仮定すると、 『矛盾していると感じられるのです』なら、 「仮定が間違っている」と感じられるのですが?
補足
前回の御回答( http://oshiete1.goo.ne.jp/kotaeru.php3?q=2335158 )で「「標本空間」と「母集団」はまったく別の意味で使われている」とおっしゃった意味がやっと分かりました。本当に、自分でもあきれかえるのですが、前回の御回答は高度すぎて充分には理解できていなかったと思います。 「いくつか値の決まっているデータがあって...」の段落も自分なりにはよく分かりました。私の知識の曖昧だった点をピンポイントで御指摘いただいたような気がします。有り難うございます。 2度の質問を通じて多くのことをたいへん明確に御教示いただきました。厚く御礼申し上げます。有り難うございました。