• ベストアンサー

離散型データについて教えてください。

妻がある問題集をやっていて、その問題に 「下記の記述において離散型データはどれか。選択肢より選びなさい」 という設問があり、妻にその意味を問われました。 webで検索してみたら統計学?確立分布?離散数学?の用語のようですが 工業高卒文系、数学が壊滅的で、統計学も学んだことのない私にはイマイチよく理解できません。 妻も頭を悩ませて問題集も止まったままのようです。 どなたか、わかりやすく教えていただけないでしょうか? なお、著作権に関係する可能性から、設問自体も多少変え、 設問の選択肢まで書いてはまずいかなと思いとりあえず伏せます。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

身長を測った場合、  身長そのものは、連続型。161、163、167cmと順番に並べられます。162cmのヒトも、161.5の人も161.22のヒトもいると想います。すなわち、数字を並べると、隙間なく埋めることができます。連続型です。数直線で描くと、大勢を限りなく測定すれば、隙間なく埋めることができます。  身長が何番目か、で表示すると、1番目、2番目、・・・、と表します。1.5番目なんぞの中間のヒトはいません。161.5cmのヒトは1.5番目と感じるかもしれませんが、それはあとから勝手に継ぎ足しただけで、そのグループに入れば、2番目。以下順番が繰り下がるだけで、2.3番目なんぞはありえません。これが離散型。  数直線にデータをマークしてみて下さい。マークでビッシリ、隙間がないようにできるのがのが連続型。1人目、2人目、・・・なんぞは、1.5とか5.8なんぞはありえないので、隙間ができる離散型。  日付は、離散型。「今日は四月21.8日」なんぞは誰も言いません。月も、一月、二月、というと連続型に見えますが、以前は、睦月、如月、弥生、・・・で混乱はありませんでした。   統計学では、データの型というのは大切です。この概念が分からず、なんでもかんでも平均を求める質問をみかけます。  離散型でも、間隔尺度になっていればまだ救われます。が、アンケートの回答の順序尺度を平均する、なんぞの噴飯ものを目にします。

allegar
質問者

お礼

回答ありがとうございます。 1.5番目とか21.8日などはなるほどわかりやすいですね。 要するに、上記のように尺度などでありえない数字が出ないのが離散型ということですね。 何とかそれなら理解できます。

その他の回答 (2)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

碁石を適当につかんだときの「石の数」は、離散型の統計量です。 12個のすぐ上は13個であり、12.7個などということは起こりません。こういう統計量を「離散型」といいます。 コップに適当な量の水を入れたときの「水の量」は、連続型の統計量です。 120CCになることもあり、142.857・・・CCになることもあります。可能性は連続していて、途中の切れ目がありません。 離散型では「サイコロの目がちょうど5になる確率」という表現ができます。しかし、連続型では「弾丸が的の中心からちょうど10cm離れる確率」という表現はできません。連続型では「誤差が2cm~3cmの範囲にある確率」という表現しかできません。離散型の確率分布では、確率そのものを示しますが、連続型では、確率密度関数を積分して初めて確率が得られます。

allegar
質問者

お礼

回答ありがとうございます。 碁石とコップの水の例はわかりやすいですが、弾丸の例は少し難しいかな。。。 おぼろげに、なんとなくわかったので、 設問をよく読み返してみようと思います。

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

例が無いので、的を射ているかわかりませんが。 気温を考えて見ましょう。これは連続したデータですが、 測候所では定時観測して値も丸めて記録していると思います。 この場合、時間的離散と数値的離散が起こっています。 序数詞も1,2,3,4、・・・で1.5なんか有りませんね。 アナログデータに対するデジタルデータが離散型といってもいいと思います。

allegar
質問者

お礼

ymmasayanさん、ご回答ありがとうございます。 ですが、まだよく理解できていません。 時間的離散と数値的離散? 例えを出されている気温でなら、こういうことですか? 気温は常に変化し観測され記録されています。この記録が連続型データで、 その気温データ(連続型データ)を平均値を出したりしたのが離散型データということでしょうか。 4月の平均気温とか。 例えば選挙。 出口調査で100人投票したことが判明。 このうちこの100人を年齢でカテゴライズしたのが連続型データ、 100人を男女別にして平均年齢を計算したのが離散型データ。 自分なりに今のところ以下のように理解しています。 違っていますでしょうか?