• ベストアンサー

スコアの評価

いくつかの質問の回答を数値化し、得点によって評価しようと思っています。 例えば一人暮らしが可能かどうかという判断基準を考えてみます。 評価は「可能」、「出来ない」とします 判断材料とする設問は ●年齢層((1)16歳未満、(2)17~18歳、(3)19歳以上) ●身辺整理((1)母親がする、(2)時々自分でする、(3)自分でやっている) ●金銭感覚((1)無計画、(2)時々金欠になる、(3)計画的) ●友人関係((1)いない、(2)2、3人いる、(3)沢山いる) とします。 各設問の解答(1)を1点、(2)を2点、(3)を3点とし、これを母親20人に質問し、自分の子供を評価してもらったとします。 可能と回答した母親 11人 得点の内訳 12点1名、11点1名、9点1名、8点3名、7点3名、6点1名、5点1名 出来ないと回答した母親 9人 得点の内訳 8点1名、7点3名、6点1名、5点3名、4点1名 質問1 これらから何点以上の得点が得られれば一人暮らしが「可能」であるとの結論を出したいのですが。どうしたら可能でしょうか? 質問2 必要条件の決定方法 一人暮らしが「可能」なのは7点以上で「金銭感覚」及び「友人関係」が(2)以上などの条件を決定したいのですが、これはどのようにして見つけたらよいのでしょうか。 例えば「年齢層」で、可能と答えた人は(1)の回答が20%、(2)が30%、(3)が50%であった場合、素人考えでは(2)と(3)で80%を占めるので、「年齢層」は17歳以上でなくてはならないとか考えたりしますが。条件の抽出法を教えて下さい。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

ご質問は、  ある人に関して客観的に判断できそうな幾つかのテストの結果をAとし、その人の母親に「その人が一人暮らしできるか」を尋ねた場合の答をBとするとき、AからBを推定する方法を構成したい。 ということかと思います。  でしたら、「各設問の解答(1)を1点、(2)を2点、(3)を3点と」するまでは良いけれど、合計ちゃいけませんよ。 ・年齢層((1)16歳未満、(2)17~18歳、(3)19歳以上) ・身辺整理((1)母親がする、(2)時々自分でする、(3)自分でやっている) ・金銭感覚((1)無計画、(2)時々金欠になる、(3)計画的) ・友人関係((1)いない、(2)2、3人いる、(3)沢山いる)  これら4つの質問は、「一人暮らしできるかどうか」と関係がありそうな気がするものの、どれも同じ程度に関係があるとは限りません。重要性が違うかも知れないですね。それを一律に合計したのでは、情報を失ってしまいます。  極端な場合を考えると分かりやすいかな。たとえば、4つの質問に加えて ・タイガース関係((1)無関心、(2)アンチ、(3)ファン) なんて質問を追加したらどうなるでしょうか。これは「一人暮らしできるかどうか」とは関係なさそうですね。同様に ・金魚すくい関係((1)下手、(2)普通、(3)上手) ・たいやき関係((1)嫌い、(2)普通、(3)好き)  : などなど、沢山の関係なさそうな質問を追加したとしてみましょう。すると、得点の合計は「一人暮らしできるか」とはまるで関係なくなってしまうでしょう。  ですから、「その人が一人暮らしできるか」に関係のある質問、重要な質問は一体どれなのか、つまり「ある質問が「その人が一人暮らしできるか」とどの程度の関係があるか、をどうやって測定すればいいか」がホントの問題なのです。そして、答はデータ自身が語ってくれる。 ●ひとつの方法を解説します。(多変量解析法の応用です)  質問に番号i=1,2,3,4を付けましょう。そして、回答したN人の母親にも番号j=1,2,3,......,Nを付けます。そして、回答をs(i,j)とします。(例えば、年齢層の質問を番号i=1とし、その質問に母親ナンバー3が答えた点をs(1,3)とします。) また、「その人が一人暮らしできるか」に対する母親jの回答をt(j)とします。例えば「できる」という答ならt(j)=1、「できない」という答ならt(j)=0、と決めておきましょう。  そして係数a,b,c,d,eを旨く決めて、a s(1,j)+b s(2,j)+c s(3,j)+d s(4,j)+eでt(j)を近似しようと考えるんです。  その近似誤差をz(j)とします。すなわち z(j)=a s(1,j)+b s(2,j)+c s(3,j)+d s(4,j)+e-t(j) です。誤差がどのjについてもまんべんなく小さくなるようにa,b,c,d,eを決める一つの方法は、 Z=Σ{z(j)^2} として、Zが出来るだけ小さくなるようなa,b,c,dを求める、というやり方です。(「z(j)^2」とは「z(j)の二乗」の意味です。また、「Σ」はj=1,2,....,Nについての総和を意味し、従って「Σ{z(j)^2}」とは「z(1)^2+z(2)^2+...+z(N)^2」のことです。) そのようなa,b,c,d,eは、以下の(a,b,c,d,eを変数とする)5元一次連立方程式 aΣ{s(1,j)^2}+bΣ{s(1,j)s(2,j)}+cΣ{s(1,j)s(3,j)}+dΣ{s(1,j)s(4,j)}+eΣ{s(1,j)}=Σ{s(1,j)t(j)} aΣ{s(1,j)s(2,j)}+bΣ{s(2,j)^2}+cΣ{s(2,j)s(3,j)}+dΣ{s(2,j)s(4,j)}+eΣ{s(2,j)}=Σ{s(2,j)t(j)} aΣ{s(1,j)s(3,j)}+bΣ{s(2,j)s(3,j)}+cΣ{s(3,j)^2}+dΣ{s(3,j)s(4,j)}+eΣ{s(3,j)}=Σ{s(3,j)t(j)} aΣ{s(1,j)s(4,j)}+bΣ{s(2,j)s(4,j)}+cΣ{s(3,j)s(4,j)}+dΣ{s(4,j)^2}+eΣ{s(4,j)}=Σ{s(4,j)t(j)} aΣ{s(1,j)}+bΣ{s(2,j)}+cΣ{s(3,j)}+dΣ{s(4,j)}+eN=Σt(j)} を解くと求められます。これでa,b,c,d,eが決まった。 a,b,c,dの絶対値は、それらの係数に対応する質問(1~4)の重要さを示しています。(たとえば、もしa=1.1, b=0.2なら、質問1は質問2よりもずっと重要だと分かる。ひょっとしてc=-0.4になったとすると、質問3の得点が高いほど「一人暮らしできる」と答える母親の数は少ない、ということになります。ですから、タイガース関係の質問が入っていたとすると、その係数は0に近い(関係ない)だろうと思われますし、「寝たきりか」という質問が入っていたとすると、その係数は0よりかなり小さいだろうと思われます。) ●いよいよ、一人暮らし候補を1名連れてきて、当人に関する4つの質問それぞれの得点u(1),u(2),u(3),u(4)を調べます。そして、 g=a u(1)+b u(2)+c u(3)+d u(4)+e を計算してみると、当人の母親に「その人が一人暮らしできるか」を尋ねたら何と答えそうか、が得られます。とは言っても、0か1かの答ではなくて、0.4とか0.6とか、程度を表す。 ●もちろん、この方法は「a s(1,j)+b s(2,j)+c s(3,j)+d s(4,j)+eでt(j)を近似」できる、という仮定の上で成り立つわけで、そうは行かないような質問だって幾らでもあり得ます。 ●ところで、「果たして実際に一人暮らしできるかどうか」は、母親がどう思うかとはまた別の話であって、区別しなくちゃいけません。これは重要なポイントです。 ●私見としては、一人暮らししようとする意思があって、買い物・ゴミ出しと、鍵・冷蔵庫・電子レンジ・洗濯乾燥機・風呂の操作ができる知力・体力・体格があれば、町中で一人暮らし出来ない奴はまずいないと思いますけどねえ。

kamosika2002
質問者

お礼

stomachmanさん。有難うございます。 丁寧な解説で数学が不得手な私でも其れなりに理解出来た気がします。 これで各設問の回答に対する関係性を示す指標(?)が明確になりました。 往生際が悪くて申し訳ありませんが、2点再質問させて下さい。 (1).回答が「できる」「何ともいえない」「できない」とすると各々t(j)=2、t(j)=1、t(j)=0として係数を算出するのと勝手に理解したのですが。これで宜しいのでしょうか?またこの場合、算出されたa=1.1, b=0.2は何に対する関係(「できる」「何ともいえない」「できない」)を示すのでしょうか?それとも回答が3通りになるとこれは使えないと言うことになるのでしょうか? (2)これは何という方法なのですか? 追伸 a s(1,j)+b s(2,j)+c s(3,j)+d s(4,j)+eは a×s(1,j)+b×s(2,j)+c×s(3,j)+d×s(4,j)+eと理解して宜しいですよね(x=乗算)

その他の回答 (1)

  • shige_70
  • ベストアンサー率17% (168/946)
回答No.1

ご質問にあるアンケートの集計以外何もしていない状態でご質問の答えをだすことはできません。仮に出したとしても根拠がなく、目安程度にしかならないでしょう。 きちんとした答えを出すには、アンケートを20人ではなく少なくとも千人くらいに実施し、さらに実施後実際に回答者の子全員にひとり暮らしさせてその成否を確認し、それとアンケートでの点数との因果関係を『多変量解析』という手法を用いて調べます。その結果からボーダーラインを決定することになります。 つまり、結果が先に出ていないと話が始まりません。調査なくして結果を先に予測するというのは数学的には不可能と思います。 ちなみに、多変量解析についての説明をここでするのは到底不可能です。専門書をお読みください。

kamosika2002
質問者

お礼

shige_70さん、回答ありがとうございました。 図書館へ行って多変量解析の本を探してもらいましたが、観ただけで頭がズキズキしてしました。 質問の趣旨としては、目安程度でよかったのです。 あまり数学的でない質問でm(_ _)mすみません 実は子どもと親たちの集まりで色々と双方から社会生活をする上での疑問や価値観、道徳観などを出し合って、その違いを確認しようと、ただそれだけでは面白くないので数値化してみようと云う事になり、その場合「よい」「悪い」とか判断する場合灰色ゾーンがありますから、それをどう切り分けようか?と。平均値や真ん中の数字で切り分けるのは芸が無いということで、気楽に考えて質問を出してしまいました。 もし、そのぐらいの事だったら、こんな風に考えたらと言うようなことがありましたら、これに懲りずに宜しくお願いいたします。

関連するQ&A