• 締切済み

標準偏差,相関係数が綺麗になるデータの求め方

標準偏差,相関係数がある程度綺麗になる(小数第2位程度まで)ようなデータを人工的に作りたいのですが,何か良い方法はありますでしょうか。 理想としては,プログラミングを用いてデータと標準偏差,相関係数がそれぞれ出力されるのが良いですが,より良い方法があるならば教えて頂きたいです。 プログラミングならばその内容まで教えて頂けると幸いです。 なお,データの数は5~20個程度で,数値は1~3桁です。 よろしくお願い致します。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

No1です。全てをお書きになっていないようなので、意味不明です。  まず、プログラミングが目的なら、データの数字は、何でも同じだと考えます。    統計学の学習なら、標準偏差や相関係数について、特定の数字になるようなデータを準備するのは、意味があるとは思えません。  そして、手計算ということですが、最初の相関係数が論文用だったものですから、データは3桁で10組。当時はパソコンがなく、電卓を使いましたが、それでも、一致するのは小数点以下2桁目までで、3桁目まで同じになることはありませでした。キーを1000回くらい叩けば、当然でしょう。相関係数を電卓で、というのは無謀、というり気違い沙汰てしょう。まして相関係数のなんたるかを理解していない高校で、その手計算に意味があるのでしょうか。  計算を簡単に、というのなら、データの数を3つでやれば、計算の過程は覚えることができます。簡単というのとデータ数が10というのは、完全に矛盾します。しかも、手計算。私が生徒なら、拒否したいですね。  なにより、統計学上の意味を理解するのがもっと重要だと考えています。相関係数の解釈は、専門家でも間違えているのを見かけます。高校生には、訳が分からず数字を出すだけでしょう。大学生でも同じて、私も論文を書くようになって、なんとか使えるようになりました。が、計算はパソコンソフトに頼っています。 >そのようになる数値を見つけるという状態です。 相関係数が0.5、のデータを見つけるは、エクセルのA列に1~10、B列に1~10、で関数のCORRELをどこかのセルに表示させる。そうすると、相関係数は1.000になる。  次にB1の数字を適当に入れるシミュレーションで、1分もあれば、0.5の数字は求まりました。0.500にするには、3分くらいでしょうか。  しかし、こんなデータは意味がない。実際には、B1のデータはオカシイ、どこかミス、と判断して棄却します。これは、相関係数0.500に拘ったのが原因です。  この質問文、やりとりは、質問者しか理解できないと想います。私は、書き込みながらイライラしてきました。何をなさりたいのか、それが意味があるのか、もう一度お考えの上、再投稿された方が良いかと。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

学校の課題、練習問題だと想うのですが、違っていますか。  懐かしいですね。30年も昔のことですが、BASICのプログラミングで、回帰式と相関係数を求めたことがあります。今は、エクセルで、標準偏差や相関係数などが簡単に求まるので、プログラミングなんぞの面倒なことは誰もやりません。理系なら、100万円以上の測定機器には、これを応用した検量線のプログラムが組み込まれています。    プログラム用のデータが欲しいのか、プログラムの手順を知りたいのか、プログラムそのものが欲しいのか、どれですか。ただ、プログラムとなると、相関係数を表示する命令語が用意されていても、BASICで100行以上になったので、ここで書きこむのは無理でしょう。 >相関係数がある程度綺麗になる この意味は、相関係数が、1.000に近くなると解釈するのが普通です。というのも、0.003なんぞの相関係数では、「有意差無し → 意味が無い」と判断され、相手にされません。もちろん、相関係数の目的によります。ただ、相関分析を30年やっていますが、相関係数で奇麗になる、という表現は見たことも聞いたこともありません。  小数点以下2桁でも、5ケ桁でも、市販のソフトで簡単に表示されます。

bjkll
質問者

補足

ご回答ありがとうございます。 わかりづらい表現で申し訳ございませんでした。 学校の課題ではありません。問題を作る側です。(詳しくは言えないですが) 高校生に出題する問題を考えているのですが,計算が複雑にならないような問題を出題したいのです。 電卓や表計算ソフトを用いないで解かせるつもりなので,データ数は10個程度でいいです。 勿論そんな程度のデータ数で標準偏差や相関係数を求める意味はないのかもしれないですが,あくまで手計算をさせる練習問題が作りたいのです。(現実的ではないのかもしれませんが) 今はエクセルを用いて,標準偏差であればルートが外れるもの(もしくは√2,√3),相関係数であれば0.5などになるように数値を適当に打ち込んで,そのようになる数値を見つけるという状態です。 これではなかなか見つかりません。 なので,例えば問題作成において「標準偏差が5になる数値データが10個欲しいな」というときに瞬時に出力されるものが欲しいです。 「プログラミングで作ることは不可能ではないけれでも命令文が長くなる」というのは友人からも聞いたのであきらめます。 エクセルでそのようなことはできないでしょうか。再度お尋ねします。 ※「相関係数が綺麗になる」という表現は不適切でした。不勉強で申し訳ございませんでした。

関連するQ&A