- 締切済み
統計処理の仕方
異なる二種類のカスタードクリームの色差(明度・彩度・色相)を測ったデータの統計処理について質問です。 例えば、明度でのデータを処理するとして、二種類のカスタードクリームで測定されたデータ(例えばそれぞれ30データづつ)の平均値と標準偏差を計算して平均値±標準偏差を求めて、「母集団の確立変数の68%が入ります」となると思うのですがどうでしょうか? さらに二種類のカスタードクリームの平均値の差をとって、それが0.05より小さいからp<0.05なので有意差があるから危険率5%とやれば、色差のデータ解析できますが、どうでしょうか? 難しくて困っています。どなたか、お分かりになられる方、どうか教えてください
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- kamiyasiro
- ベストアンサー率54% (222/411)
企業でSQC推進を担当する者です。 3次元データで、各変数間には相関もあるだろうから、1変数づつ解析してはだめです。 多変量解析を適用して下さい。 目的はなんですか? 分類器をつくることですか? どちらかが正例でどちらかが負例で、負例検出をやりたいのですか? そのとき母集団は既知なのですか? 分類器つくりならば、各30個のデータは、AかBかという教師ありデータですので、 このデータの手強さの順に ・線形判別分析 ・サポートベクターマシン を適用することになります。
- he-goshite-
- ベストアンサー率23% (189/802)
一般に, 二種類のデータを比べて,差があるかどうかという場合, 最初に そのデータが両方とも正規分布をしていれば,次の方法が使えると思います。 正規分布かどうかは,正規検定ということをするのですが,多くの計量値の場合,正規分布とみなせるのが普通ですので,省略できることが多いです。 次に,2種類のデータの分散の差を比べ(バラツキに違いがあるかどうかを判定し)てください。標準偏差が計算済みの場合はそれを二乗して分散とみなせばいいでしょう。 分散検定の結果, 二つの分散の間に差が無い(バラツキに違いがあるとは言えない)と考えられる場合には次に,二つの平均値の間に差があるかどうかというステップ(平均値の有意差の検定)に移ります。 【アドバイス】 ・統計処理の質問をする場合,くれぐれも,「確率」のことを「確立」と書かないようにしましょう。 ・また, >平均値と標準偏差を計算して平均値±標準偏差を求めて、「母集団の確立変数の68%が入ります」となる という部分は意味不明です。 ・更に, >二種類のカスタードクリームの平均値の差をとって、それが0.05より小さいからp<0.05なので有意差があるから危険率5%とやれば、 という個所も意味不明です。 カスタードクリームの明度の値は何を単位にしてどのくらいの数値なのかわかりませんので,その差が「0.05より小さい」ということがどういう意味をもつのか,また,それがなぜ「p<0.05なので」となるのか,門外漢には全くわかりません。
お礼
返事が大変遅くなりまして失礼しました。 ご回答ありがとうございます。 目的は単に卒業論文に書くためのデータ解析?です。 前の卒論には母集団云々の記述はないのですが標準偏差やp値などを調べるとどうしても母集団という概念を避けて通れそうにないみたいだした。しかし、例年の論文では、そんなことお構いなしみたいに、単に採取されたデータを平均して標準偏差出して・・・そして、最後は「p値が0.05以下なので危険率が5%だから有意であるから・・・」という記述で展開しています。でも、p値の計算のプロセスの記述などはないので何故5%以下になったのかもその論文からは判らないのではないかと思います。統計は全くの素人どころではありません。だから、この内容すらも専門の方から観れば「何言ってんだ」みたいにとれるのかどうかもわかりません。しかし、担当教授に質問しようにも、そんなこと聞くようなら卒業させて貰えない雰囲気です。質問したく尋ねようにもいつも忙しいで断られ、判らないところは省いて第一稿は出したのですが、第二稿でちゃんと完成させようと思ったのですが、その段に来て教官に会うことすら出来なくなりました。 ご回答、ほうとうにありがとうございます。 しかし、今の私には内容が難し過ぎて理解できません。三次元データと多変量解析を少し読みましたが、卒論の提出期限ギリギリで、落ち着いて理解するのは、一段落してからにしようと思います。 誠にありがとうございました。