• ベストアンサー

ある得票数が他の結果と差があること証明する統計方法

添付されたグラフ例(人気投票)のように、投票によって得られた結果があります。そこから、ある得票数が他の得票数より十分差があり際立っているということを示せる統計方法を教えていただきたいです。 グラフの例ですとA,Eが他の結果(B,C,D,F)に比べて極めて大きいことが見てわかります。しかし、ただ「大きい」と感じるだけでなくA,Eはこういう統計方法から他の結果に比べ十分「差」があり、際立った結果を示していることを定量的(統計的)に知りたいです。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kon555
  • ベストアンサー率51% (1848/3569)
回答No.2

>>閾値の設定方法  軽く調べてみましたが、明確なものは見当たらないですね。 「歪度については正規性の基準が示されているが,尖度についてはそれが示されていない。そこで,通常は歪度の指標を参考にするとよいだろう。」とする物がひっかかったくらいです。 http://www.med.u-toyama.ac.jp/biostat/How%20to%20comfirm%20normality(JPT,%202017Dec).pdf  尖度と歪度に検定はあるものの、多分貴方が想定されているようなデータでは使いモノにならないでしょうから、とりあえずは歪度の基準をあてはめてみるのがいいかも? https://ja.wikipedia.org/wiki/ジャック–ベラ検定  ただ元来、こうした統計的な手法は「正規分布している母集団」を想定しています。しかし得票率などはそもそも正規分布する類のものではないので、既存の目安をあてはめるという事自体に無理があるケースです。  個人的には、過去の得票データなり適当に作ったデータなりで「主観的判断の数値化と閾値設定」を行った方が適切にも思えます。  あまり数字に振り回されないように、適切に運用して下さい。

echo666
質問者

お礼

ご回答ありがとうございました。正規分布していないため、検定は難しそうですね。違うアプローチで数字の分析を行いたいと思います。

その他の回答 (1)

  • kon555
  • ベストアンサー率51% (1848/3569)
回答No.1

 色々と方法はあると思いますが、得票数ならば「占有率」がベターでしょう。計算もしやすいですし。  色々な商品でシェア〇〇%、などというアレです。 https://landgather.com/marketshare  書かれている例であれば、総数が30+1+2+5+25+6で69票。そのうちの30票を獲得しているAは、30/69で約43.5%の票を獲得しています。2位のEは約36.2%、3位のFは大きく下がって8.7%・・・というように比較できます。  また候補数が膨大になるなど、統計レベルでの話が必要ならば「尖度」などが使えると思います。 https://bellcurve.jp/statistics/course/17950.html

echo666
質問者

お礼

ご回答ありがとうございます。占有率、尖度とても参考になりました。回答後に誠に申し訳ないのですが、これらの指標に加え、ある閾値以上(以下)の時に明確な差があるといえるような検定方法を知りたいです。 たとえば、尖度がある閾値以上のとき”明確に差がある”といえるような閾値の設定方法などです(現在のままですと、尖度のみがでてしまいそれの値が大きいのか小さいのか判断するのは主観的になってしまうと思います。)

echo666
質問者

補足

申し訳ありません。統計方法と書いてありますが、主に知りたいことは検定の方法を知りたいです。例えば、t検定ですとp値と有意水準によって帰無仮説を棄却できるかできないかがわかります。このように、指標を算出し、その指標がある閾値以上(以下)のときに「差」があると証明できる(人気投票のような今回の例に適用できるような)検定方法を知りたいです。

関連するQ&A