- ベストアンサー
加重平均の重みのつけ方とは?
- 加重平均の考え方について説明します。2つのグループの身長データを例に取りながら、重みのつけ方や計算方法を解説します。
- 一つの重み付け方法として、データをABの2つのグループに分ける方法があります。その場合、各グループの平均値を求めて重みをかけた後、合計して平均を計算します。
- また、別の重み付け方法として、度数分布を使う方法があります。スタージェスの公式や任意の幅で区切る方法などがあります。グループごとに値を計算し、合計して平均を求めます。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
結論から言えば、あなたの考え方で大体良いと思います。一部意味不明の発言もありますが、まあいいでしょう。 定食の例をまた持ち出しますが、 定 食 価 格 販 売 量 A 定食 350円 400食 B 定食 450円 250食 C 定食 600円 100食 計 - 750食 において、 ・これら3種類の定食の価格の平均値はいくらか と言えば、 (350+450+600)/3=466(円) となりますし、 ・1食あたりの平均価格はいくらか、 と言えば (350*400+450*250+600*100)/750=417(円) となります。 何を求めたいのかによって平均を計算する式も変わるのです。このとき、普通はこれは加重平均、これは算術平均だのといちいち考えません。 1食あたりの平均価格を求めるのに、350を400回足し、450を600回足し、・・・合計を750で割る、とやってもいいんですよ。でもそれでは面倒くさいのでかけ算を使っているのであり、これを加重平均と呼んでいるのです。特別な平均という訳ではありません。 (A)165,176,169,170(B)158,163,166 の場合、 (A)が男子、(B)が女子だとして、 (165+176+169+170+158+163+166)/7・・・(1) を計算しても男女で異なる集団だから意味がないのではと思うかも知れません。実際そういう場合もあります。その場合には男女に分けて(「層別」といいます)、それぞれで平均を出して評価するということをします。 しかし7名で1チームのスポーツがあるとして、AとBで1チームだという場合、このチームの平均身長を求めるときには、一つのチームとして男も女も関係ありませんから、(1)式が当てはまります。 何度も言っているように、得られたデータから何を求めたいのかが定まっていなければ「この方法で計算した平均に意味があるのか」という議論は出来ないのです。 加重平均とか算術平均という言葉にこだわるのではなく平均の根本的な意味をご自分でよーく考えて下さい。 私の説明出来ることはすべてしましたので、この辺でここからは失礼させていただきます。 説明するのに自分も勉強になりました、ありがとうございました。
その他の回答 (4)
NO.1~4です。 NO3で答えた下の事例に対して私の説明に大きなミスがありました。 ---------------------- 例えば、ある会社の自動車を販売している年間の1台あたりの平均単価?を求めるような場合に(500+500+…200)÷150=300とすると平均価格は求まりますが、加重平均の出番がありませんでした 高級車販売店a 価格500万 販売台数20 高級車販売店b 価格500万 販売台数30 普及車販売店c 価格200万 販売台数40 普及車販売店d 価格200万 販売台数60 そこで表にして出番を作りました 高級車販売店A(a+b) 価格500万 販売台数(20+30) 普及車販売店B(c+d) 価格200万 販売台数(40+60) すると結果は同じ300です。 --------------------- これに対して、500万円の車と200万円の車の台数が共に100台だからです..という説明をしましたが大嘘でした。失礼しました。500万円の車は50台、200万円の車は100台でした。すみません。 本当はこうではなくて、あなたの計算した、 (500+500+…200)÷150=300 が加重平均の計算と同じだからです。 算術平均とはすべてのデータを足してデータの個数で割る、という意味です。加重平均の計算も「各データにその個数を掛けたものをすべて足し合わせ、総個数で割っている」ので算術平均と同じ計算です。 最初にあなたが仰った、「加重計算の結果が通常の算術平均と同じ値になる場合が多く、単なる計算の簡便法なのか...」というのは概ね正解でした。 ちなみに (500+200)/2=350 という平均の考え方をすれば、これはこれで意味をもつことがあるでしょうが、加重平均と異なる結果になります。 もっともこれも「データを足して個数で割っている」ので算術平均でもあります。 ともあれ、「平均」とだけ覚えておけば実用上問題は起こらないと思います。普通は平均とは算術平均のことで、加重平均もこれの仲間です。算術平均とは違う調和平均や幾何平均(わからなければググるなどして調べてみて下さい)など通常は使いませんし。
お礼
補足していただきありがとうございます。加重のそこなし沼いる私に救いの手をさしのべていただき、お礼の言葉も見つかりません。本当にありがとうございました。調和・幾何も一緒に調べてはいたのですが、しばらくはお腹一杯です。
No.1,2です。 (A)165,176,169,170(B)158,163,166 の場合、 身長 人数 165cm 1人 176cm 1人 169cm 1人 170cm 1人 158cm 1人 163cm 1人 166cm 1人 という表を作れば、加重平均は次のようにして求められます。 (165*1+176*1+169*1+170*1+158*1+163*1+166*1)/7=166.7(全部人数が1人なので単純平均と同じ結果ですが、加重平均です) 高級車販売店a 価格500万 販売台数20 高級車販売店b 価格500万 販売台数30 普及車販売店c 価格200万 販売台数40 普及車販売店d 価格200万 販売台数60 の場合は価格500万円の車と価格200万円の車の台数がともに100台なので、加重平均でも算術平均でも同じ値になるのです。 販売店aの台数を10台にして計算して御覧なさい。
補足
お付き合いいただきありがとうございます。やりとりをしているうちに自分の中の疑問が見えてきました。今では、無理矢理モデルグループ(それも平均して)を作ってはいけないというはっきりした認識になりました。 この例の範囲内でいえば、身長データに対してモデル(160cm,165cm…というグループ)を作るのではなく、ありのままのデータを集計するというのが加重平均の重みの考え方だと。 すると『典型的な数種類のパターン値が集まりやすいデータならデータ数が少なくても加重平均に向いてる』と思うのですが、この考えであっているでしょうか?早計でしょうか? 自動車の例でいうと、500万が○台…200万円が△台という重複データ(サンプル)が多数存在するなら加重はしやすいが、元々のデータに490万,510万…というバラツキばかりのデータだったら加重するにはあまり向かない(大量のサンプルが必要)。 高級か普及販売店という括りを探すのではなく、存在する全データにパターン化された値(500万と200万)があったから加重平均に向いていて、結果的に高級店と普及店という括りの表で計算できた。 身長や体重のようなバラツキの多いデータだと世界中の人間の大量データなら加重の意味があるかもしれないが、それ以外の場合ならあまり向かない。 ただ、もし仮に(A)165,176,169,170(B)158,163,166 別で人数を集計することに意味があるのなら加重平均する意義があるかもしれない。 だから、AとBが"男子クラス別"の括りはあり得るのか?"男女別"ならあり得るのか?"全国の地域別"なら加重平均になるのかという質問には、7つのサンプルで集計する意味がない限り成り立たないという理解でおります。 何度もスミマセン。今回のご説明で理解が深まった気がします。ただ、まだわかったわからないような境をふらついているようです。あと一歩、何か駄目押しのご助言をお願いします
あなたの示された、 2つのグループの身長データが次のようにあるとします。 (A)165,176,169,170(B)158,163,166 という例が何を表すのかがはっきりしていないと、平均の出し方についてどう考えるべきかは何とも言えないと思います。・・・身長データというのはわかりますが、(A)(B)の区分けは何のためにあり、それぞれどんな特徴があるのかとか... この例と、リンクにある定食の例ではちょっと違うのではありませんか? 定食の例ではそれぞれのデータ(価格)に対して販売数という重みがついています。 それに対して、あなたの示した例は、これを見るだけでは重みは特にないようです。(だから何らかの重みをつけたいと仰るのかも知れませんが) あなたの示した 1)は(A)、(B)別々に平均を求めたものから全体の平均を求めているもので、初めから全体の平均を求めたものと何ら変わりません。かえって2段階に分けて計算しているので有効数字の関係で精度が落ちる可能性があります。 2)、3)はこのように分けるのはあなたの自由ですが、加重平均を使いたいがためにわざわざ分けたようで、本質的な意味が感じられません。また、階級の幅の中にせっかく持っている個々のデータの精度が消されてしまって大雑把な平均値の計算結果になっています。 大事なことは、 ・そもそものデータが何を表しているのか? ・そのデータからどんな情報を得たいのか? がはっきりしないと、数字をこねくりまわしても意味がないのです。 統計的手法はあくまでも手段であって、その手段を使うことが目的になり、データをそれに当てはめようといじってしまうというのは本末転倒だと思います。
お礼
A組という男子の身長データとB組男子のデータがあったとします (A)165,176,169,170(B)158,163,166 “全体の平均身長”を求めるためにはどのような計算手法が存在するのでしょうか? この設問に対して少なくとも2種類の方法があるのかと思っていました。ひとつは算術平均でもうひとつは加重平均の計算の仕方です 加重平均をするためには、人数や個数が異なるグループの表を作れば良いのかと理解していました この考え方でいる限り、加重平均とは単なる計算方法の簡便法から脱却できません(数字が算術計算と異なることがあっても) 1)総和÷個数(人数) 2)(A平均×人数)+(B平均×人数) 例えば、ある会社の自動車を販売している年間の1台あたりの平均単価?を求めるような場合に(500+500+…200)÷150=300とすると平均価格は求まりますが、加重平均の出番がありませんでした 高級車販売店a 価格500万 販売台数20 高級車販売店b 価格500万 販売台数30 普及車販売店c 価格200万 販売台数40 普及車販売店d 価格200万 販売台数60 そこで表にして出番を作りました 高級車販売店A(a+b) 価格500万 販売台数(20+30) 普及車販売店B(c+d) 価格200万 販売台数(40+60) すると結果は同じ300です。表計算ソフトがあれば個別に計算しても苦になりません。私の中では加重平均は計算簡便法の域を出なくなりました。そんなことはない何か違いがあるはずだと考え出したわけです。 未だにここから抜け出すことができません。あれこれ重みを考えているうちに実際の販売価格は高級車でも450万,510万と微妙に異なる。これを度数分布にすれば必ず単純な平均と結果は異なると思いつき、これが重みなのかと信じたくなりました。何とかして私なりに加重平均の出番を考えたかったからです。数字をこねくり回していました。でも未だに重みが分かりません。
補足
全くもっておしゃられるとおりです。卵と鶏の関係のようで恐縮してしまうのですが統計によって何ができるのかということ自体が今もって理解できておりません。自分でも無意味なことをしているのではないかという不安に至ったので質問をさせていただきました次第です。 今回のやろうとしていたことが全て統計的には無意味であるということが分かって少しホッとしております。あやうく無駄な時間を費やすところでした。 例えば、Aが柔道部の身長データで平均身長は170それに4人という重みがつき、Bは同じく相撲部のデータで162重みは3人というのが加重平均なのかと勘違いしておりました。間違っていることが分かっただけでも収穫です。 また、Aが男でBが女性グループの身長データであった場合にも加重平均の意味があるのか?というのが分かりませんでした。そこでお粗末なサンプルなのですが統計をするのに値する考え方なのかを知りたかったわけです。これも無意味なことが分かり、2,3)の考え方も頭から消去できて良かったです。 悲しいかな理解不足であるが故に統計によって何ができるのかがはっきり分からない段階で質問してしまい、作為的なサンプルでどのようなことができるのかという可能性に対する質問になってしまったようです。申し訳ありません。 回帰分析などや推計手法のうわべだけ見てデータの集まりから目的を見いだせそうな気がしたので、加重平均も統計的手法によって何かの関係や目的を見いだすことができるのではないか?という素人の浅知恵が働いたようです。統計をするには目的がないといけないという重要なポイントが改めて分かりました。ありがとうございます。
かなり混乱しているようですね。 説明するのに骨が折れそうですので、下のリンクを見て下さい。加重平均について理解できるのではないでしょうか? あなたの出した例では加重平均も算術平均も同じということです。 但し、例えば(A)と(B)がある中学の運動部の在籍メンバーの身長だとして、1学期と2学期の9ヶ月間は(A)のメンバーだったのが、3学期(3ヶ月間とします)は(B)に入れ替わってしまったということにすると、年間を通じての平均身長は、 ((165+176+169+170)*9+(158+163+166)*3)/(36+9)=168.5 とも計算できます。これが加重平均の考え方を用いたものです。(4人×9ヶ月+3人×3ヶ月) スタージェスの公式とか度数分布の階級の幅とかは平均の考え方に関しては関係がありません。
お礼
(A)165,176,169,170(B)158,163,166という2つのグループの身長データからどのような定食屋の表(参考URL)="加重平均の仕方のパターン"が作れるのかというのをいくつか見ることができれば理解できそうです。そういった意味で示していただいた1つの例はとても参考になりました。 データを用いて意味のある表を早く作れるようになりたいです。今後ともご指導いただければ幸いです。ありがとうございます
補足
早速のお返事ありがとうございます。はい、なにぶん素人が入門書を読んだだけなので錯乱状態です。 おっしゃるとおり、度数分布の階級幅が平均と直接関係ないのは理解できます。質問を複雑にしてしまったと反省してます。示していただいた運動部の例は今まで見た例と違うので重みの考え方を理解するのにすごく役立ちそうです。ありがとうございます ちなみに過去の実績データから参考URLにある定食のような表を1)のような考え方で区分けする、または2,3)のような度数分布の考え方で作り価格設定を行い、加重平均と組み合わせて全体の価格の平均をとる行為はそもそも無意味なことなのでしょうか?このあたりが一番聞きたかったことなのかも知れません
お礼
最初にご回答いただいた参考URLは混乱した私にとって目新しくありませんでしたが直接説明いただいた内容に関しては新鮮でした。 今まで見たことのある例ではなかったので錯乱状態から抜けだすための希望の光でした。 2番目のご回答はよく見かけるような説明になりつつ感じたのですが、読み返すと"平均の平均は精度が落ちる可能性が高い""数字をこねくり回す"という言葉がまた少し私を迷いから救ってくれました。 3番目のご回答で全てのデータに対して1をかけるのが加重平均の基本的な考えという新しいパターンを出していただいてさらに泥沼から浮上した気分になりました。sakurachiyoさんの"ともに100台"の部分には気づきましたがこれは重要ではありませんでした。 ただ、"10台の計算してみなさい"という言葉が少しだけ不安にします。後に5番目のご回答で救われるのですが。 4番目の本ご回答で“実際は単純、加重といちいち考えない”という、私を錯乱の泥沼から抜けでるお言葉をいただけました。まだ完全に抜け切れていないかもしれませんが理解する方向は安定してきた気がします。 さらなる追加の補足説明とも相まって心が満たされました。執拗な私の問いにお付き合いいただき、また救っていただきありがとうございます。ご自身の勉強にもなったという謙遜のお言葉も私の負い目的な心を浮上させてくれました。筆舌に尽くしがたいのですが本当にありがとうございました。 最後に文章作成に手間取り、お礼の返事が遅れてしまいましたことをお詫び致します。
補足
【経緯のご報告】 算術、加重平均と初心者からするとそれぞれが全く別物な平均にみえました。特に数式に弱いため、Σの周りにあるものが違って見えたからです。 表計算ソフトを用いると同じ値をいくつも並べて平均する関数で計算することは容易でした。加重平均と呼ばれるものも別の関数を用いて計算もしてみました。しかし、結果が全く同じなのです。 そして、馴染みがある平均の式を言葉で表すと"総和÷個数"なのですが、同じ値を乗算でまとめているだけなのかという疑問がわきました。 単に10を5回足すのと10に5をかけるやり方と同様の簡便法なのかと思ってしまいました。つまり統計に疎い人間ほど“総和÷個数”という言葉に忠実であるためどんなに考えても同じ値しか計算されないのです。 加重計算で過去のものを調べても、難しすぎるものや回答に納得がいかない部分ばかりでした。 特に他所で共通してみる回答の中に“性質の違うものの比較”か“数字を変えてご覧なさい”という説明が多かったからです。数字を変えてしまえば値が変わるのは当たり前なのでは?という思いがあります。 例えば、本質として、以下のような趣旨の説明を数多く見ました。 【前提】3つの平均が3cmのAグループと5つの平均が7cmのBグループがあります 1)各々の重みをつけた加重平均は5.5ですが、単純平均は5ですという説明 2)3cmと7cmの単純平均は5です。加重平均も重みが3と同じなら結果は単純平均と同じだが重みを変えれば結果は違うという類の説明 (3cmx3+7cmx3)÷(3+3)=5 (3cmx3+7cmx5)÷(3+5)=5.5 私の疑問は以下の点において深まるばかりでした。 a)前提の説明段階でsakurachiyoさんがいわれるとおり平均を平均しているという説明があるのでしっくりしません。 b)単純平均の方を2(グループの個数)で割る疑問。前提のグループ平均を無視したとしてもデータが一元的に並んでいたのなら総和÷個数の法則に則って統計初心者は迷わず(3+3+3+7+7+7+7+7)÷8と計算する気がしたのです。 c) 2)に至っては納得しそうな気がしたのですが、b)の例と同じように初心者は総和の部分に乗算式など含めない。計算の仕方は純粋な総和であって乗算を含めた総和の計算の仕方ではないからです。 すると素人考えの"重みを変えた"加重平均式(3cmx3+7cmx5)÷(3+5)=5.5に対する単純計算も比較するデータを同じにすべき(3+3+3+7+7+7+7+7)÷8と考えてしまい同じ値の5.5になるのです。 (3x3+7x3)÷(3+3)の比較対象が(3+3+3+7+7+7)÷6なら (3x3+7x5)÷(3+5)の比較対象は(3+3+3+7+7+7)÷8であるべきなのでは?と考えてしまうわけです。 個人的な問題ですが、自分が普段使っている方が加重平均なのかと思うようになってしまいました。すると"重み"とは一体何でどのような基準でつけるべきなのか?できるのなら統計的に公平にしたいと考えているうちに無間地獄に陥りました。迷える状態になったわけです。 最後の方では加重平均と単純平均との違いをなんとか見いだそうとして、こちらで質問をした様な無理矢理数字をいじくり回すような考えに至り錯乱状態になってしまいました。