• 締切済み

データ処理

不均等なデータの特徴を比較したいとき、どんな方法が利用できますか。

みんなの回答

回答No.1

どんな特徴かによって比較方法はまったく変わってきます。 例えば、単なる平均化も全体的なレベルを比較するのに有効な方法ですよね?

hirohiro84
質問者

補足

説明不足ですみませんでした。例えば、中国人90人分、シンガポール人10人分、マレーシア人60人分のデータで,日本語の助詞をどれだけ間違えたかという頻度のデータがあって、それらを同じ土台で比べたい場合、どうしても人数での影響をうけてしまうので、何かいい方法はないかなと思ってお訪ねしました。間違えた助詞数/すべて出てきた助詞数、で平均化しましたが、人数が少ないシンガポール人のデータは頻度が1しかないデータでも大きな値になるし。データ-平均/標準偏差、というデータの標準化も試してみましたが、これは、負の数値がでてくるので後で(国に関係なく)全部を助詞の種類で足し合わせをしたら、負の数値→頻度が少ないものなのに、0以下では、大きな数値になってしまって、全部を統合できませんでした。

関連するQ&A