- ベストアンサー
時系列データの検定
あだむと申します。統計学の勉強を始めた所なんですが、わからない所があり質問させて頂きます。 ある規制を行った結果、ターゲットに絞った品目の使用量が減りました。規制前、後1年分ずつのデータがあるのですが、t検定やノンパラメトリック検定で有意差を検討しても良いものなのでしょうか? 母集団がどこにあるか、良くわからないので、検定していいものかどうか迷っています。一施設のみのデータなので、それ自体が母集団なのではないのか。でも、データを抽出している以上、手元にあるデータは誤差を含んでおり、標本なので、検定をしても良いのか。 知恵をおかし下さい。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
#2です。 比較する前後で6個ずつのデータですか。それなら確かにノンパラメトリックな検定を試した方が良いでしょうね。 ノンパラメトリック検定に詳しくないので、どの検定方法が適切かはよく分りませんが…。 また、もしt-検定を使われるなら、という場合の蛇足的なアドバイスですが: この場合、観測量が正規分布するという仮定を置くことになるので、正規分布に従うとして良い、ある程度合理的な理由づけが必要になると思います(しれっとして使ってしまうのも、ありなのかも知れませんが…)。 例えば、金融工学の世界でよく使う手ですが、「互いに独立な多数の撹乱要因が働くので、中心極限定理によりノイズは正規分布すると見なせる」とか(これも良く考えたらずいぶん乱暴な理由ですが)。
その他の回答 (1)
- a_priori
- ベストアンサー率77% (7/9)
念のため確認しますが、規制前後1年間の各月の使用量データがあるような状況でしょうか? (ある程度のデータ数がなければ、もちろん検定のしようがありません。) その商品の施設における使用量が、おのおの独立に正規分布に従い、規制前と後の平均がμA,μBであるとすれば、帰無仮説H0:μA=μB, 対立仮説H1:μA≠μBとして、t-検定のスキームが使えますよね。 母集団がどこにあるか、というのは難しい問題ですね。そもそも伝統的統計学の「母集団が存在し、そこから標本抽出を行う」ことを想定する枠組み自体、工業製品の検査だとか世論調査だとか、「母集団に真の値があって、全数調査をすれば真の値が確実に分るんだけど、色々な制約上、標本抽出をせざるをえない」という様な場合を前提とした考え方ですので、母集団を想定するのは、時系列を扱う場合には馴染まないように感じます。 もちろん、前述のように各期の使用量が正規分布に従うという仮定は、使用量について正規母集団を想定していると言えなくもないですが…。 それよりは、t時点の使用量A(t)が、 A(t) = μ + ε(t) すなわち平均的な使用量の水準μが様々な要因によりノイズε(t)で揺らいでいると考えた方が理解が容易であると思います。
お礼
書き込みありがとうございます。 まず、毎月の使用量のデータはあります。月平均で検定を行いたいと思っていますが、規制前、後で1年間分、標本として1月ずつと考えると、12個しかサンプルがありません。ノンパラのマンホイットニーのU検定を考えています。 A(t) = μ + ε(t) わかりやすいご説明ありがとうございます。 この考えなら納得行きます。月ごと、様々な要因で平均からずれるという考え方ですね。 今後共、よろしくお願い致します。
お礼
書き込みありがとうございます。 規制前1年、規制後1年のデータがあります。月平均で検定を行うので、標本数は規制前12個、規制後12個になります。 標本数が多ければ、正規分布が仮定できると思いますが、ちょっと少なめだと思いましたので、ノンパラを選びました。 >例えば、金融工学の世界でよく使う手ですが、「互いに独立な多数の撹乱要因が働くので、中心極限定理によりノイズは正規分布すると見なせる」とか(これも良く考えたらずいぶん乱暴な理由ですが)。 なるほど。わかりやすいご説明ありがとうございます。私は、医療関係の職についています。統計の事を勉強始めた所ですが、ある程度、広い分野での統計の使用方法も勉強した方が良いかと感じていました。その方が、より理解が深まると思いますので。 また、何か追記がありましたら、よろしくお願い致します。