- 締切済み
統計手法
ある薬Aの投与前後の血液データBの変化について統計処理を考えています。しかし血液データBは非常に個人差が大きくサンプル数10程度では正規分布には程遠くなってしまいます。このような時はWiscoxinの符号順位検定を用いて検定してよいでしょうか。また、投与前をたとえば100としてデータを標準化した場合はどのような統計処理がよいのでしょうか。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- selfer
- ベストアンサー率76% (104/136)
こんにちは. 投与前条件と投与後条件との血液データの変化を調べる……これが目的と考えてよろしいでしょうか? また重要なポイントですが,血液データは同一人物から投与前後から採取されたものでしょうか? 人物の「対応あり」なのか「対応なし」なのかによって使用するデータ分析法は異なります.またそのデータが正規分布を仮定しているかどうかによっても異なります. この質問に対して,質問者様は「Wilcoxinの符号順位和検定(符号【付き】順位検定?)」を使われようとしていることから,「対応あり」「非正規性」のデータであると考えられますが,この理解は正しいでしょうか? そうであるならば,「符号付き順位検定」を使用されても問題はないと思います. 対応ありデータの分析法の場合は,条件1と条件2のデータを比較するというのではなく,「条件1-条件2」の差のデータを作成して,そのデータを分析対象とすることが特徴です.なので,条件1あるいは条件2が仮に非正規分布であっても,「条件1-条件2」の差データが正規分布であれば「正規性」のデータ分析法(例えば,対応ありt検定)を用いても構いません. しかし,今回は非正規性のデータ分析を用いるとのことなので,それに従います. なお,ノンパラメトリック検定(正規性を仮定しない検定)についてはいろいろな誤解があります.少なくともノンパラ検定の一種である「符号付き順位検定は,分布に関する仮定を必要としません.優位判定を行う確率表も,そのような分布情報を仮定することなく算出されたものとなっています. もう一つの質問についてですが…… > また、投与前をたとえば100としてデータを標準化した場合はどのような統計処理がよいのでしょうか。 このような標準化をする意味がいまいちわかりません? おそらくは,投与前条件のデータは(70,120,……)などのようにバラバラとなっていますよね? それを一律に(100,100,……)にするということでしょうか? この理解で正しいとしても,それではせっかくの情報をロストしてしまうことになります. 検定とは,(70,120,……)の集団データから得られる平均値などの代表値を計算対象としています.しかし,分析者が勝手に(100,100,……)とデータを歪めることは当然,代表値も歪めることとなります. どのような意図があって「標準化」を行うのか補足などをお願いします.
- shiohisa
- ベストアンサー率0% (0/1)
これは血液データBの投与前と投与後での差を検定すると言うことでしょうか?また,それなら投与前と投与後の分布が両方正規分布からはずれているのでしょうか? あるは,投与したグループと投与していないグループでの比較になるのでしょうか?
>検定してよいでしょうか。 わからない。1山分布でないとノンパラメトリック検定が使えないから。 標準化をすると自由度が減るのでできれば生の値を使いたいのですが