- ベストアンサー
統計処理について - ブログ利用調査
- 統計処理について質問紙を作成し、ブログの利用について調査を行いました。利用者を現在利用中の者、過去利用ありの者、未利用者の三群に分け、年齢、学年、性別、利用開始年齢などを尋ねました。利用目的や心情の公開、ブログ利用しない理由などに関しても質問しました。その後、卒論の統計処理について、分散分析の可能性について疑問を持っています。質問項目の選択肢や回答方式についても状況を説明しました。
- ブログ利用に関する統計処理についての疑問
- 統計的なデータを利用してブログの利用状況を調査しました。利用者を三群に分け、利用目的や心情の公開、利用しない理由などについて質問しました。また、卒論の統計処理についても悩みがあります。特に分散分析の可能性について疑問を持っています。回答方式や質問項目などの詳細についても解説しました。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
> この「はい」「いいえ」の場合、絶対に、ロジスティック回帰分析しか用いてはダメなのでしょうか? 「できない」ということはありませんが(計算できないわけではありませんが)、適切ではありません。 応答変数(従属変数、目的変数)が2値データの場合に通常の重回帰を行うとマイナスの値が出たり、1を超える値が予測値として得られることがあり適切ではありません。
その他の回答 (2)
- backs
- ベストアンサー率50% (410/818)
> 応答変数として用いる場合の例 応答変数:ブログ利用有無(1=利用している、2=利用していない) 説明変数:1日のネット利用時間(連続型)、パソコン使用歴(連続型) モデル式: ブログ利用有無 = 1日のネット利用時間 + パソコン使用歴 これはロジスティック回帰分析です(正確には説明変数が複数あるので多重ロジスティック回帰分析です。)。ここでの着眼点は「1日のネット利用時間とパソコン使用歴によってブログ有無を説明できるか」ということです。換言すればブログの利用率を説明できるかどうかということを問題にしているのです。 > 独立変数として用いる場合の例 1日のネット利用時間 = ブログ利用有無 これは分散分析です(説明変数が1つなので1要因の分散分析です)。ここでの着眼点は「ブログの利用有無によって1日のネット利用時間が有意に異なるか」ということです。
お礼
すばやい回答ありがとうございます。 私の場合、応答変数を用いて質問していることが分かりました。 また、質問をしてしまうのですが、 この「はい」「いいえ」の場合、 絶対に、ロジスティック回帰分析しか用いてはダメなのでしょうか? 教えて下さい。
- backs
- ベストアンサー率50% (410/818)
以下の1点についてのみコメントします。 > はい いいえ で選ぶという二件法で、分散分析とかできるんでしょうか。 こういうのを「2値データ」といいます。応答変数(従属変数)として用いるならロジスティック回帰、説明変数(独立変数)として扱うなら分散分析ということになりますね。 > 私は「はい」を1.「いいえ」を2というようにしているので、 どのような数値を割り振るのかは自由です。数値自体には何の意味もないので。 ただ一般的には「はい」を1、「いいえ」を0にします。
お礼
解説ありがとうございます。 お聞きしたいことがあるのですが、 応答変数(従属変数)として用いるならロジスティック回帰、説明変数(独立変数)として扱うなら分散分析ということになりますね。 という部分について詳しく教えていただけませんか? 応答変数として用いる場合の例と 独立変数として用いる場合の例を出してもらえないでしょうか?
お礼
ありがとうございます。 では、適切ではないのならやめておけばいいということですね。 わかりました 利用している・利用していないというのをカイ二乗検定でできますか