• 締切済み

テキストマイニングのためのデータ収集方法

テキストマイニングを用いてお笑いの嗜好についての解析をし、人は「どういうところにお笑いとしての面白さを感じるのか」ということを結論として導き出したいと考えています。 たとえば、「○○という言葉と××という言葉が同時に使われると人はおもしろいと感じる」などという結果です。 この場合、作成するアンケートはどのようなものにするのが最適なのでしょうか。 特にコンビについて解析してみたいと考えているので、項目としては、 ・好きなコンビ ・そのコンビのどういった点が好きか ・好きなネタ というようなことを考えているのですが、具体的なアンケートの作り方がいまいちよく分からずに困っています。 また、どの程度のサンプルを集めれば、信頼性のある解析結果が得られるのかについてもアドバイスいただけたらと思います。 どうぞよろしくお願いします。

みんなの回答

回答No.2

参考になるかどうか分かりませんが、私がたまに使う方法を参考として書いておきます。 アンケートを作る前にまずお笑いに関する掲示板やSNSなどでデータをランダムに集めてテキストマイニングしてみます。 あがってきたキーワードを参考にテストアンケートを作成します。 SNSなどで「ボタン」を押して投票するような形式のアンケートを WEBで行い、アンケートで使うキーワードを散りばめて再度アンケートをとります。 いろんなキーワードが得られ、リンク(ワードの関連情報)を得られるので本番アンケートをします。 漠然とどんなアンケートがよいか先に考えず、情報をいろいろ取得してから考えるほうが早いと思います。ある程度回答者の属性や回答経路(ネットor対面、郵送など)でバラつきが大きいと思いますね。あくまで参考意見です。

  • Chuck_GOO
  • ベストアンサー率64% (1018/1586)
回答No.1

テキストマイニングは、”言葉”と”言葉”との関連性を探り、その関連が一体どういう方向性を意味しているのか? を探るものです。 例えばmiki-love-soccerさんのイメージで言えば ・ネタとして使われる言葉を並べてみる (ex.「間違いない!」「斬り!」) ・それぞれのネタに対する、好きさ度合いをアンケートで尋ねる (回答者の属性も同時に・・・(男女別、年齢別、出身地、よくみるテレビ番組 etc.) ・どのネタの組み合わせの支持が高いかを分析し、その支持の高い背景を回答者の属性に求める・・・ といった感じでしょうか。 「○○という言葉と××という言葉が同時に使われると人はおもしろいと感じる」とした場合、それが支持を受ける原因は何か? (出身地か? 好きなコンビによるのか? 性別によるのか?・・・) といったところが分かるとよいのだと思います。 そういう視点で、もう一度アンケートの構成を練り直してみてはどうでしょうか? 「何が支持を受けている」という「結果」と、その「原因」とをきっちり導き出すことが肝要・・・ なおサンプルは一桁では(学校のレポートであっても)ダメでしょう。 学校のレポートであれば、先生に聞いてはどうですか? 企業が実施する一般的アンケートならば、最低でも3桁には乗らないと信頼してもらえないでしょう。。。