• 締切済み

エクセルを使ってスレッドから必要なデータを抽出

ご閲覧ありがとうございます。 私は、掲示板のスレッドからエクセルで必要なデータを抽出する作業を勉強しています。 過去の質問や検索で自分なりに調べた結果、スレッド内で「すべて選択」してエクセルのセルに「貼り付け」し、列を暗転させた後に「データ」→「フィルタ」→「オートフィルタ」→「(オプション)」で“必要なデータの文字を含む行の抽出”ができました。 私の現段階の目標は、“スレッド内の投稿者IDのみを抽出し、セルに貼り付けて並べる(縦・横どちらでも構わない)”です。 これまでの知識では、IDと共にハンドルネームやレス番号が含まれた状態で抽出されるので、膨大な量では検索したり比較することが困難です。 どなたか手解き頂きたく存じます。

みんなの回答

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.2

こんばんは。 私は、回答を書きかけて、多少、ノウハウを書いたのですが、私の知っている方法は、「初心者」とあったので、途中で、載せるのを辞めてしまいました。 今は、RSSリーダーとかはあっても、以前は、多くの人たちは、掲示板をPerlのスクリプトを書いてログは取ってきたわけです。そういう技術は、Excelでも活かすことは可能なのですが、「初心者」と言っている方には、とうてい手が届かないものになってしまいます。 Excelで行う前に、HTML コードを読めなくてはならないかと、正規表現を知らないといけないとか、そういう最低限の知識に、VBAがオートメーション・オブジェクトを扱えるレベルまでの力が必要です。 なお、 > >元のWEBの内容は表形式ですか。 >いいえ。一般的なテキストの文章です。 場所にもよりますが、テキストからは、ほとんど、うまく行きません。HTML形式で取らないと、切れ目が判別できないのです。 そうでなかったら、エディタの正規表現やGrep で、抽出する方法を考えてもよいと思います。 例: ID:fc8dfv9hvg 正規表現 ID:(\w+) ->  $1\n とします。

  • imogasi
  • ベストアンサー率27% (4737/17070)
回答No.1

私は質問者の言っている事実がわからない。私の力が及ばないのだったら申し訳ないが。 >スレッド内で「すべて選択」してエクセルのセルに「貼り付け」し、列を暗転させた後・・ 元のWEBの内容は表形式ですか。 一般テキスト文章を「すべて選択」して、(多分「コピーし」が質問では抜けているのだろう)>エクセルのセルに「貼り付け」した場合 あってほしい複数セルや複数列に分かれますか。 別れ部場合は特殊では。 従って>列を暗転させた後に「データ」→「フィルタ・・で目的が達せられるとは思えないのですが。 ーー (どの掲示板を見ているとかの事実・やっていることが明らかになっても質問者にとって差し障りなくて)実例でもって、順をおってやっていること、今後はやりたいことを説明できますか。

asahina538
質問者

補足

私が初心者なもので、たどたどしい説明で申し訳ございません。少ない知識で精一杯お答えしますので、どうか不快にお感じになられないでください。  >元のWEBの内容は表形式ですか。 いいえ。一般的なテキストの文章です。  >あってほしい複数セルや複数列に分かれますか。 いいえ。先頭の列(例えばA列)のそれぞれのセルに1行分の文章が無理やり貼り付けられます。 ですから、「データ」→……→「(オプション)」で「『ID:』『を含む』」とすると、“ID:”を含む同じ行の文章 (例) 「301 名前 空白さん ID:fc8dfv9hvg」 などのセルが抽出されます。 それなので現段階では、「任意のIDの書き込みを探したい!」という願望が、レス数の少ないスレッドでは実現できるようになりました。目を凝らして、セルからはみ出す(であろう)部分に位置するIDを探すのです。 ここまでが私の出来る範囲です。 これからやろうとしていることは、『ID:*(文字列)』(ID表示はその行の一番最後なので、*(文字列)で表せる(かな?))の部分だけを抽出し、1つずつセルに貼り付けて並べる、という作業です。 すると、IDをアルファベット順に並べ替えたりできてなお便利になります。 実力相応でない要求であるならば、遠慮なくご指摘されて構いません。勉強が進むまで、初心者らしく目を凝らして頑張りたいと思います。

関連するQ&A