• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:pythonを使ったスクレイピング)

Pythonを使ったスクレイピング方法

このQ&Aのポイント
  • Pythonを使用して指定サイトから情報を取得するスクレイピング方法の勉強中です
  • 例えば、http://www.stardust.co.jp/というサイトから市原隼人の情報を取り出す方法について教えてください
  • 特に、市原隼人の出身地である神奈川県の情報を取得したいです

質問者が選んだベストアンサー

  • ベストアンサー
  • rinmai
  • ベストアンサー率100% (1/1)
回答No.1

import BeautifulSoup import urllib url="http://www.stardust.co.jp/profile/ichiharahayato.html" soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(url)) for tag in soup.findAll("tr"):  if tag.find("span") == "出身地":   print tag.find("td") -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- 求めているのはこんな感じでしょうか? まず対象のHTMLを読み込んでその中からtrタグを抽出し、spanタグが出身地と一致したらtdタグを表示します。 あとは、必要に応じて文字コードや抽出条件の追加などしていけばいいと思います。

参考URL:
http://www.crummy.com/software/BeautifulSoup/
shiroshi77
質問者

お礼

ありがとうございました。ちょっとがんばってみます。

関連するQ&A