ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：pythonを使ったスクレイピング）

Pythonを使ったスクレイピング方法

2008/09/09 00:10

このQ&Aのポイント

Pythonを使用して指定サイトから情報を取得するスクレイピング方法の勉強中です
例えば、http://www.stardust.co.jp/というサイトから市原隼人の情報を取り出す方法について教えてください
特に、市原隼人の出身地である神奈川県の情報を取得したいです

shiroshi77

shiroshi77
お礼率39% (23/58)

HTML
回答数1
ありがとう数2

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

rinmai

rinmai
ベストアンサー率100% (1/1)

2008/09/09 22:04 回答No.1

import BeautifulSoup import urllib url="http://www.stardust.co.jp/profile/ichiharahayato.html" soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(url)) for tag in soup.findAll("tr"): 　if tag.find("span") == "出身地": 　　print tag.find("td") -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- >8 -- 求めているのはこんな感じでしょうか？まず対象のHTMLを読み込んでその中からtrタグを抽出し、spanタグが出身地と一致したらtdタグを表示します。あとは、必要に応じて文字コードや抽出条件の追加などしていけばいいと思います。

参考URL：: http://www.crummy.com/software/BeautifulSoup/

shiroshi77

質問者

お礼 2008/09/11 16:04

ありがとうございました。ちょっとがんばってみます。

関連するQ&A

注目のQ&A

カテゴリ

[技術者向] コンピューター
- プログラミング・開発

カテゴリ一覧を見る

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

職業から探して質問する

専門家登録