• 締切済み

htmlの中からaltの中身だけを抜きだす

pythonを用いてhtmlの中からaltの中身だけを抜きだすコードが知りたいです。よろしくお願いいたします。

みんなの回答

  • retorofan
  • ベストアンサー率34% (435/1276)
回答No.2

PythonのBeautifulSoupライブラリを使えば、 HTMLからalt属性の値を抽出することができます。 そのコードを例示します。 from bs4 import BeautifulSoup import requests # HTMLを取得(対象のURL) url = "https://www.sample.com" response = requests.get(url) html = response.text # BeautifulSoupオブジェクトを作成 soup = BeautifulSoup(html, 'html.parser') # 'img'タグの 'alt'属性を抽出 for img in soup.find_all('img'): print(img.get('alt')) alt属性が存在しないimgタグの場合、Noneが出力されます。 上記のコードを実行するには Pythonのrequests と beautifulsoup4ライブラリが必要です。

  • WDY
  • ベストアンサー率27% (134/487)
回答No.1

関連するQ&A