- 締切済み
htmlの中からaltの中身だけを抜きだす
pythonを用いてhtmlの中からaltの中身だけを抜きだすコードが知りたいです。よろしくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- retorofan
- ベストアンサー率34% (435/1276)
回答No.2
PythonのBeautifulSoupライブラリを使えば、 HTMLからalt属性の値を抽出することができます。 そのコードを例示します。 from bs4 import BeautifulSoup import requests # HTMLを取得(対象のURL) url = "https://www.sample.com" response = requests.get(url) html = response.text # BeautifulSoupオブジェクトを作成 soup = BeautifulSoup(html, 'html.parser') # 'img'タグの 'alt'属性を抽出 for img in soup.find_all('img'): print(img.get('alt')) alt属性が存在しないimgタグの場合、Noneが出力されます。 上記のコードを実行するには Pythonのrequests と beautifulsoup4ライブラリが必要です。
- WDY
- ベストアンサー率27% (134/487)
回答No.1