• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:Python feedparserのパースエラー回避方法について)

Python feedparserのパースエラー回避方法について

このQ&Aのポイント
  • feedparserを使用して、ココログで削除または存在しないブログのRSSフィードを読み込むとエラーが発生します
  • Yahooブログでは同様のエラーは発生しません
  • エラーの原因と回避方法を教えてください

質問者が選んだベストアンサー

  • ベストアンサー
  • sakusaker7
  • ベストアンサー率62% (800/1280)
回答No.1

403で返しているページ(後で遷移しますが最初のもの)の頭が <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html lang="ja"> <head> <meta http-equiv="Content-Type" content="text/html; charset=shift_jis"> <title>アクセスが禁止されています:@nifty</title> <meta http-equiv="Content-Script-Type" content="text/javascript"> <meta http-equiv="content-Style-Type" content="text/css"> なので >LookupError: unknown encoding: とか? とりあえずこの例外が発生しているわけですから、 捕捉しておいて握りつぶすなり自前の警告メッセージを出力するなりしてしまうとか。

C3055
質問者

お礼

なるほど、勉強になります。 例外を捕捉する方法で回避したいと思います。

C3055
質問者

補足

回避についてはどうにかなりそうです。ありがとうございます。 原因についてですが、 たとえば、PHPのRSSパースライブラリSimplePieを使うとフィードが存在しないというメッセージが出ますが、feedparserでは403ページをパースし始めてしまいます。 これの原因が分かりません。これもココログ特有の現象です。 こちら分かりますでしょうか。

関連するQ&A