ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：Python feedparserのパースエラー回避方法について）

Python feedparserのパースエラー回避方法について

2008/08/16 16:00

このQ&Aのポイント

feedparserを使用して、ココログで削除または存在しないブログのRSSフィードを読み込むとエラーが発生します
Yahooブログでは同様のエラーは発生しません
エラーの原因と回避方法を教えてください

Python feedparserのパースエラー回避方法について

feedparserを使い始めました。ココログで削除されてしまっているあるいは存在しないブログのRSSフィードを読み込もうとすると下記のエラーが出てしまいます。以下のページをパースしてしまっているように思われますが確認できていません。 http://www.cocolog-nifty.com/error/403 たとえば、Yahooブログで同様のことをしてもエラーはでませんでした。このエラーの原因及び回避方法をご存知でしたら教えてください。 import feedparser d = feedparser.parse('http://xxx.cocolog-nifty.com/xxx/atom.xml') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "feedparser.py", line 2623, in parse feedparser.feed(data) File "feedparser.py", line 1441, in feed sgmllib.SGMLParser.feed(self, data) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 99, in feed self.goahead(0) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 138, in goahead k = self.parse_endtag(i) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 315, in parse_endtag self.finish_endtag(tag) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 355, in finish_endtag self.unknown_endtag(tag) File "feedparser.py", line 476, in unknown_endtag method() File "feedparser.py", line 1318, in _end_content value = self.popContent('content') File "feedparser.py", line 700, in popContent value = self.pop(tag) File "feedparser.py", line 641, in pop output = _resolveRelativeURIs(output, self.baseuri, self.encoding) File "feedparser.py", line 1594, in _resolveRelativeURIs p.feed(htmlSource) File "feedparser.py", line 1441, in feed sgmllib.SGMLParser.feed(self, data) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 99, in feed self.goahead(0) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 133, in goahead k = self.parse_starttag(i) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 291, in parse_starttag self.finish_starttag(tag, attrs) File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/sgmllib.py", line 333, in finish_starttag self.unknown_starttag(tag, attrs) File "feedparser.py", line 1589, in unknown_starttag _BaseHTMLProcessor.unknown_starttag(self, tag, attrs) File "feedparser.py", line 1458, in unknown_starttag value = unicode(value, self.encoding) LookupError: unknown encoding: 環境は、Mac OS 10.5.4、Python 2.5.1、feedparser 4.1 レンタルサーバのXREAでも試しましたが同様のエラーが出ました。 XREAのPythonは2.4です。よろしくお願いします。

C3055
お礼率100% (1/1)

その他（プログラミング・開発）
回答数1
ありがとう数4

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

sakusaker7
ベストアンサー率62% (800/1280)

2008/08/16 16:23 回答No.1

403で返しているページ(後で遷移しますが最初のもの)の頭が <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html lang="ja"> <head> <meta http-equiv="Content-Type" content="text/html; charset=shift_jis"> <title>アクセスが禁止されています：@nifty</title> <meta http-equiv="Content-Script-Type" content="text/javascript"> <meta http-equiv="content-Style-Type" content="text/css"> なので >LookupError: unknown encoding: とか? とりあえずこの例外が発生しているわけですから、捕捉しておいて握りつぶすなり自前の警告メッセージを出力するなりしてしまうとか。

質問者

お礼 2008/08/16 17:17

なるほど、勉強になります。例外を捕捉する方法で回避したいと思います。

質問者

補足 2008/08/16 17:20

回避についてはどうにかなりそうです。ありがとうございます。原因についてですが、たとえば、PHPのRSSパースライブラリSimplePieを使うとフィードが存在しないというメッセージが出ますが、feedparserでは403ページをパースし始めてしまいます。これの原因が分かりません。これもココログ特有の現象です。こちら分かりますでしょうか。

Python feedparserのパースエラー回避方法について

Python feedparserのパースエラー回避方法について

質問者が選んだベストアンサー

お礼 2008/08/16 17:17

補足 2008/08/16 17:20

関連するQ&A

numpy 動作確認エラーについて

gnuplot.py について

Pythonを使ったwebアプリについて

[svn+python]tracのinitenv中のsubversionエラー

Pythonの設定方法(text_factory)

Pythonを用いてCGIを作る勉強をしています。

[Erroer] pylear2 tutorial

ruby on railsに関して

python urlopen error について教えてください

Pythonでexport　PYTHONSTARTTUPがエラーになる

pythonでエラー「out of memory」

pythonのimportについて

パソコンを変えるとpythonを使えなくなった

PHPからシェルコマンドを実行するとエラーが出る。

Pythonのバージョンアップについて

pylearn2インストールに関する

VMware ESXi 4.1.0導入時エラー

safariをインストーラーでインストーラーができません。

tracがうまく動きません。。。（ImportError: ）

pythonのシンタックスエラー

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

Python feedparserのパースエラー回避方法について

Python feedparserのパースエラー回避方法について

質問者が選んだベストアンサー

お礼 2008/08/16 17:17

補足 2008/08/16 17:20

関連するQ&A

numpy 動作確認エラーについて

gnuplot.py について

Pythonを使ったwebアプリについて

[svn+python]tracのinitenv中のsubversionエラー

Pythonの設定方法(text_factory)

Pythonを用いてCGIを作る勉強をしています。

[Erroer] pylear2 tutorial

ruby on railsに関して

python urlopen error について教えてください

Pythonでexport PYTHONSTARTTUPがエラーになる

pythonでエラー「out of memory」

pythonのimportについて

パソコンを変えるとpythonを使えなくなった

PHPからシェルコマンドを実行するとエラーが出る。

Pythonのバージョンアップについて

pylearn2インストールに関する

VMware ESXi 4.1.0導入時エラー

safariをインストーラーでインストーラーができません。

tracがうまく動きません。。。（ImportError: ）

pythonのシンタックスエラー

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

Pythonでexport　PYTHONSTARTTUPがエラーになる