• 締切済み

pythonでjavascriptを取得したい

検索結果を自動で取得するツールを作成しています。 ページ内のリンク先URLを取得することはできたのですが リンク先のページにjavascriptが使われていて詰まっております。 import re import pycassa import urllib import urlparse import string import urlparse import json d=urllib.urlopen("最初のページ") print d.read().decode("sjis") aa=d.readlines() d.close() for bb in aa: if(re.search('リンク先',bb)): s="http://(リンク先とつなげて表示)" url2=s+cc2 f=open(url2) data.json.load("f") f.close() print(data) 検索してJSONを使ってみたのですが良い結果にならず、 どう工夫したらよいか教えていただけないでしょうか。

みんなの回答

  • dscripty
  • ベストアンサー率51% (166/325)
回答No.3

あとは、ブラウザの力をかりる。 Mozilla の場合なら、これ! https://developer.mozilla.org/ja/XPCOM/Language_Bindings

  • dscripty
  • ベストアンサー率51% (166/325)
回答No.2

なら、JavaScript Engine のお世話になるしかないね! Python の JavaScript 実装は聞いたことないけど、海外の Python コミュニティで質問してみるのもいいと思うよ? もしなかったら、v8 とか Rhino とかつかうしかないかな。。。

  • dscripty
  • ベストアンサー率51% (166/325)
回答No.1

JavaScript はただのテキストファイルだよ! テキストファイルと同じように扱えばいいような気がするよ?

aili55
質問者

補足

ありがとうございます。 リンク先のフレームの中にとりだしたい文字列があり、 フレームの中身を表示させたいのですが、 そこはHTMLではなくjavascriptで書かれているので・・・。

関連するQ&A