• ベストアンサー

TurboLinuxにて、スペースアルクのhtmlソースを取得するjavaプログラム

現在、javaプログラムで スペースアルクというオンライン辞書のホームページの htmlソースを取得するプログラムを作っています。 yahoo japanの時はうまくいったのですが、 このHPの場合、 <font color='#FF9999'>★</font><b>推奨ブラウザについて</b><font color='#FF9999'>★</font><br> 英辞郎をご利用いただく際には、以下の環境をおすすめします。<br> <br> ・Internet Explorer 5.0以上<br> ・Netscape 6.0以上<br> <br> 申し訳ありませんが、上記より低いバージョンのブラウザソフトでは、レイアウトや表示・機能が正常に行われません。<br> なお、以下のサイトから最新のブラウザをダウンロードすることができます。<br> <br> <a href="http://www.microsoft.com/japan/ie/" target="_blank">Microsoft Internet Explorer 最新版ダウンロード</a><br> <a href="http://wp.netscape.com/ja/download/" target="_blank">Netscape ダウンロード</a></td> というソースが返ってきます。(当然、元のページのソースにはこういうことは書いてないです)      どうすればうまくソースを取得してこれるのか教えてください!

質問者が選んだベストアンサー

  • ベストアンサー
  • utakataXEX
  • ベストアンサー率69% (711/1018)
回答No.2

URLConnection.setRequestProperty("User-Agent", "偽装AGENT"); を使用してHTTP_AGENTを偽装すれば行けそうな気がします。 接続先のURLへ情報を送信し、結果を保存する http://www.atmarkit.co.jp/fjava/javatips/069java006.html

参考URL:
http://www.atmarkit.co.jp/fjava/javatips/069java006.html

その他の回答 (1)

  • ngsvx
  • ベストアンサー率49% (157/315)
回答No.1

適切なユーザーエージェントを送ればいいと思います。

関連するQ&A