- ベストアンサー
TurboLinuxにて、スペースアルクのhtmlソースを取得するjavaプログラム
現在、javaプログラムで スペースアルクというオンライン辞書のホームページの htmlソースを取得するプログラムを作っています。 yahoo japanの時はうまくいったのですが、 このHPの場合、 <font color='#FF9999'>★</font><b>推奨ブラウザについて</b><font color='#FF9999'>★</font><br> 英辞郎をご利用いただく際には、以下の環境をおすすめします。<br> <br> ・Internet Explorer 5.0以上<br> ・Netscape 6.0以上<br> <br> 申し訳ありませんが、上記より低いバージョンのブラウザソフトでは、レイアウトや表示・機能が正常に行われません。<br> なお、以下のサイトから最新のブラウザをダウンロードすることができます。<br> <br> <a href="http://www.microsoft.com/japan/ie/" target="_blank">Microsoft Internet Explorer 最新版ダウンロード</a><br> <a href="http://wp.netscape.com/ja/download/" target="_blank">Netscape ダウンロード</a></td> というソースが返ってきます。(当然、元のページのソースにはこういうことは書いてないです) どうすればうまくソースを取得してこれるのか教えてください!
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
URLConnection.setRequestProperty("User-Agent", "偽装AGENT"); を使用してHTTP_AGENTを偽装すれば行けそうな気がします。 接続先のURLへ情報を送信し、結果を保存する http://www.atmarkit.co.jp/fjava/javatips/069java006.html
その他の回答 (1)
- ngsvx
- ベストアンサー率49% (157/315)
適切なユーザーエージェントを送ればいいと思います。