あるサイトにあるページを全て取得したいのですが
こんにちは。質問があります。(少し長文になると思います)
私はとあるサイト(データベースを利用した情報系サイト)をよく利用しているのですが、
このサイトは例えば花などの情報をまとめてあるサイトとして、
4000件程度の花が登録されていて、クライアントのボタン一つで「育てやすさ」「何月から栽培
できる」「人気がある」など画像付で並び替えができるサイトとします。(このサイトをBサイトとします)
さらに並び替えた画像をクリックすると「専用ページ」に飛んで詳しい育て方や実際育てている
写真などが掲載されています。(さらにはその花の命名者など数多くの情報が登録されていて
非常に有用なサイトです)
私はそのBサイトの並び替えなどのシステムがとても使いにくいためいつもイライラしていました。
(ページも非常に見にくいです)
ならばいっそ自分で作ってしまおうと思い、初めてphpとmysqlを勉強してようやく最近完成しました。
作り方として
並び替えはデータベース内で行いphpで呼び出す形として、花の名前や値段、育て方や写真のパスなども全てデータベース
に入れ、phpで文字などを出力させるというサイトにしました。(画像はサーバーに置いてあります。
データベースに今情報を入れているのですが種類が4000種類以上もあるためおそらく何年もかかると思いますが今は少しずつ入れています)
それでアップロードしてとりあえず予定道理の動きはしているのですが、一つ困ったことがありまして
、文字情報を全てデータベースに入れているため検索にまったくひっかからないのです。
例えば 「チューリップ」「育て方」と検索しても私のサイトは絶対ひっかかりません。
これではせっかく作ったのに誰にも使ってもらえません。
しかし、そのBサイトは「チューリップ」「育て方」と検索すると「チューリップの専用ページ」が検索にヒットします。
私も専用ページは設けていますが、そのページもデータベースから文字など全てphp出力なので検索にはひっかかりません。
Bサイトが検索にヒットするということは、ちゃんとhtml上にチューリップまたは育て方という文字が存在するということになると予想できるのですが・・4000以上もの内容の異なったhtmlのページがサーバー上に本当に存在しているのでしょうか・・。
そうでないと説明がつかないのでそういう結論に行き着いたのですが間違いないでしょうか・・?
そうすると私も一つ一つhtmlのページを作らなければならないのですが何年もかかる作業に
なりそうなので、Bサイトが本当に4000ものページを持っているのか知りたいのですが、
相手のサーバーにあるページを全て取得する方法は存在するのでしょうか?