• ベストアンサー

linuxにおいて、リンク切れのhtmlファイル

サーバー内のリンク切れhtmlファイルあるいは画像データを削除したいのですが、方法がございますでしょうか。 ついでにコマンドがあれば教えてください。 一度FTPですべてダウンロードして、リンク切れを見つける方法は同様にありますでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.1

結論からいえば、ほぼ無理 以下リスク →被リンクされていないファイルを消すというのは もし別のサイトからダイレクトリンクされていた場合 リンク先がなくなってしまうリスクがあります →一時的にリンクをはずしても、その瞬間けされちゃったりします。 →リンクというとアンカータグだけのチェックになりますが 直接リンクされていなくても、なんらかのプログラムで利用されている 可能性があり、消してしまうと致命的なエラーになりかねません →極端な話、index.htmlなんて、どこからもファイル名をつかってリンクなんか されていないと思いますが、消すとTOPページがみれなくなります それでももしどうしてもやりたいなら、なんらかの解析ツールをつかって、 再帰的にリンクを掘ってリンク一覧に該当しないものを消すことでしょう。 あとはファイルシステムのアクセス履歴から数年アクセスがないファイルを 消すとか、運用面でカバーすることはできるかもしれません。 いずれにしてもリスクはかなり高くてまっとうなWEB管理では使えないと思います

cincinnati
質問者

お礼

ご回答ありがとうございました。