- ベストアンサー
htmlからテキストを取り出す方法
htmlの文書があります。ブラウザで見ると罫線が規則的な格子状になっており各セルに文字が入っています。結構大量です。 このような文字をテキストとしてマイクロソフトワードで取り出すにはどうしたらよいでしょうか。 ブラウザで読み込んでワード上にコピー・ペーストすると、罫線まで一緒にコピーされます。一方、直接ワード上にそのhtmlを読み込むと紙面からはみ出したところまで罫線が及ぶため非常に編集しにくく、また罫線も邪魔です。 この問題を解決するには、ワード上に読み込んだデータから罫線をきれいに消去すればよいと思うのですが、どうしたらよいでしょうか。該当する領域全体(文字・罫線)を選択して罫線を削除するような操作をすると、文字まで消えてしまいます。罫線だけを消してしまいたいのですが。また罫線は黒い線だけでなく、薄灰色の線も見えています。これも消したいのですが。よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
その他の回答 (1)
- koko88okok
- ベストアンサー率58% (3839/6543)
回答No.2
お礼
有難うございます。 言われてみれば確かにその方法があると思います。