- ベストアンサー
文字画面の一部を文字データとして残したい
インターネットの文字画面の一部を切り取って、文字データとして保存したいのですが、フリーソフトを2、3試した結果は、文字データとしては取り出せますが、改行や空白を無視して、ただ単に文字列をつなげていくだけで、元の体裁に戻すのに苦労します。 元のままの格好で、文字データとして残すソフトか方法があれば教えて下さい。
- みんなの回答 (7)
- 専門家の回答
質問者が選んだベストアンサー
「改行位置や配置をそのまま」というのは、できないのです。 たとえば、訪問したサイトで、ウィンドウ右上のウィンドウサイズを縮小するボタンをクリックして、ウィンドウの縁をドラッグして幅を小さくしてみてください。(このosieteサイトは固定されているためダメ) googleの検索結果などで、ウィンドウ幅を200pxぐらいにしてもそれにつれて改行位置は変わります。変わりに文字を大きくしたり、スタイルシートを無効にするとデザインも変わります。 (IEではちょっと難しいですがインターネットオプションから変更できます) またサイトによると[代替スタイルシート]を用意してあるところもあります。たとえば サンプル スタイルシートを切り替える http://www.usamimi.info/~geko/arch_web/02_sample/018/index.html スタイルシートを切り替えられるモダンブラウザ(IE以外のほとんど)では、表示メニューカーから変更できる。 また、多くのサイトは携帯端末で見るとまったく異なるデザインになります。 ★なぜなら、HTMLは、文章構造(どれが見出しで、どれが文章で、どれが引用か)を記述しているだけで、デザイン(プレゼンテーション)はスタイルシート(指定してなくても、ブラウザ自身が持っている)で指定されているからです。 言い換えるとワープロなどのDTPは文書の構造はなくて、視覚的に「どれをどのフォントで」「どのサイズで」「どこで改行」を指定してあるだけです。 根本的に違うのです。 だから、サーチエンジンはそのページから見出しがどれか、視覚障害者はどの部分を大きな声で読めばよいかが分かるのです。 ですから、改行位置や配置をHTMLから取り出すことは、どだい無理な話なのです。 しかし、それがどんな小さな文字でかかれていようと、あるいは表示されていなくても、コンピューターは必要な文字を拾い出せるのです。 ただ、次のような方法は可能です。 [ファイル]→[名前をつけて保存]→【保存方法を選択】→保存
その他の回答 (6)
- ts3m-ickw
- ベストアンサー率43% (1248/2897)
No.3です。手間はかかる上に完全ではありませんが、ご希望の方法にかなり近いやりかたを見つけました。 (1)ブラウザの画面をいったんPDFにします。 (2)PDFをビューワで開き、そこからテキストを抽出します。 こうするとPDFにしたときに改行コードだけ挿入されますので、テキスト化しても体裁が近いままです。
これでいいのかどうか、簡単すぎて、bofemianさんの希望(目的)に叶うどうか・・・。 役に立てばいいんですが、自信なしです。 文字や改行だけをコピーするのであれば次の方法で、私はやっています。 1.ブラウザの編集から「すべてを選択」 2.「コピー」 3.メモ帳に貼り付け 4.メモ帳で「すべてを選択」して「コピー」 5.ワードに貼り付けて編集。 <補足> 3でワードに貼り付けするとヘンテコになります。 メモ帳だと、画像やHTML形式は無視して、文字と改行だけが貼り付けられます。
- violet430
- ベストアンサー率36% (27472/75001)
>文字の相対位置や段落,要するにレイアウトをそのままでテキスト文として保存したいのですが それではHTML文書として保存するしかないですね。 IEのメニューから ファイル - 名前を付けて保存、として、 ファイルの種類 で WEBページ、HTMLのみ を選び保存します。 保存されたデータをHTMLエディタで開いて、不要な部分を削除してから保存して下さい。 HTMLエディタは幾つかありますが、無料ではブラウザSeaMonkey内蔵のComposerをお勧めします。 http://seamonkey.mozilla.gr.jp/releases/
- ts3m-ickw
- ベストアンサー率43% (1248/2897)
一般には文字データというのは体裁を含まないものですから、改行や空白がなくなるのはあたりまえの話だと考えます。 何をどうされたいのか質問文から理解できていないのですが、元の体裁を保ちたいのであればHTMLのソースのまま保存すればよろしいでしょう。 ブラウザごとに若干の違いはありますが、画像以外の部分を右クリックして「ソースの表示」。 あとはエディタなりメモ帳などにコピペして、拡張子htmで保存すればよろしいのでは?
- violet430
- ベストアンサー率36% (27472/75001)
>インターネットの文字画面 それは画像データでしょうか? 画像データを切り取って、文字部分を切り取ろうとしているのでしょうか? しかもそれをフォントとして登録したいのでしょうか?
補足
画像データではなく、文字の部分(例えば取説の内容とか)をコピーしたい(後で編集して残す)だけです。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
意味不明です。 インターネットとは世界中のコンピューターを繋ぐネットワークですから「インターネットの文字画面」とは? 「文字画面の一部」画面とは通常ディスプレイに表示される画像ですから、PrintScreeで画像は取り出せますが、それは文字にはできない。 ・・・・ひょっとして・・・ 「ブラウザに表示されているHTMLから文字データを取得したい」??? なにをしたいのか詳しく書いてみてください。
補足
「ブラウザに表示されているHTMLから文字データを取得したい」 これです。レイアウトはそのままで
補足
文字の相対位置や段落,要するにレイアウトをそのままでテキスト文として保存したいのですが。