• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:テキストの文字の重複を調べる方法について)

テキストの文字の重複を調べる方法について

このQ&Aのポイント
  • メモ帳で複数の同じ言葉をチェックする方法を知りたいです。
  • 文字が多くて目視でのチェックが難しい場合、どのようにチェックすればよいでしょうか。
  • メモ帳には重複する単語を瞬時に示す機能はないのでしょうか。有料や無料のソフトも教えてほしいです。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

対象が「日本語」だとしたら大変難しい話です。 例えば英語などは単語の間に空白が入ってみたり解り易いのですが、 日本語はそうもいかないです。 例えば、ご提示のURLのリンク先・・ウィキペディアのページを上から・・ 「メジャーリーグベースボール」という文字列がありますね。 これは一つの単語でしょうか。 それとも「メジャーリーグ」「ベースボール」の二つでしょうか。 英語に倣って「メジャー」「リーグ」「ベース」「ボール」の四つでしょうか。 カタカナじゃなく、漢字で考えてみると・・ 「名門球団」・・コレは一単語として扱いますか? ウィキペディアにこだわらず・・「メモ帳」というのは一単語でしょうか。 国語辞書には「メモ」も「帳」も載っていますが、どうなのでしょうか。 「衆議院議員選挙」の場合はどうでしょう? 「衆議院議員」の「選挙」なのだから二つでしょうか。 「衆議院」の「議員」の「選挙」でしょうか。 おそらくどちらも正解ですし、一単語としても間違いではないように思えます。 などなど、日本語の文章表現というのは複雑すぎて、 単語単位で(使用者の意図に合わせて)仕訳けられる AIやエンジンがほとんど無いのです。 というわけで、疑問に端的にお答えするなら 「シェア・フリー問わず、そのようなソフトはほとんど存在しない  増して、日本語表記の揺れや曖昧さを使用者の判断に委ねることを考えると  『瞬時に』それを判断して表示するソフトは現状では在り得ない」 というのが結論です。 なお、英語の文章や質問文中で例示されている程度の対象であれば エクセルなどの表計算ソフトで何とでもなるところです。  ※英単語(特に動詞や代名詞)の活用形については工夫が必要ですが。

dtmdaw
質問者

お礼

ありがとうございます。 難しい理由が具体的に分かったので、諦めがつきました。 なんとか手動で対応しようと思います。

その他の回答 (2)

  • kteds
  • ベストアンサー率42% (1882/4440)
回答No.2

メモ帳ではそのような機能はありません。 普通のブラウザでテキストファイルを開いて「検索」すればいいです。 添付画像はIE(インターネット エクスプローラ)での 検索:カヌーの例です。 瞬時に「一致件数」を表示してくれます。 「一致場所(どこにあるのか)」をマーカーで表示してくれます。

dtmdaw
質問者

お礼

ご回答ありがとうございます。 検索すべきワードが数千ほどありますので、 1つ1つのチェックが不可能な状態です。 その文章を開いたら、あとは少し操作するだけで、 例えば全文章中で「2文字以上の単語」の重複をチェックする機能など、 あるソフトや方法がないかと探しています。 例えばこのページの文章では、 https://ja.wikipedia.org/wiki/%E3%83%8B%E3%83%A5%E3%83%BC%E3%83%A8%E3%83%BC%E3%82%AF%E3%83%BB%E3%83%A4%E3%83%B3%E3%82%AD%E3%83%BC%E3%82%B9 「メジャーリーグ」が10件、 「ニューヨーク」が52件、 「スタジアム」が16件、 ヒットしますが、他にも多数、複数ある単語があるはずです。 このように、文章中に1つではなく、複数ある単語を全て一度に、 ハイライトするなどして、何らかの方法で示すことはできないでしょうか?

  • 9133313
  • ベストアンサー率19% (266/1349)
回答No.1

メモ帳、秀丸、などのテキストエディタでは、無理なのでは? と思います。 表計算ソフトから行の並べ変えも行えますが・・・

dtmdaw
質問者

お礼

わざわざ表まで作っていただいて、ありがとうございます。 取り急ぎお礼申し上げます。 やはりメモ帳では無理そうだということですので、 画像のOpenOfficeやエクセルなども含めて調べていこうと思います。