データベースで英単語を検索したり比較して照合したい
データベースに関して素人です(excelの関数を多少扱える程度)が、これから勉強したいと思っています。当方、英語の勉強のため、英文を沢山読んでいます。
以下の目的のためには、データベースの導入が必要なのではと思いますが如何でしょうか。
目的1 これまで覚えた英単語や英熟語(慣用表現)の数を視覚的に分かるようにしたい。
目的2 新しく用意した英文テキストに対して、過去のデータベースと照合しこれまで覚えた英単語や英熟語(慣用表現)がいくつ含まれているか、そしてその既出の単語が過去のどのテキストファイルに属しているか、分かるようにしたい。
※これまで勉強してきた全ての英文テキストデータ(ワード形式、もしくはtext形式)が手元にあるものと仮定します。
上記の目的を遂げるためには、データベースの構築が必要と思うのですが、
当方なかなか忙しく、PHPプログラミングを一から学ぶ余裕がありません。
上記の動作を実現するには高度なデータベース技術が必要とされるでしょうか?
上記の目的のためには、初心者は何から始めればよいでしょうか。
マイクロソフトのデータベースソフト「アクセス」は初心者でも基本的な動作を学ぶだけで上記の目的を達成できるでしょうか?
たとえば、What would you like to drink? /No, I’m cool.と書かれた英文テキストファイル1があると仮定します。ただしこのとき、No, I'm coolの部分は「いいえ、結構です」という意味の慣用的表現(熟語)です。このテキストファイル1をデータベースに投げ込むと、自動でwhat, would, you, like, to, drink, no, I am coolという9つの英単語データが独立して自動的に登録される一方、「No, I am cool」の部分は自分で登録しなければならない、という認識であっておりますか。そしてI am Japanese.と書かれた新規テキストファイル2に対して過去のデータベースと照合した時、「i と am の2単語を検出しました。『i』はテキストファイル1、『am』はテキストファイル1で検出されました。」という結果を出したいのです。
まさかとは思いますが、データベース構築の際、英文テキストの英単語を1つ1つセルに打ち込んで、1つ1つ登録しないといけない、なんてことはないと思いますが、実際どうなのでしょうか。英文をペースト(貼り付け)すれば、その中の単語が自動的に1つずつデータベースに登録されますか?勿論、英熟語(慣用表現)につきましては、コンピューターがそれを熟語と認識できないはずなので、1つずつ手入力で登録していく必要があると思いますが。 長文となりましたが、是非貴方様の御意見をお聞かせ下さい。
お礼
ありがとうございます。ただ、数千個じゃなくて2万3千以上ありますね。 ちょっと多すぎですが、まだましですね。