• ベストアンサー

日本語と英語は全部で何語?

日本語と英語は全部で何語あるのでしょうか? また、日常的に使われている (人それぞれなので難しいのは重々承知) のは何パーセントぐらいでしょうか? もしかしてそんな研究されてないのかも・・・ よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • SPS700
  • ベストアンサー率46% (15297/33016)
回答No.2

    まず定義から参りましょう。ある言葉の辞書に入っているのを「語数」、そういったものを抽出するのは広い資料が必要で、これは「サンプル数」です。 1。  サンプル数     国立国語研究所の言語コーパスは、その例で、#1さんのおっしゃるとおりです。これには、現代の日本語の書き言葉の全体像を把握できるように集められたサンプルが約1億語収録されています。 2。語数     日本語の大きな辞書には数種ありますが、『日本国語大辞典』二版には、下記によりますと約5万項目が収録されています。     http://www.nikkoku.net/introduction/index.html     英語の場合、オックスフォード辞書では、約25万語、となっています。      http://oxforddictionaries.com/words/how-many-words-are-there-in-the-english-language 3。日常使う語数     日本語の1例を挙げますと下記のようになっています。 小学生レベル: 5千~2万語 中学生レベル: 2万~4万語 高校生レベル: 4万~4万5千語 大学生レベル: 4万5千~5万語     http://www.kanshin.com/keyword/373133     英語の1例では、高校卒で5,000語、大学卒で8,000語となっています。      E.B. Zechmeister, A.M. Chronis, W.L. Cull, C.A. D'Anna and N.A. Healy, Growth of a functionally important lexicon, Journal of Reading Behavior, 1995, 27(2), 201-212 4。 障害物     いちばんの障害は、「語」の概念です。人によって語数の数え方が違うのではないかと思います。日本では、「枚数」とか「字数」のほうがよく使われるのも理由のあることだと思います。     また大切なのは個人差でしょう。年齢、地域、職業、学歴などで違うのはもちろんですが、同じ人でも、国家試験の前と後では、かなりの違いがありそうです。 5。  パーセンテージは割り算や掛け算をすればいい訳ですが、意味の無い数字を意味の無い数字で割ったり掛けたりてもあまり大した結果にはなりませんから、、、

timespace
質問者

補足

1.ふむ 2.コーパスだと1億なのに辞書レベルだと5倍違うのですね。この差異は興味深いです。 3.日常語数になると日本語5万で英語8千と2番と逆転してしかも約5倍 これも注目すべてき点ですね 4.ふむ 5.ふむ ありがとうございます。とても興味深かったです。 といっても研究できるほどの器量は私にはないので ただ、ふむふむ言うしか能が無いです。あはは、

その他の回答 (3)

  • toast5
  • ベストアンサー率37% (239/638)
回答No.4

感嘆詞、擬音語擬態語、外来語、方言、省略語、合成語、顔文字なんかをどうするか(例えば「新婚」を一語、「旅行」を一語と数えるとして、じゃあ「新婚旅行」もそれとは独立の一語とカウントするのか、するとしたら「出張旅行」「傷心旅行」も一語なのか、「グルメ旅」はどう判断するか、「コンピューター」が一語だとして「コンピュータ」はどうするんだ、とか)、などなど、どう定義しようが数え方に議論の余地は残るので、客観的に数えるのは不可能だと思います。 が、「英語」「中国語」「やまと言葉」で比べたら、やまと言葉は圧倒的に少ないでしょうね。何語あるかは知りませんが。 http://dragox.exblog.jp/17932056/

  • SPS700
  • ベストアンサー率46% (15297/33016)
回答No.3

    #2です。補足です。 >> 1.ふむ 2.コーパスだと1億なのに辞書レベルだと5倍違うのですね。この差異は興味深いです。 3.日常語数になると日本語5万で英語8千と2番と逆転してしかも約5倍 これも注目すべてき点ですね 4.ふむ 5.ふむ 1。  コーバスと辞書の語数 ちょっと1と2の差について、コーパスと言うのは下記のように言語資料です、     http://eow.alc.co.jp/search?q=corpus     ですから資料の中に「やま」と言う語彙が40回出てくれば1の数は「40」です。しかし字引では「やま」は1語と勘定されます。コーパスの数は「延べ語数」辞書の語数は「異なり語数」です。     言い換えれば、2倍の年月をかけて資料集めをすれば、1の数字は約2倍になりますが2の語数」はあまり変わらないと思います。 2。  日常使う日英の差      これは、単語の定義が無いので当てになりません。日本に、男でなくても「黙って」ビールを飲んでいる人もいれば(日常使う語数はゼロ)、英語圏で yup 「うん」、nope 「いや」の2語ですます人もいます。 3。     僕は或る言語の語数は、万単位、日常使う語数は千単位だと思います。

回答No.1

良い質問です。ナイス好奇心! 国立国語研究所が開発した「現代日本語書き言葉均衡コーパス」の収録語数は約1億語だそうです。 http://www.kotonoha.gr.jp/shonagon/ 英国のBritish National Corpusでも1億語(100 million word collection )を収録しているそうです。 http://www.natcorp.ox.ac.uk/ 不思議なことに、両方ともなぜか、1億語で一致しています。 日常生活で使われている単語についても、国立国語研究所がいろいろな調査をしています。 例えば、常用漢字表は、そんな調査の成果を踏まえて決められています。 外国人のための言語教育で使われる単語帳は、日本語でも英語でも、だいたいが数千語です。 多めに1万語だとして、1万語/1億語は、1万分の一ですから、0.01%です。 日本語については、以下のウェブページを参考にしてください。 http://www.p.u-tokyo.ac.jp/sokutei/pdf/vol06/p168-186.pdf http://dspace.wul.waseda.ac.jp/dspace/bitstream/2065/28525/8/Honbun-4454_05.pdf http://language.tiu.ac.jp/jlem2006.pdf http://www.ninjal.ac.jp/archives/nihongo-syllabus/seika/pdf/yoko_kaneda_080309.pdf

timespace
質問者

補足

1億・・・古語や国字など全部入れるとそんな事になるんですね ありがとうございます。

関連するQ&A