| Home |
下のグラフと表は、各言語の使用頻度の順位で上位n番目までの語彙が一般的なコミュニケーションにおける語の何%を占めているかを示したものである。以下では、データ元の文献に従い、この割合を「カバー率」と呼ぶ。

(クリックで拡大)
(出所)玉村文郎編(1989・90)『日本語の語彙・意味』(上・下)明治書院、占部匡美「日本語教育史における入門期教科書の基礎語彙I」福岡国際大学紀要No.252581~87(2011)掲載データから作成。
カバー率は、おおまかに言えば、ある語彙数でその言語をどの程度理解できるかを示している。
調査主体も言語構造も異なっているのでシリアスな比較には適さないが、それでも大きな傾向のようなものを受け取ることはできる。
一見してわかるように、カバー率は言語によってかなり異なる。
たとえばフランス語では頻度順上位1000語、英語、スペイン語はもとより、ロシア語、中国語、朝鮮語でも2000語を知っていれば約8割理解できるが、日本語では同じ水準になるのに上位5000語が必要になる。
上位3000語をマスターすれば、フランス語、英語、スペイン語では約9割が理解できるが、日本語では(上のグラフにはないが)同じ水準になるのに上位1万語が必要になる。
他人事を決め込めば「日本語を外国語として学ぶ人は大変だなあ」という感想も出てきそうだ。
※ もっともカバー率の高さは、習得の容易さに直結しない。カバー率が高いと、一つの語の受け持ち範囲が広くなる。とくに頻出の基礎語彙の語義・用法が広がり、単語の組み合わせた成句表現の比重も増える。どちらも日本の外国語学習者が苦手とするところである。
逆に「外国語を話す/書く日本語話者」として考えてみれば、たとえば英語(やほかの外国語)でどう言えばいいのかウンウン考えても思いつかず、尋ねたり調べたりすると、実にあっさりとした簡単な表現になることに驚いた体験に、別の光が当たる。
たとえば日本語で頻出順でいえば9000~10000語レベルの「手本」「判例」「駆け引き」「選抜」「裏口」に相当する英単語「model / example」「precedent」「tactics」「selection」「back door」を
VocabProfiler(http://www.lextutor.ca/vp/eng/)という語彙水準判定サイトで調べると
「model」「example」「tactics」「back」「door」は、頻出順500語の中にあり、「precedent」「selection」は頻出順2000語以内には無いものの、学術共通語彙を集めたAWL (Academic Word list 570words)にはしっかり含まれている(「selection」はSublist 2に、「precedent」はSublist6に)ことが分かる(いずれも活用形、派生形を整理したワードファミリーで判定している。たとえばAWL (Academic Word list 570words)のSublist 2にエントリーされているのは「select」、Sublist 6にエントリーされているのは「preceding」)。
※ ちなみに「英文語彙難易度解析プログラム」(http://www.someya-net.com/wlc/index_J.html)で調べると、上記の単語は、アルクの「標準語彙水準SVL12000」(SVL=Standard Vocabulary List)では、「back」「door」がLV1(1000語レベル)、「model」「example」がLV(2000語レベル)、「selection」がLV3(3000語レベル)、「precedent」がLV9(9000語レベル)、 「tactic」はLV9(10000語レベル)となる。
AWL (Academic Word list 570words)については、先の記事(570の学術系英単語を5クリックで覚える表 読書猿Classic: between / beyond readers
)を参照。
しかし1000語レベル、2000語レベル……といっても、どれくらいの単語が登場するかイメージしづらいので、以下に各言語について、頻度別単語リストのリンクとそこから拾った単語サンプルを示す。
フランス語
1000語レベル groupe(グループ), gouvernement(政府), position(配置), technologie(テクノロジー), parler(話す)
2000語レベル consommateur(消費者、客), commander(命令する、強いる), niveau(水準、高さ、階層), réserve(貯え、制限、慎重), limite(境界、はて、極限)
3000語レベル fournisseur(商人、供給者), raconter(語る), version(自国語訳、解釈), acheteur(買手、客), intégré(清廉潔白な)
4000語レベル anniversaire(記念日、誕生日), exemplaire(冊、部、通;、写し), peinture(絵画、塗料、描写), appliquer(はり付ける、 押しあてる), livrer(引き渡す、密告する)
5000語レベル filet(網、微量), fixer(固定する、集中する), pression(圧力), réalisation(実行、実現、作品), inviter(招待する、促す、頼む)
(頻度順単語リスト)
* top 2000 words http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/1-2000
* Wiktionary:French frequency lists/2001-4000 http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/2001-4000
* Wiktionary:French frequency lists/4001-6000 http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/4001-6000
英語
1000語レベル very(とても), white(白), model(モデル、型), store(店), firm(会社、固定した)
2000語レベル customer(客), understanding(理解), search(探す), currently(現在は), check(阻止する、照合する)
3000語レベル review(再考する、書評), sauce(ソース), smoke(煙), cabinet(内閣、キャビネット), defensive(防御的な)
4000語レベル purchase(購入する), transformation(変換、変質), exclude(排除する), virtual(実質上の), destination(行き先)
5000語レベル juror(陪審員), creativity(創造性), proclaim(公表する、公布する), bulk(体積、大きさ), ridge(尾根、分水嶺)
(頻度順単語リスト)
・Corpus of Contemporary American English (COCA) (http://www.americancorpus.org)
における頻出順リストWord frequency lists
http://www.wordfrequency.info/files/entriesWithoutCollocates.txt
スペイン語
1000語レベル mejor(すぐれた), saber(知っている), tener(持っている), demás(その他), interesante(面白い)
2000語レベル estación(駅), servir(仕える), inmediatamente(すぐに), seguir(ついていく、追う), criminal(犯罪の)
3000語レベル olvidar(忘れる), resolver(解決する、決意する), explicación(説明), buscar(探す、迎える), salir(出る、現われる)
4000語レベル encantar(魅惑する), patrón(主人、経営者、パトロン), cadáver(死体), preguntar(問う), imaginar(想像する)
5000語レベル tabaco(タバコ), casar(調和させる、組合せる), admirar(ながめる、感心する), derrota(敗北、挫折), técnicamente(技術的に)
(頻度順単語リスト)
* 1-1000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish1000
* -2000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish1001-2000
* -3000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish2001-3000
* -4000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish3001-4000
* -5000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish4001-5000
ロシア語
1000語レベル дом(家、住居、家族), поэтому(だから), лучший(より良い), московский(モスクワの), плакать(泣く、嘆く)
2000語レベル курить(喫煙する), настроение(気分;機嫌), поиск(探求、捜索), плащ(レインコート), убитый(殺された人、死者)
3000語レベル погода(天気、天候), склон(傾斜), оторвать(もぎ取る、剥がす、引き離す), характерный(特徴的な), транспорт(交通)
4000語レベル пуговица(ボタン), жуткий(怖い、ひどい), непосредственно(直接的に), пробить(穴をあける), беречь(大事にとっておく;胸にしまっておく)
5000語レベル покойник(死者), стоп(やめろ、もういい), отвращение(不快感、嫌悪), купец(商人), знакомый(知っている、知り合いである)
(頻度順単語リスト)
* 1-1000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_1-1000
* 1001-2000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_1001-2000
* 2001-3000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_2001-3000
* 3001-4000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_3001-4000
* 4001-5000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_4001-5000
中国語
1000語レベル 特(特別である、わざわざ), 等等(など), 纳(納める、採る), 口(口、喋ること), 放下(下に置く、放棄する)
2000語レベル 疑(疑う、疑わしい), 時候(時刻、時間), 厅(ホール、部門), 士兵(下士官と兵卒), 佬(男、男子)
3000語レベル 剛才(たった今), 特殊(特殊である、特別扱いする), 不怕(怖くない、たとえ), 作家(作家、倹約), 蜘蛛(クモ)
4000語レベル 尘(ちり、少しの), 珍珠(真珠), 洗澡(入浴する), 月前(先月), 问题(問題、トラブル)
5000語レベル 形象(形姿.様相、具体的に), 准備(準備する、予定する), 指控(非難して訴える), 仔細(注意深い), 說是(~ということである)
(頻度順単語リスト)
Simplified Chinese – zh-CN http://invokeit.wordpress.com/frequency-word-lists/
朝鮮語
1000語レベル 시간(時間), 떨어지다(落ちる、離れる), 존재(存在), 농업(農業), 텔레비전(テレビ)
2000語レベル 부모님(両親), 단지(単に), 본격적(本格的), 강(川), 담당(担当)
3000語レベル 한꺼번에(一度に、一緒に), 둥지(巣), 죄송하다(申し訳ない), 사원(寺院、社員), 헤아리다(数える、察する)
4000語レベル 헤매다(さまよう), 묘사하다(描写する), 제안하다(提案する),뚜껑(ふた、帽子), 나아지다(よくなる、向上する)
5000語レベル 웬만하다(まあまあだ), 열중하다(熱中する), 들여놓다(入れておく、持ち込), 일손(人手、腕前), 생활환경(生活環境)
(頻度順単語リスト)
http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Korean_5800
日本語
1000語レベル みんな, 料理, 眼鏡, 訳(わけ), 眠る
2000語レベル 真ん中, らしい, 曲(きょく), 詰まる, 超える
3000語レベル 生命, 過程, 書類, 主に, 圧倒
4000語レベル 苦しむ, 所属, 平等, 担う, 相対(そうたい)
5000語レベル 歓迎, 固有, 歩む, さりげない, 分解
6000語レベル 給(たま)う, 染まる, 物語る, 傾(かし)げる, 系列
7000語レベル ふざける, 酸化, 吊るす, 当方, 狡(ずる)い
8000語レベル 埋もれる, 偲(しの)ぶ, 噛み締める, 法定, 追いやる
9000語レベル 混同, 断然, 高々, 宿る, 鷲(わし)
10000語レベル 手本, 判例, 駆け引き, 選抜, 裏口
(頻度順単語リスト)
日本語を読むための語彙データベース Ver. 1.1 http://tatsuma2010.web.fc2.com/

(クリックで拡大)
(出所)玉村文郎編(1989・90)『日本語の語彙・意味』(上・下)明治書院、占部匡美「日本語教育史における入門期教科書の基礎語彙I」福岡国際大学紀要No.252581~87(2011)掲載データから作成。
カバー率は、おおまかに言えば、ある語彙数でその言語をどの程度理解できるかを示している。
調査主体も言語構造も異なっているのでシリアスな比較には適さないが、それでも大きな傾向のようなものを受け取ることはできる。
一見してわかるように、カバー率は言語によってかなり異なる。
たとえばフランス語では頻度順上位1000語、英語、スペイン語はもとより、ロシア語、中国語、朝鮮語でも2000語を知っていれば約8割理解できるが、日本語では同じ水準になるのに上位5000語が必要になる。
上位3000語をマスターすれば、フランス語、英語、スペイン語では約9割が理解できるが、日本語では(上のグラフにはないが)同じ水準になるのに上位1万語が必要になる。
他人事を決め込めば「日本語を外国語として学ぶ人は大変だなあ」という感想も出てきそうだ。
※ もっともカバー率の高さは、習得の容易さに直結しない。カバー率が高いと、一つの語の受け持ち範囲が広くなる。とくに頻出の基礎語彙の語義・用法が広がり、単語の組み合わせた成句表現の比重も増える。どちらも日本の外国語学習者が苦手とするところである。
逆に「外国語を話す/書く日本語話者」として考えてみれば、たとえば英語(やほかの外国語)でどう言えばいいのかウンウン考えても思いつかず、尋ねたり調べたりすると、実にあっさりとした簡単な表現になることに驚いた体験に、別の光が当たる。
たとえば日本語で頻出順でいえば9000~10000語レベルの「手本」「判例」「駆け引き」「選抜」「裏口」に相当する英単語「model / example」「precedent」「tactics」「selection」「back door」を
VocabProfiler(http://www.lextutor.ca/vp/eng/)という語彙水準判定サイトで調べると
「model」「example」「tactics」「back」「door」は、頻出順500語の中にあり、「precedent」「selection」は頻出順2000語以内には無いものの、学術共通語彙を集めたAWL (Academic Word list 570words)にはしっかり含まれている(「selection」はSublist 2に、「precedent」はSublist6に)ことが分かる(いずれも活用形、派生形を整理したワードファミリーで判定している。たとえばAWL (Academic Word list 570words)のSublist 2にエントリーされているのは「select」、Sublist 6にエントリーされているのは「preceding」)。
※ ちなみに「英文語彙難易度解析プログラム」(http://www.someya-net.com/wlc/index_J.html)で調べると、上記の単語は、アルクの「標準語彙水準SVL12000」(SVL=Standard Vocabulary List)では、「back」「door」がLV1(1000語レベル)、「model」「example」がLV(2000語レベル)、「selection」がLV3(3000語レベル)、「precedent」がLV9(9000語レベル)、 「tactic」はLV9(10000語レベル)となる。
AWL (Academic Word list 570words)については、先の記事(570の学術系英単語を5クリックで覚える表 読書猿Classic: between / beyond readers

しかし1000語レベル、2000語レベル……といっても、どれくらいの単語が登場するかイメージしづらいので、以下に各言語について、頻度別単語リストのリンクとそこから拾った単語サンプルを示す。
フランス語
1000語レベル groupe(グループ), gouvernement(政府), position(配置), technologie(テクノロジー), parler(話す)
2000語レベル consommateur(消費者、客), commander(命令する、強いる), niveau(水準、高さ、階層), réserve(貯え、制限、慎重), limite(境界、はて、極限)
3000語レベル fournisseur(商人、供給者), raconter(語る), version(自国語訳、解釈), acheteur(買手、客), intégré(清廉潔白な)
4000語レベル anniversaire(記念日、誕生日), exemplaire(冊、部、通;、写し), peinture(絵画、塗料、描写), appliquer(はり付ける、 押しあてる), livrer(引き渡す、密告する)
5000語レベル filet(網、微量), fixer(固定する、集中する), pression(圧力), réalisation(実行、実現、作品), inviter(招待する、促す、頼む)
(頻度順単語リスト)
* top 2000 words http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/1-2000
* Wiktionary:French frequency lists/2001-4000 http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/2001-4000
* Wiktionary:French frequency lists/4001-6000 http://en.wiktionary.org/wiki/Wiktionary:French_frequency_lists/4001-6000
英語
1000語レベル very(とても), white(白), model(モデル、型), store(店), firm(会社、固定した)
2000語レベル customer(客), understanding(理解), search(探す), currently(現在は), check(阻止する、照合する)
3000語レベル review(再考する、書評), sauce(ソース), smoke(煙), cabinet(内閣、キャビネット), defensive(防御的な)
4000語レベル purchase(購入する), transformation(変換、変質), exclude(排除する), virtual(実質上の), destination(行き先)
5000語レベル juror(陪審員), creativity(創造性), proclaim(公表する、公布する), bulk(体積、大きさ), ridge(尾根、分水嶺)
(頻度順単語リスト)
・Corpus of Contemporary American English (COCA) (http://www.americancorpus.org)
における頻出順リストWord frequency lists
http://www.wordfrequency.info/files/entriesWithoutCollocates.txt
スペイン語
1000語レベル mejor(すぐれた), saber(知っている), tener(持っている), demás(その他), interesante(面白い)
2000語レベル estación(駅), servir(仕える), inmediatamente(すぐに), seguir(ついていく、追う), criminal(犯罪の)
3000語レベル olvidar(忘れる), resolver(解決する、決意する), explicación(説明), buscar(探す、迎える), salir(出る、現われる)
4000語レベル encantar(魅惑する), patrón(主人、経営者、パトロン), cadáver(死体), preguntar(問う), imaginar(想像する)
5000語レベル tabaco(タバコ), casar(調和させる、組合せる), admirar(ながめる、感心する), derrota(敗北、挫折), técnicamente(技術的に)
(頻度順単語リスト)
* 1-1000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish1000
* -2000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish1001-2000
* -3000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish2001-3000
* -4000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish3001-4000
* -5000 http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Spanish4001-5000
ロシア語
1000語レベル дом(家、住居、家族), поэтому(だから), лучший(より良い), московский(モスクワの), плакать(泣く、嘆く)
2000語レベル курить(喫煙する), настроение(気分;機嫌), поиск(探求、捜索), плащ(レインコート), убитый(殺された人、死者)
3000語レベル погода(天気、天候), склон(傾斜), оторвать(もぎ取る、剥がす、引き離す), характерный(特徴的な), транспорт(交通)
4000語レベル пуговица(ボタン), жуткий(怖い、ひどい), непосредственно(直接的に), пробить(穴をあける), беречь(大事にとっておく;胸にしまっておく)
5000語レベル покойник(死者), стоп(やめろ、もういい), отвращение(不快感、嫌悪), купец(商人), знакомый(知っている、知り合いである)
(頻度順単語リスト)
* 1-1000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_1-1000
* 1001-2000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_1001-2000
* 2001-3000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_2001-3000
* 3001-4000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_3001-4000
* 4001-5000 http://en.wiktionary.org/wiki/User:Dart_evader/Russian_4001-5000
中国語
1000語レベル 特(特別である、わざわざ), 等等(など), 纳(納める、採る), 口(口、喋ること), 放下(下に置く、放棄する)
2000語レベル 疑(疑う、疑わしい), 時候(時刻、時間), 厅(ホール、部門), 士兵(下士官と兵卒), 佬(男、男子)
3000語レベル 剛才(たった今), 特殊(特殊である、特別扱いする), 不怕(怖くない、たとえ), 作家(作家、倹約), 蜘蛛(クモ)
4000語レベル 尘(ちり、少しの), 珍珠(真珠), 洗澡(入浴する), 月前(先月), 问题(問題、トラブル)
5000語レベル 形象(形姿.様相、具体的に), 准備(準備する、予定する), 指控(非難して訴える), 仔細(注意深い), 說是(~ということである)
(頻度順単語リスト)
Simplified Chinese – zh-CN http://invokeit.wordpress.com/frequency-word-lists/
朝鮮語
1000語レベル 시간(時間), 떨어지다(落ちる、離れる), 존재(存在), 농업(農業), 텔레비전(テレビ)
2000語レベル 부모님(両親), 단지(単に), 본격적(本格的), 강(川), 담당(担当)
3000語レベル 한꺼번에(一度に、一緒に), 둥지(巣), 죄송하다(申し訳ない), 사원(寺院、社員), 헤아리다(数える、察する)
4000語レベル 헤매다(さまよう), 묘사하다(描写する), 제안하다(提案する),뚜껑(ふた、帽子), 나아지다(よくなる、向上する)
5000語レベル 웬만하다(まあまあだ), 열중하다(熱中する), 들여놓다(入れておく、持ち込), 일손(人手、腕前), 생활환경(生活環境)
(頻度順単語リスト)
http://en.wiktionary.org/wiki/Wiktionary:Frequency_lists/Korean_5800
日本語
1000語レベル みんな, 料理, 眼鏡, 訳(わけ), 眠る
2000語レベル 真ん中, らしい, 曲(きょく), 詰まる, 超える
3000語レベル 生命, 過程, 書類, 主に, 圧倒
4000語レベル 苦しむ, 所属, 平等, 担う, 相対(そうたい)
5000語レベル 歓迎, 固有, 歩む, さりげない, 分解
6000語レベル 給(たま)う, 染まる, 物語る, 傾(かし)げる, 系列
7000語レベル ふざける, 酸化, 吊るす, 当方, 狡(ずる)い
8000語レベル 埋もれる, 偲(しの)ぶ, 噛み締める, 法定, 追いやる
9000語レベル 混同, 断然, 高々, 宿る, 鷲(わし)
10000語レベル 手本, 判例, 駆け引き, 選抜, 裏口
(頻度順単語リスト)
日本語を読むための語彙データベース Ver. 1.1 http://tatsuma2010.web.fc2.com/
- 関連記事
-
- 根気も時間もないあなたが外国語習得の臨界点を越える一番ゆるいスタートアップの方法
- ランドセルは軍用だった→あなたが知らずに話しているオランダ語
- そのボキャブラリーでどこまで理解できるのか?/英、仏、西、露、中、朝、日語の頻出順単語リストとカバー率
- 日本の英語教育が落っことしがちな英単語最頻出2000語を7クリックで覚える表
- 97冊から選りすぐり→外国語学習の成功者たちがやったことまとめ
| Home |