あなたの語彙数は?~語彙力測定ツール①~


語彙③
あなたの語彙数は? ~語彙力測定ツール①~

自分はいったい英単語を何語くらい知っているのか、ふと気になることがあります。
また、その語彙力が多いのか少ないのかという情報も、英語学習を続ける上で重要になります。
もちろん、英語を使う時に不自由を感じなければ、語彙が多かろうが少なかろうが関係ありませんが、自分の語彙力を客観的に知ることもたまには良いことなのではないかと思います。
今回は、しっかりとした研究を基にして作成されている語彙力測定ツールの1つを紹介します。

V-Check Test

V-Check Testは気軽に語彙数を測定できるものです。
これは、文章の99%をカバーするとされている頻出13,384語のうち何語を知っているかを測定するもので、2つのパートから成り立っています。
1つ目のパートは、英単語が1語ずつ文脈なしに表示されて、その意味を知っているかどうかをYes / Noで答えていくものです。適当に答えることを防止するために実際には存在しない単語も混ぜられていて、存在しない単語で2度Yesを選ぶと、その時点で測定終了となってしまいます。
私が調査したところ、存在しない単語の割合は約4割でした。

2つ目のパートは、英単語がやはり文脈なしに表示され、その意味を3つの選択肢から選ぶ、というものです。
これによって、Yes / Noによる推測のエラーの幅が少なくなるようです。
この2つのパートが交互に繰り返され、一定の段階までいくと、測定終了となります。所要時間は約5分です。

しくみ

私はこのテスト作成に関わった人から講義を受けたことがありますが、かなりの手間をかけて作られたテストのようです。
基本的なしくみは、まず膨大な英語のデータベース(総語数8億語以上)から頻出の数万語を選び、それぞれの単語を頻度順に並べます。
そして、英語学習者やV-Check Test受験者の数多くのデータを基に、ある単語を知っている人が、別の特定の単語を知っている可能性を推測します。

例えば、anthropologyという単語を知っている人は、おそらく中学で習うレベルの単語はほぼ全てわかるでしょう。
逆にanthropologyを知らない人は、それよりも難しい(頻度の低い)単語、例えばanglerという単語の意味を知っている可能性は低いはずです。
その可能性をコンピューターが推測して、語彙数を決定します。

単語の数え方

V-Check Testでは、base wordという考え方で単語を数えています。
base wordは、1つの中心となる語と、そこから派生するいくつかの語で成り立っています。
しかしword familyの場合とは異なり、学習者が、中心となる語から推測できない可能性が高い語は別の語として数えられます。
この数え方だとword familyで数えるよりも1語とみなされる単語のグループは小さくなります。

例えば、accept, accepts, accepting, acceptable, acceptance, unacceptableは、word familyで数えると同じ種類の語ですが、base wordの考え方で数えると4語(accept, accepts, acceptingが1つのグループ、残りは別の語)となります。
その結果、語彙サイズはword familyで数える場合よりも25%程度多く出るようです。
つまり、計算上ではword familyで数えて4,000語知っている人は、base wordで数えると5,000語知っていることになります(Browne & Culigan, 2007)。

問題点

V-Check Testは気軽にできるという長所がある反面、一つ問題点があります。
Yes / Noだけで答える場合、本当にその人が単語の意味を知っているかまでは測定できない、ということです。
研究によると、このようなYes / Noで答える問題は、人によって答え方が異なることがわかっています。

考えられる可能性として、

1. 単語を見たことがありなおかつ意味を知っている時だけYesを選ぶ人
2. 単語を見たことがあるだけでYesを選ぶ人
3. 単語が実在するかどうかだけを判断してYesを選ぶ人

この3パターンが考えられます。
このパターンの違いによって、語彙数の結果にも影響が出てくるのは明らかです。
私は、2011年頃にこの誤差について個人的に実験をしてみました。
1のパターンと3のパターンを試してみた結果、知っている語彙数には2,400語もの差が出ました。

誤差の調整法

では、この誤差はどのようにして調整すれば良いのでしょうか。
V-Check Test受験者の立場でできることは、辞書を用意し、自分が知っていると思った単語はYesを選ぶ前に毎回辞書で意味を確認してみることです。
そして、自分で考えていた意味と異なる場合は、その単語ではNoを選びます。
この作業をYes / Noで問われる全ての単語で行えば、測定の精度を上げることができます。
(3択の問題では単語を見た瞬間に選択肢も見えてしまうので、単語だけの意味をあらかじめ考えるのが難しいと思います。)

一方で、V-Check Test作成側は、3択の問題とその後にある学習モード(有料)で、Yes / Noの誤差を調整しています。
3択問題で出題される単語は、Yes / Noの結果に基づいて、その人がほぼ確実に知っているだろうと考えられるもののみが出題されます。
ここで8割以上正解しない場合は、Yes / Noの判断が不適切だったとみなされ、知っている語彙数が少なく計算されるしくみになっています。

更に、測定が終わって学習モードに進んだ場合、最初に学習する単語は65%の確率で知っている単語から出題されます。
この時に62%以下の正答率しか残せない人は(全体の1割未満のようですが)、Yes/ Noの選択が適切でなかったと判断されます。
ただし、その判断によって語彙数が調整されるかどうかまではわかりません。

こういった調整により、V-Check Testでは、知っている単語(=単語を見ただけで意味を答えられる、または文脈があれば単語の意味がわかる)の数を測定できるようになっています。
この作成者側の調整法に関する情報は全て、テスト作成責任者に直接メールで質問して聞いた内容ですので、信頼性は高いと思います。

V-Check Testで調べた私の語彙数

2012年初めにV-Check Testのシステムの変更があり、それまでのデータはあまり参考にならないようですので、2012年9月に受けた結果についてのみ書いておきます。
この時は辞書を使用し、確実に意味がわかる単語のみをYesにしました。
結果、13,384語中10,445語を知っていることがわかりました。

様々な文章に使われる単語全てのうちの97.61%を知っているという計算になるようです。

この数字は目安となる98%に近いので、個人的にはまずまずではないかと思っています。
一方で語彙数を基にしたTOEICの予想スコアは808点でした。
単語力だけでTOEICスコアを予想するのはなかなか難しい気がします。

V-Check Testは誰でも簡単に受験できますから、ぜひ測定してみてください。
ただし、1つのメールアドレスにつき1度しか受験できませんので、きちんと気持ちの準備をして受けることをおすすめます。