英语词汇与阅读基本关系梳理:使用频率、总词汇量与应用的关联!
英语词汇的数量与频率
英文的总词汇量一直在增加,目前已经突破20亿。这是字母文字不可避免的演化路线。但是不必惊慌,英语母语人士,受过高等教育的绝大多数在20000-35000词汇之间。分析词汇,只看总数不看频率同样是不可取的。
我们先从量上来探讨,testyourvocab网站是主流测试英语词汇量的重要参考,根据他们的大数据总结:
8岁英语母语测试者可以掌握10000个词汇。包含主动与被动词汇。
4岁普遍达到了5000词汇。
24 岁左右的成年人词汇量中位数接近 25000,考虑到词汇测试的误差,这一数字应该落在 20000 到 25000 区间。
大多数成年英语母语测试者词汇在20000-35000之间。
在50岁的时候,只有10%人词汇量突破了40000.因此可以看出,成年后词汇量增长是很缓慢的,4-18岁是词汇增长最迅猛的时期,这个时期基本是在接受教育。成年后增长量明显变缓。
比单词数量更重要的是频率
在量上有个基本认识之后,我们再谈使用频率频率。testyourvocab网站采用的词库是BNC,书面语占90%,口语占10%。英国国家语料库针对英语词频统计给出了一个 BNC 15000 词表:前 6000,前 8000,前 10000,前 12000 以及前 15000 个单词。
可能有人会疑惑,他们20000-35000的词汇量是怎么回事?这就涉及到单词数量的划分,比如一个动词,有ing形式,有过去式,还有过去分词。词性加上变形规则,是算一个词还是多个词?网站词汇量测试采用的是抽样调查,并不是绝对精准,一一比照。
主动词汇是可以熟练应用的,被动词汇是能听懂,能读懂的单词,母语人士的主动词汇量也是低于被动词汇量的。比如一个单词,可以通过上下文知道意思,就是被动词汇。总词汇量是把主动与被动都纳入了统计中。
兼顾数量与频率的分类
COCA 是目前最具权威、流行最广,也最具实用价值的一份英语词汇学习库,是美国国家语料库。根据使用频率形成了3 个量级的词汇表,分别包含 5000,20000 和 60000 个单词。
柯林斯五星词频来自于“柯林斯高阶双解学习词典”,这本词典对每个单词都进行了标记,从 0 到 5 共六个星级别。共 14600 词。
五星 680 词。
四星 1040 词(累计 1720 词)
三星 1580 词(累计3300词)
二星 3200 词(累计6500词)
一星 8100 词
0 星 22480 词。
麦克米伦高阶英汉双解词典,收录了大约 10 万左右的词汇量,并对这些词汇做了分级处理。
属于7500核心词汇的统一以红色字体呈现,并继续分为三个等级,每个级别 2500 个词:一级是最最常用的词,标注三个非常醒目的星号 ★★★;二级常用词标注两个红星 ★★;三级标注一个红星 ★。
词汇量与阅读的关系
国外语言学家 Laufer 在 1997 年的研究表明二语读者需要掌握文章中所有词汇的 95%,才能对文章获得大致地理解。另一位研究者 Carver [指出,对于英语母语者,词汇覆盖率也要达到 98%-99% 才能充分理解文本。
读懂《经济学人》所需词汇量为例,《经济学人》的 36 万多词文本中,只有 92.57% 的单词落在 BNC 词表中前 8000 词区间中。也就是说,假如你的词汇量是 8000,那么你只能读懂《经济学人》文本的 92.57%。
如果你的词汇量达到了 10000,可以读懂 95.05% 的《经济学人》。
词汇量达到了 15000,你的词汇覆盖率会上升到 97.92%,基本达到了充分理解的程度。
英国《卫报》有一项研究认为:
最常用的2000个单词覆盖了79.7%的英文材料,最常用的3000单词及变形的覆盖率达到84%。
最常用的4000单词及变形的覆盖率为86.7%。
当词汇量增加到5000时,覆盖率为88.6%。
美国语言学家 Alexander Arguelles 认为:250个单词构成一门语言最基础的核心,没有这些词你无法组合句子。
750个单词构成每个人每天说话会用到的词汇。
2500个单词应该可以让你说出任何你想表达的内容,但不精准优美。
5000个单词构成教育水平一般的母语使用者的积极词汇量。
10000个单词构成有较高教育水平的母语使用者的积极词汇量。
20000个单词可以使你几乎无障碍地阅读、理解和享受文学作品。
我们要在数量、频率和自己掌握目标三者之间进行权衡,寻求最佳路线。
英语母语成年人词汇量由4-15岁的阅读习惯决定,这就是阅读的重要性,无论是中文还是外语,词汇量增长最佳方式,阅读!
阅读量大的儿童,每天都可以学到4.1个新词汇。阅读量一般的儿童每天学习2.6个,基本不阅读的,每天也能增长1.4个。但是到成年时,差距非常大。
有阅读习惯的成年人,每天也可以增加1个词汇,成年人和成年人也是不同的。
我们以RAZ《牛津树》来分析,从aa到Z1,总词汇量包含18000.读完G,就有2000词汇了,这一套针对英语母语的分级阅读,当然我们也可以读。这套儿童青少年读物,就可以完成词汇量增长与阅读理解能力的培养。
综上所述,词汇量要在基准线上才能自由运用,增长词汇量最佳的方式是阅读,高频率的词汇对于我们学外语的人更有意义!阅读习惯培养期在4-15岁,这个时期不喜欢读书,成年后基本也不会大量阅读!
#2023我们一起跨年#