摘 要:世界语言测试理论经历了三代,即前科学语言测试、心理测量一结构主义语言测试或现代语言测试、心理语言学一社会语言学语言测试或后现代语言测试,这三代语言测试理论在我国的各个时代的大规模英语测试题如高考英语试题中都有一定程度的反映。本文拟对世界语言测试理论作一个比较全面的历史回顾性介绍与分析,期望对我国的语言测试理论与实践有一定的参考价值。
关键词:语言测试:语言能力假设;交际语言能力模型
一、前言
随着信息技术、全球经济一体化等的迅速发展,国际交往日益频繁,英语是国际交往的最主要语种。在中国,我们几乎迎来了全民学外语的新世纪,仅基础教育阶段学习英语的青少年、儿童即将超过2亿(张正东,2002)。作为检测英语学习效果和英语水平、促进英语学习的英语测试也面临如何进一步完善的挑战。
尽管现代语言测试的历史不到100年(Spolsk‘y,1995),语言测试的历史渊源似乎可以追溯到《圣经·旧约全书》之《士师记》第l2章的一个故事:两个闪族部落——以法莲人(Ephraimites)和基列人(Gileadites)之间发生大战,基列人打败了以法莲人,基列人然后把守约旦河的渡口以抓获溃逃的以法莲人。岗哨命令欲过河的每个人说shibboleth这个字,此字在希伯来方言中的意思是“谷穗”(也有学者认为是“河流”之意)。以法莲人的语音系统中没有sh/f/这个音素,而会把sh发成/ ,于是,发错了这个音的人就被基列人岗哨识别为敌人而被杀掉,一共有42,000人被杀(Judges12:4-6)。
以上故事还从一个侧面反映了测试和奖惩联系在了一起。现代,我们更强调测试的正面鼓励和激励作用而淡化或者避免其惩罚作用,如在我国教育部2(~33年颁发的《普通高中英语课程标准(实验)》中就有体现。
现代教育测量理论与实践在20世纪初得到了很大的发展,这为以后语言测试理论的发展与成熟奠定了基础。
二、语言测试与教学的关系以及语言测试的必要性
(一)语言测试与教学的关系
在目前全国大力提倡素质教育的大环境下,一些人把教育走向了应试教育的矛头直指考试。但应试教育不是考试的直接结果。作为对学生成绩的评定、在学习过程中的诊断工具,科学的考试始终是需要的,关键是如何正确对待考试,即对考试的结果是正确使用还是误用的问题。若不能正确对待考试,就有可能导致纯粹的应试教育。所谓的应试教育即以考试为中心、以考试为教学目标,这对教学是有阻碍作用的,因为“题海战术”让学生掌握的是应试技巧,而非语言能力本身。然而,测试也可起到推动教学的作用,即可能具有良好的反拔作用(positive backwash effect),如在NMET中增加听力,就能促进听力的培养。世界著名语言测试专家Arthur Hughes曾说,教学与测试是“伙伴关系”(Hughes,1989),他说存在教学合适、合理但测试不佳的情况,这时测试会有消极的反拔作用,但也存在教学不合理而测试能够对之施加正面影响的情形,此时测试就有积极的反拔作用。
语言测试活动本身不能有效地提高学生的语言能力,而必须通过认真的教学提高英语实际运用能力。人们对测试的攻击间接源于教育行政部门或教育机构对考试结果的滥用,如以NMET成绩评价中学和教师的业绩,许多大学把大学公共英语
四、六级考试及格与否与学生能否获得学位简单挂钩,许多行业的高级职称评定与外语挂钩,这些不科学的做法严重损害了语言测试的名声。
另外,对语言测试的认识不正确也是导致一些人盲目否定语言测试的根源之一。如有人认为标准化考试就是选择题,这是对标准化考试的极大误解(杨惠中,1999;董燕萍、王明初2001)。标准化考试的定义是:测验的编制、实施、记分、分数的解释严格按照统一的标准和程序进行,使所有被试的测验条件一致的考试,包括了测验材料、测验实施、评分记分、测验分数解释四个方面的标准化(王孝玲,1989)。目前存在的问题是对多项选择题的设计极其简单,结果导致一些劣质试卷冲击教学。
(二)语言测试的必要性
若正确认识了教学与测试的关系,就会达成考试有必要这一共识。有人认为由于考试的指挥棒作用(即反拔作用)引导学生为考试而学,不利于能力的培养,提出应该淡化甚至取消考试。在现实生活中,我们不会因为乐队演奏得不好去怪罪乐队指挥手中的那根小木棍,考试的指挥棒作用犹如小木棍的作用一样,仅仅是工具而已,关键在于如何改进工具(徐强,2000)。测试的科学化才会减少不良的社会影响,例如假设仅以笔试成绩就可以获得驾驶执照,那么这样的考试设计定会导致许多人死于车轮之下。测试机构为了保证测试的公正性,应该尽力避免设计瑕疵,提高命题质量,提高效度和阅卷信度等。
我国教育部2003年颁发的《普通高中英语课程标准(实验)》明确说:“评价是英语课程的重要组成部分。科学的评价体系是实现课程目标的重要保障。”我们应该澄清一些人对测试的误解,用好不同种类的测试,如在教学过程中多用诊断性测验,其题型完全不必与NMET题型吻合。
三、世界语言测试理论的发展
现代语言测试(1anguage Testing,LT)是随着20世纪初教育测量学的独立与发展而逐渐发展、成熟起来的,它是应用语言学的一个重要分支。很多的语言测试是基于英语语种的,它涉及教学法、二语习得理论、语言学、语用学、心理语言学、认知心理学、教育测量学、计算机科学等。世界著名语言测试专家B.Spolsky于1975、1985年把语言测试理论的发展分为以下三个阶段,而今后将到来的第四个阶段应该是机助自适应语言测试。
(一)第一阶段:前科学语言测试或传统语言测试阶段
语言教学出现后便有了语言测试,目前把20世纪40年代以前的语言测试统称为前科学语言测试(The pre-scientific language testing或traditional LT phase,Wood,1993)。在这个时期,语言教师对于什么是语言这个最基本的问题,没有科学的认识,只是把语言当作一门包括语法知识、词法知识、语音知识的知识体系去教。把语言看作一套知识,是这个时期外语教学和测试体系的语言观的内涵(刘润清,韩宝成,2000)。测试中对技巧、技能的考查没有量度依据,测试结果主要根据教师的主观判断(Heaton,1988)。试题常包括短文写作(essay writing)、翻译(translation)、语法分析(grammatical analysis),这些测试路子(approach)被称为短文写作一翻译路子(the essay-writing translatiOil approach)。此间,听力、口语被认为是额外的、绝不是大纲或测试的组成部分(Heaton,1988)。
(二)第二阶段:心理测量一结构主义语言测试或现代语言测试阶段
20世纪40年代至70年代中期,被学者称为拉多路子阶段(I.ado’S Approach phase)。到了20世纪40年代,人们发现:关于语言规则知识的学习并不等于语言学习。如在第二次世界大战期间,美国军方迫切需要在短时间内培养出大量会说外语的人才,他们发现了传统的语法翻译法等教学方法的局限性。以Bloomfield为首的美国结构主义语言学家第一次提出语言是一套形式结构,是一套习惯(a set of habits)。以Skinner为首的美国行为主义心理学家认为:语言行为是一连串的刺激一反应过程。
因而,语言就是要获得及操作这套符号系统的技能,训练对刺激做出正确反应的一套语言习惯,于是,产生了结构主义教学法,如听说法。在语言测试方法上,汲取了心理语言学领域的心理测量学(psychometrics)的方法,形成了所谓的心理测量一结构主义语言测试(1he psychometric—stmcturalist language testing或modem LT phase)。结构主义语言学家认为语言这套符号系统可以分解为语音、词汇、语法等。19世纪60年代,著名的语言测试权威Lado在其经典著作《语言测试》(Language Testing)中就把语言能力分为语音、句法、词汇和文化,认为语言考试可通过说听读写四种方式测试语音、句法、词汇和文化。由于语言可分解成构成元素,因此可设计出分点式测试(discmte—point test),认为试题应该每题只考查一个考点,其主要题型有选择填空、词汇填空、语法填空、完成句子、改错等。分点式测试对特定的测试如诊断性测试和特定的目的仍然是有效的,不能一概否定。
因为心理测量强调测试的信度(reliability)和客观性(objectivity),而传统的测试如短文写作主观性极强、极不可信,于是具有较高信度的多项选择题(multiple—choice item/question)便应时而生。而且,统计方法引入了语言测试领域,如对试题难度、区分度、整卷信度等进行定量分析,使语言测试成为一门既有坚实理论基础又有相对科学的测量统计方法的学科,但此阶段对测试的效度少有关注。
与第一阶段相比,这个阶段的语言测试强调口头语言。在教学中,把听说摆在读写之前,在测试中注意给听说技能(尤其是听)一定的比重。但结构主义测试忽略语言情景,为了考查结构,试题有明显的人工捏造的痕迹。但笔者认为此阶段的最大成绩是多项选择题(MCQ),虽然此题型备受争议,但设计科学的多项选择题对于大规模标准化测试、机器阅卷等贡献巨大。语言测试专家Heaton认为多项选择题与交际语言测试并非是非此即彼的关系,在很多交际测试中仍可限制性地使用此题型,特别是测试阅读和听力时(Heaton,1988)。
(三)第三阶段:心理语言学.社会语言学语言测试或后现代语言测试阶段
随着人们对语言的认识逐渐深入,结构主义语言观受到了挑战。麻省理工学院的Chomsky在1965年提出了语言能力(1inguistic competence)和语言行为(1inguistic performance)的概念。1972年,社会语言学家Hymes提出了交际能力(communicative competence)的概念,认为使用语言不但要能够按照语法规则产出形式合格的句子,而且还应具有在不同的语境中合理使用这些句子的能力,即语言使用涉及社会文化因素。所以,语言交际能力不但包括语法能力,还包括其他能力。对于决定测试范围和效度的语言能力假说有过以下几次主要演变:
1.19世纪60年代Lado的结构主义语言能力假说。
2.1979年J.Oiler的单一语言能力假说(unitary competence hypothesis,UCH)。Oiler认为人的语言能力是个整体(unitary competence),语言测试可以通过综合性的完形填空和听写来衡量语言能力,因为这两种形式的测试包含全部或者几乎全部的语言能力(徐强,2000)。于是,针对分点式测试方法提出了综合式测试(the integrative approach),与主张一次只可以测试一个语言点的分点式测试不同,综合式测试主张通过一次测试全面评价被试总体语言水平,被试须综合运用各种语言知识或技能。综合题(integrative item)的形式有:完形填空(cloze)、综合改错、听写、口试、作文等。我们不应该把分点式与综合式测试看成你死我活的关系,它们都有不同的应用场合,如分点式测试可用于诊断性考试。
须注意的是,有些综合式测试题型是在心理测量一结构主义语言测试阶段创立的,如完形填空于1953年由w.L.Taylor首创并成熟于20世纪70—80年代。
3.1980年Canale和Swain提出的四能力说。
甲:语言能力(1inguistic competence),含语音、词汇、语法等语言知识;
乙:社会语言能力(sociolinguistic competence),在不同的社会环境中,理解和表达形式和意义皆恰当的语言能力;
丙:交际策略能力(strategic competence),如交际时如何开始、如何维持、如何调整和转换话题、如何结束谈话等能力;
丁:语篇能力(discoursal competence),即组织连贯而非独立的句子的能力。
4.1990 年L.F.Bachman 在Fundamental
Considerations in LanguageTesting一书中提出的交际能力模型,是迄今为止最具有影响力的里程碑式的交际语言能力模型(Skehan,1991),是交际英语测试设计的理论基础,也是交际英语考试内容选择的参照依据,其简介如下:
由上表(Bachman,1990)可知,Bachman认为交际语言能力(communicative language ability,CLA)由三部分构成:语言能力、策略能力和心理生理机制。其中语言能力他另列表作了阐释,包括以下组成部分:
(1)语言组织能力(Organizational competence )
1)语法能力(Grammatical competence)
· 词汇
· 词法
· 句法
· 语音学/书写
2)语篇能力(Discoursal competence)
· 词语联结知识
· 修辞知识
(2)语言使用能力(Utilizing competence)
1)功能能力(1llocutionary competence)
· 达意功能
· 操纵功能
· 探索功能
· 想像功能
2)社会语言能力(Sociolinguistic competence)
· 方言或变体知识的敏感性
· 语域知识的敏感性
· 自然地道语言的敏感性
· 文化典故和比喻知识
策略能力是在语言交际时运用各种语言知识的心理能力。心理生理机制是语言交际时作为物质现象如声、光等所涉及的心理和神经活动过程。
Weir(1990)详细阐述了交际语言测试(CLT,communicative language testing)的理论原则,同时介绍了交际语言测试题目类型。英国的IELTS较好地体现了CLT的原则。交际语言测试的主要特征是:(1)重点是意义;(2)语境化(contextualized);(3)语言活动带有可接受的目的性(purtx)sive):(4)有实际意义的语言;(5)使用真实的语言材料(authentic materia1);(6)文本处理有真实性;(7)反应结果不可预见性(unpredictable);(8)以互动为基础(interaction-based);(9)考生在真实心理状态下展示语言能力;(10)根据实际交际结果判定成绩(Weir,1993;武尊民,2002)。
总之,真实性和互动性是CLT的灵魂,交际英语测试比传统测试复杂得多,对考试大纲设计、命题设计、阅卷人员等都有较高的要求。目前我国许多英语测试离交际英语测试尚有很大距离,做得相对较好的是1999年我国教育部考试中心与英国剑桥大学合作开发的公共英语等级考试(PublicEI1 sh Testing System,PETS)。
为适应交际测试要求提出的直接测试(direct testing)向测试信度提出了挑战。如何在效度与信度之间寻求一个平衡点,如何控制阅卷信度,分数或等级评定制的选择等是交际语言测试需要回答的问题。
我们一定不能仅仅按照时间因素把某一时期的考试进行简单归类,如世界上现在许多英语测试仍处于第二阶段即心理测量一结构主义时期。又如我国建国初期即20世纪五六十年代的高考英语试题就与前科学阶段语言测试特征非常吻合。
上文对世界语言测试的发展作了一个概略的历史回顾,期望对我国语言测试理论与实践改革工作有借鉴之处。不妥之处,敬请专家、同行赐正。
参考文献
Bachman,L.F.Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.
Heaton,J.B.Writing English Language Tests[M].Longman,1988.
Hughes, A. Testing for Language Teachers [M]Cambridge University Press,1989.
Spolsky,B.Measured Words[M].Press,1995. Oxford University
Wood,R.Assessment and Testing:A Survey of Research [M].Cambridge University Press,1993.
董燕萍,王初明.中国的语言学研究与应用:庆祝桂诗春教授七十华诞[C].上海:外语教育出版社,2001.
教育部.普通高中英语课程标准(实验)[S].北京:人民教育出版社,2003.
刘润清,韩宝成.语言测试和它的方法(修订版)[M].北京:外语教学与研究出版社,2000.
王孝玲.教育测量[M].上海:华东师范大学出版社,1989.
武尊民.英语测试的理论与实践[M].北京:外语教学与研究出版社,2002.
徐强.交际法英语教学和考试评估[M].上海:外语教育出版社,2000
张敏强.教育测量学[M].上海:人民教育出版社,1998