摘要: 从口语测试历史入手, 围绕口语测试的设计原则, 从等级划分、测试组织、测试形式和评分标准等讨论大学英语口语测试体系的设计与实践。
关键词: 大学英语; 口语测试体系; 设计原则; 实践
教育部新的《大学英语课程教学要求》倡导大学英语教学改革, 对大学英语各阶段学生具体口语能力做出了明确描述, 目的之一就是提高学生的英语综合应用能力, 特别是听说能力, 改变传统大学英语教学中只重视读写而忽视听说、学生只会“哑巴英语”的状况。随着这一新要求的颁行, 大学英语口语教学受到越来越多的关注, 口语测试对口语教学的促进作用也引起了高校英语教师的普遍重视。本文围绕大学英语口语测试的设计, 重点结合北京工业大学英语口语测试体系建设与实践情况对此问题进行研讨。
一、口语测试的历史变迁
纵观语言测试的历史, 不同的学者从不同的角度提出了不同的划分方法。Heaton( 2000) 认为语言测试划分为四个阶段: 短文写作- 翻译法( the essaytranslationapproach) 、结构主义法( the structuralistapproach) 、综合法( the intergrative approach) 和交际法( the communicative approach) 。李筱菊( 1997) 划分为三个体系: 科学前测试体系、结构主义测试体系和交际测试体系。徐强( 2000) 根据测试体系发源地的不同分成三个学派: 德国学派、美国学派和英国学派。虽然划分方式和名称不同, 但是以上分类在实质上是相互融合的, 并不是完全独立的, 所以文秋芳( 2003) 建议将以上分类融合起来进行研究。口语测试是语言测试的一个部分, 在语言测试体系确立和发展的同时, 口语测试也经历了从无到有的过程。在科学前测试时期即短文写作- 翻译法阶段, 语言测试只测试短文写作、翻译和语法分析等书面语形式, 不测试口语。20 世纪40 年代结构主义测试体系兴起后, 将语言分解为听、说、读、写四种技能, 但是口语测试仅采用朗读、复述和看图说话等形式来测试语音语调和语法准确性, 强调语言的准确性和熟练性, 而忽视语言的实用性和交际功能, 因此口语考试通常比较机械, 缺少信息交流。随着20 世纪80 年代交际法测试的出现, 强调测试任务的情景性和交际性, 考察语言使用和完成交际任务的能力,重视语言的社会交际功能, 交际法采用角色扮演、面谈、讨论等更具交互性的考试形式, 使得口语测试更加真实和实用。近十几年来, 国际和国内多数的英语口语测试都采用交际法测试理念, 比如伦敦三一学院的口语等级考试(GESE) 、雅思考试( IELTS) ; 或者融合交际法和结构法, 比如剑桥大学的英语等级考试(MSE) 、全国英语等级考试( PETS) 等。
二、口语测试与书面测试的区别
刘润清先生曾指出: “口语测试是语言能力的重要组成部分, 同时也是各种语言测试中最难进行的。”[1] 正如Heaton 所言: “Testing the ability tospeak is a most important aspect of language testing.However, at all stages beyond the elementary levelsof mimicry and repetition it isan extremely difficultskill to test, as it is far too complex a skill to permitany reliable analysis to be made for the purpose ofobjective testing.”[2] ( 测试口语能力是语言测试中最重要的方面之一。可是, 除了在初级阶段测试模仿和重复能力, 在所有阶段中尤其以测试口语能力为最难。因为这种技能太复杂, 很难对此进行可信和客观地分析。) 口语测试不仅难在设计合理有效的口语测试题目和形式, 更难在公正客观的实施。这其中涉及题目的设计和组织、标准的制定和执行、教师主观因素淡化等方面的难题。以下是口语测试和书面测试的几个基本区别:
( 一) 测试内容
口语测试的主要目的是检测学生口语表达和交际能力, 重在口头材料的收集和评判。与重视读写能力的笔头表达相比, 口头表达的内容本身具有较强的互动性, 易逝性和不规范性。因此, 在测试内容的设计上和学生语料的保存上, 口语测试比书面测试更具有难度。
( 二) 测试形式
口语测试强调话语的交际互动, 需要在教师和学生之间, 或学生和学生之间通过问答等形式展开。由于每个( 或每组) 学生需要与教师独立进行测试,与书面测试相比, 口语测试需要动用大量的教师和时间来完成考试, 口语测试的人力成本和时间成本较高。
( 三) 测试标准
口语测试与书面测试最大的区别就是评分标准的掌握和执行难度不同。口语测试的主观性最强, 最易受到教师主观因素的影响, 相同的话语样本由10个教师评判, 可能会有10 个不同的分数。因此, 与书面测试相比, 口语测试的效度和信度更难实现。
三、大学英语口语测试的设计原则
虽然口语测试较难进行, 不同测试理念对于口语测试的重视程度和操作方式也不同, 但是口语考试本身具有一定的规律性和固定性。依托交际法测试体系的理念, 可以从三个方面探讨如何设计大学英语口语测试体系。
( 一) 真实性
大学英语口语测试的主要目的是考察学生英语口头表达能力, 而学生真实的表达能力只有在真实的情景中使用真实的材料才可能得到最大化的展示。Carroll 认为( 口语) “学生承担的所有任务应该是现实生活中的、相互作用的交际活动, 而不是对教师的‘刺激’做出典型性和例行的考试反应”。[3]虽然此处的“真实性”只能是相对意义上的真实, 设计口语考试时, 应尽可能涉及学生所熟悉的内容和熟悉的任务, 如教材中学习过的内容、在日常生活中所发生的事件和人物等, 以增加测试材料和测试过程的真
实性。只有如此, 才能如Hughes 所言: “We want toset tasks that form a representative sample of the population of oral tasks that we expect candidates tobe able to perform. The tasks should elicit behaviorwhich truly represents the candidates‘ ability andwhich can be scored validly and reliably.”[4] ( 我们希望测试任务能够具有口语测试的代表性和可实施性。这种任务应该能够让考生真正表现出水平, 同时能够保持测试的信度和效度。)
( 二) 交互性
在交际法测试环境下, 口语测试突出语言的交互性, 即教师和学生之间、学生与学生之间能围绕具体话题或内容, 展开交谈、交流看法并互相提供信息。徐强指出“所谓互动性就是学生与考试任务之间的相互影响和相互作用。⋯⋯在交际中, 学生与考试任务之间的相互影响和相互作用也就是甲方( 或者乙方) 根据对方的语言产出自己的语言, 或者说, 对方的语言对自己所产出的语言有影响。⋯⋯互动双方中的主要一方是学生。”[5] 在设计口语测试时, 尽量采用双向单回合、双向多回合或多向多回合的交流模式, 多方位考察学生的语言交际能力。
( 三) 综合性
综合性是指制定评分标准时, 主要以学生口语表达、交际策略、交际效果、情感态度、合作意识等多方面综合评定学生的水平, 而不是单纯从语法或语音等语言正确性上来判断学生的语言交际能力。根据Bachman( 1990) 所提出的语言能力模型: 语言能力包括语言组织能力和语言使用能力。语言组织能
力包括语法能力( 句法、词法和语音) 和语篇能力( 修辞结构和词语联结) ; 语言使用能力包括功能能力( 如达意、操纵等) 和社会语言能力( 对自然地道语言的语感、对语域差别的语感等) 。语言测试不仅是测试语言组织能力, 还要测试语言使用能力以及在交际过程中所表现出来的策略、态度、合作等因素。
四、大学英语口语测试体系建设实践
借助大学英语教学改革的契机, 融合口语测试的交互性、真实性和综合性三个特性, 借鉴目前流行的口语测试项目MSE、PETS 和GESE 的测试组织形式和评分标准等要素, 我们在北京工业大学尝试进行了大学英语口语测试体系的实践研究。为便于表 述, 特归纳如下:
( 一) 等级划分
根据教育部新的《大学英语课程教学要求》, 大学英语口语测试总体分为一般阶段要求、较高阶段要求和更高阶段要求。在实践中, 我们对应每个要求分设两个级别, 因此北京工业大学英语口语测试共设六个级别, 与大学英语教学的1- 6 级对应。每个级别在测试话题、交际功能、测试重点等方面都有所区别。比如, 基于真实性原则, 各级别的话题主要源自于该级别所对应教材的主题和日常生活现象, 进行适当调整和改变, 以适应口语考试形式和内容的需要。在测试重点上, 初级阶段主要考察学生对日常话题讨论、日常生活场景描述等对话交互能力, 例如a day on campus, meeting a new friend, seeing a
doctor, shopping 等; 较高阶段主要考察学生对学习、生活和社会现象中的抽象话题的讨论和辩论能
力, 例如global warming and environmental pollution,single parent and childeducation,traffic jam and citylife 等。
( 二) 测试组织
为配合北京工业大学英语教学和测试改革, 我们设定每学期为一级, 每一级口语测试分为阶段测试和期末测试两种。阶段测试一般为随堂测验, 测试时间灵活。根据教学进度情况, 一个学期可安排1- 2次阶段测试, 由任课教师进行测验。阶段测试成绩作为形成性评估的一部分, 记录到英语听说课程的平时成绩中, 并按照一定比例折算记入总评成绩。期末测试安排在一个学期的教学之后, 测试时间固定在学期最后一周, 全年级统一举行, 交换任课教师进行考试。期末口语测试成绩作为英语听说课程口语部分的终结性评估部分, 直接记录到总评成绩中。
( 三) 测试形式
阶段口语测试和期末口语测试中, 在保证交际性和真实性的前提下, 综合测试内容、测试重点和测试级别等要素, 我们分别采用多种具有针对性的测试形式。阶段测试所采用的考试形式比较灵活, 比如角色扮演、复述对话、背诵课文、课堂陈述、课堂短剧等便于在课堂上进行的测试形式, 采用一名教师对两名或多名学生的形式。教师根据测试形式和内容,就学生的准备情况、语言程度、表现情况等综合打分。期末测试的考试形式比较固定, 随级别不同而形式不同。比如一级是一名教师对一名学生, 学生背诵
课文并回答教师的问题( 一级的话题) ; 二级是一名教师对两名学生, 学生对话( 预先准备) 并回答教师问题( 二级的话题) ; 三级和四级是一名教师对两名学生, 学生看图说话并回答教师问题( 本级别的话题) ; 五级和六级是一名教师对一名学生, 教师和学生就本级别话题展开交谈, 内容涉及面相对广泛而且深入。从测试的时间上来看, 遵循级别越高, 时间越长的原则, Underhil 认为: “检测高语言水平的测试持续时间通常比低语言水平的测试长, 因为学生需要更多的时间来展示其语言水平。”[6] 因此, 我们采用一级每名学生2 分钟、二至四级每对学生6 分钟、五至六级每名学生5 分钟的阶梯制时间表。
( 四) 评分标准
在北京工业大学实行口语测试的实践中, 基于口语测试具有综合性的特点, 虽然每个级别的测试形式、测试重点等有所不同, 但是专门设计了《口语考试记分卡》( Spoken Test Mark Sheet) 并在1- 6 级的口语测试中统一使用。卡上包括: 话题熟练程度( Text familiarity, 包含交际能力和效果) ; 语音语调( Pronunciation & intonation) ; 语言准确性(Grammar& vocabulary) 和语篇组织(Discourse management, 包含交际策略和合作意识) 。根据每个级别要求, 适当调整评分标准中各部分的分值比例, 并且在具体评分标准执行上有所区别, 总的原则是级别越高, 要求越高。以语音语调( Pronunciation & intonation) 为例,如果一级学生“语音语调基本正确, 话语不难理解,但母语口音明显”, 可以得到3- 4 分; 如果是五级的学生出现同样的情况, 只能得到1- 2 分。再以语篇组织为例, 同样是“表达较连贯, 有少许停顿; 话语逻辑性较好, 二级的学生可以得到4- 5 分; 而六级的学生只能得到2- 3 分。需要指出的是, 在实际操作过程中, 我们发现, 在运用评分标准时需要注意处理好以下几方面的关系:
1.听和说的关系: 应注意判断在交际互动中, 学生能否听懂教师( 或同伴) 的问题并且做出适当回应; 或听不懂问题但是能够猜测并做出合适的回答;或听得懂问题但是不能组织出合适的回答; 或者既听不懂问题、又不能做出回答。教师应根据实际情况做出恰当的判断。
2.话语长度和有效信息量的关系: 应重视学生的话语长度, 并且级别越高, 连续发言能力应越强;但是, 这应该建立在所传达有效信息量的基础上, 而不是长时间传达重复或含糊的无效信息。
3.语言准确性和交际目标的关系: 级别不同, 侧重点有所不同。需要判断是侧重语音语调和词汇语法的正确性, 还是侧重通过有效的交际策略和语篇组织, 实现交际目的。
4.交际内容和策略的关系: 交际策略固然重要,但是学生首先应该言之有物、而且言之有理; 脱离话语本身准确性和交际性, 策略手段将显得空洞贫乏。
五、结束语
北京工业大学自2004 年开展大学英语教学改革以来, 大学英语口语教学和测试一直受到教师们的高度重视。结合教师们的科学研究和教学实践, 我们初步建成了大学英语口语测试体系并进行实践。两年多来, 口语测试的实施在客观上增加了学生和教师对英语口语的重视程度, 在一定程度上促进了学生口语水平的提高。在将来的实践中, 还要注意测试话题难度的递进性、测试内容与教学的统一性、测试形式的可操作性和科学性、评分标准的细化和可执行性等方面问题。我们希望通过对大学英语口语测试体系建设的尝试, 进一步完善大学英语测试体系建设, 并引起更多同行对口语测试研究的兴趣。
参考文献:
[ 1] 刘润清.语言测试和它的方法[M] .北京: 外语教学与研究出版社, 1999.195.
[ 2] Heaton J B. Writing English Language Tests [M] .北京: 外语教学与研究出版社, 2000.88.
[ 3] Carroll B J. Testing communicative Performance [M] .Oxford: Oxford Pergamon Press, 1980.11.
[ 4] Hughes Arthur. Testing for Language Teachers [M] . 北京:外语教学与研究出版社,2000.101.
[ 5] 徐强.交际法英语教学与考试评估[M] .上海: 上海外语教育出版社, 2000.133.
[ 6] Underhill Nic. Testing Spoken language [M] .天津: 南开大学出版社, 2004.42.