简介:口语考试作为一种相对真实(authentic)和直接(direct)的测试手段,已被越来越广泛地应用于语言测试实践中。然而,在测试过程中引入的主观判断、评分标准和量表的设计与使用等因素,使分数受到更多考生能力以外因素的影响。本研究基于2007年某考点PETS三级口语考试数据,用多侧面Rasch模型(Many-facetRaschModel,简称MFRM)对这次考试的评分进行了事后质量控制研究。MFRM将语言运用测试多方面因素综合在一个数学模型中,不仅能够把所有侧面在同一标尺下进行衡量,还能对单独侧面,甚至每个个体进行具体分析,有针对性地找到潜在的'问题评分员'和可能被误判的考生,是主观评分环节有效的质量监控手段。
简介:建立小型描述语语料库并参考MHK三级口试评分标准,对达到MHK三级水平的考生进行"能做什么"的描述分析,建立MHK三级口语能力评分量表。教师给出本班每位参加MHK三级口试学生的口语能力等级,以此为效标计算考生MHK口试成绩和教师评价间的相关等。将分析结果作为论证支撑(backing),以Toulmin效度论证模型为理论框架,从实证角度对少数民族汉语水平考试(MHK)的外推(extrapolation)阶段进行效度论证。结果显示:MHK三级口试效度论证的外推(extrapolation)阶段基本成立,考生的MHK三级口试成绩可以反映考生在实际汉语交际环境中口语能力的表现。
简介:口语考试作为主观性考试,其评分准确性在很大程度上会影响考试的信度和整体效度。本研究结合对评分结果的多层面Rasch模型统计分析和对评分员评分依据的定性描述,探讨PETS三级口语考试中常见的评分误差类型、程度和造成误差的可能原因,并据此提出了改进评分标准,评分流程和评分员培训的建议。
简介:摘要:简述古田溪水力发电厂三级电站#2机转轮室更新改造技术方案选择与施工经过,为今后类似预埋件的更新工作积累了宝贵的经验,也希望能为同行开展类似工作有所帮助。