国内外基础教育质量监测概述
周世科
国家已经走过近 30 年改革开放历程,社会正在发生广泛而深刻的变革,同时,也面临 着新的挑战。培养数以亿计的高素质的劳动者、数以千万计的专门人才和一大批拔尖创新人 才的现实要求,从来没有像今天这样迫切地摆在我们面前。随着国家此前一系列基础教育重 大工程的成功实施和农村义务教育经费保障机制改革的顺利推进,我国的基础教育,特别是 义务教育进入到全面普及和巩固提高的新阶段。孩子“有学上”的问题基本解决后,家长和 社会要求孩子“上好学”的问题日渐突出,这些都要求基础教育的工作重心要逐渐转移到提 高质量上来。[1]
要实现这一转变,国家就必须对基础教育的质量做到心中有数,而且,也只有对教育质 量的状况进行监测并有全面的了解,才能有针对性地作出决策。我国教育线长、量大、面广, 发展不平衡,我们现在常常由于缺乏很多基本数据,难以制订正确的政策来指导工作,因此 迫切需要建立一个与教育决策、执行相协调的教育监管体系。[2]同时,大量的实践证明,教 育事业的改革与发展,只有决策和执行是不够的,对决策和执行情况必须严格监督,对教育 发展水平和质量必须科学评估。
一、国外中小学教育质量监测的发展历程 世界各国历来都非常重视建立完善的基础教育质量监测体系,这其中又以美国、英国、
加拿大、日本等发达国家更具代表,他们在标准化学业水平考试方面走过了较长的历程,积 累了丰富的经验。
在美国,二十世纪六十年代,有关专家针对缺乏有关全国学生整体学业水平的评价,呼 吁建立一个全国性的评估体系,多个团体和评估专家参与了评估模型的研发,并逐步推开了 为调查基础教育阶段学生学业成绩的全国学力测试,这一测试项目被称为国家教育进展评估
(National Assessment of Educational Progress,NAEP)。从 1969 年起,NAEP就阅读、 数学、科学、写作、历史、地理等领域,对不同年级、类别的学生进行了周期性的评价,其 中阅读和数学最受重视。NAEP有不同的评价类型,按不同的维度可以进行不同的分类:按评 价的层级,可分为全国评价、州评价和区域评价;按时间维度,可分为长期趋势评价和短期 评价;按针对性,可分为普通评价和特殊评价。不同的评价类型在目的、评价方法、题目、 对象方面都相应有所不同。[3]在NAEP的技术支持下,一些州也相应的建立了适合本州的评估 体系。1994 年,美国总统克林顿签署了《美国 2000 年教育目标法》,以立法的形式资助和 鼓励各州建立自己的评价标准,用以衡量学生的学习进步情况。2001 年,就任总统的布什 提出了《不让一个孩子落伍》(No Child Left Behind)法案,明确要求所有的州每年都要 通过学科考试来掌握学生的学业进展情况,并与全国考试的指标进行比较。[4]
在英国,从 19 世纪末开始就实行了 11 岁测试,当时的目的是通过考试来实现教育标准 的统一,并将考试结果作为学生进入初中的选拔标准。1997 年 10 月,英国成立了资格与课
程局(Qualifications and Curriculum Authority,简称QCA),负责制订国家课程和各种 教育证书标准,组织统一的教学水平检测。QCA对一至二年级、三至六年级、七至九年级这 三个义务教育“关键阶段”的学生进行评估,评估在三个阶段结束时进行,也就是二、六、 九年级进行,共三次。评估由教师评估和考试两部分组成,教师评估的结果主要反馈给家长 和学生本人,考试的结果在反馈家长和学生本人的同时,也是学校教育质量评估体系的一部 分,主要包括学校效能、学业水平,学校提供的教育质量等方面,但核心是学生的学业成绩。
[5]就考试内容而言,二年级学生只需要接受阅读、写作和数学的教师评估,六年级和九年级
学生则要参加这三个方面的国家考试,九年级学生另外还要接受历史、地理、外语、技术与 设计、信息技术、艺术与设计、音乐、经济与公共事务等学科的形成性评价。
在加拿大,作为政治、经济、教育中心的安大略省多年来一直致力于学生学业成就水平 的提升,并取得了明显的成效。从 20 世纪 90 年代开始,安省就设立了全省范围的学校学业 成就指标项目(School Achievement Indicators Program,简称SAIP),规定对全省 13-16 岁学生的阅读、写作、科学和数学水平进行考试。随着学生学业成就评价的发展需要和公众 的要求,安省于 1996 年成立了专业负责学生学业成就评价的组织——教育质量与问责办公 室(Education Quality and Accountability Office,简称EQAO),负责开发基于标准的学 生学业成就评价、报告中小学质量的效率、提供基于标准的学生学业成就的详细信息等。[6] 安省把阅读、写作和数学作为所有学习的基础,规定 3 年级、6 年级、9 年级三个关键年级 的所有学生都必须接受读写能力和计算能力的考核。考核的内容以安省的课程标准为基础, 在设计时注重教育学理解和测量学要求,清晰反映评价目的以及评价与课程标准的关系。
我们的邻国日本,从 1956 年起便开展了抽样学力调查考试,自 1961 年起开始实施针对 若干年级的全国学力统考,其目的既是掌握全国的学力水平,同时也是使地方和学校找到各 自在全国总体水平当中的相对位置,从而促进学校教育教学的改善。尽管这一考试由于各地 区和各学校对名次的激烈争夺,遭到社会各界的批判和反对,从 1965 年起被中止,但从 1976 年开始,日本便逐渐恢复了抽样的学力调查考试。文部省围绕中小学学习指导要领,在全国 开展了“教育课程实施状况调查”,以小学五、六年级和初中一至三年级为抽样对象,测验 学生对国语、算数(数学)、理科、社会等科目的掌握情况。此外,还开展了考查某些特定 能力(如作文水平、汉字水平、计算能力、实验观察能力及英语会话能力等)的“特定课题 调查”,日本各都道府县也在近些年来开展了地区性的学力调查考试。2007 年,日本恢复 了停止 43 年之久的全国学力调查,并将其制度化,以后每年都将举行这一调查。全国学力 调查包括两大部分,即学力考试部分和学习状况调查部分。前者是为检查学生对国语和算数
(初中为数学)这两门基础科目的掌握情况而进行的学力统考,后者则是为了解学生的生活 习惯及学习环境而进行的问卷调查。[7]学力统考的对象是小学和初中的毕业班即小学六年级 和初中三年级,因此它也可以看作是对学生在小学和初中基础科目上取得学业成就的一个阶 段性检测。学力考试部分的命题以中小学学习指导要领对学生基础知识和技能的要求为基
准,一方面参照文部科学省以往实施“教育课程实施状况调查”等国内学力考试的经验,考 查学生对基础知识和技能的掌握情况,另一方面又参考PISA等国际学力考试的经验和出题方 式,考察学生对知识的灵活应用能力。
其他国家,如澳大利亚的教育质量评估由教育部或州(地区)的教育部门采用项目制委 托澳大利亚教育研究委员会(The Australian Council for Educational Research, ACER) 进行。ACER从 1999 年开始每年评估三、五、七年级孩子的阅读与数学能力,并负责提供学 校水平报告,向教师和家长提供反馈,并将有关结果提供给教育政策制定者。新西兰则由教 育部委托Otago大学的教育评估研究单位进行。韩国是由政府资助的韩国课程和评价协会于 1999 年开始对基础教育质量进行评估,着重对六、九、十年级学生的韩语、数学、社会、 科学和英语进行学习质量评估。德国为了使本国的教育系统与其他欧共体学校系统更为一 致,制订了“国家教育标准”,成立了“国家教育评估机构”,负责定期发表“国家教育报 告”。巴西的教育质量监测开展较早,巴西全国教育研究中心 1995 年就开始进行两年一次 的全国基础教育考核,通过学生成绩和行为表现检测小学的教学质量。[8]中国香港考试及评 核局对小学三、六年级和中学三年级的中文、英文和数学方面能力进行评估。
二、国际组织进行教育质量监测的方式 目前,国际性的教育质量监测多以国际学生比较的形式开展,主要是经济合作与发展组
织(Organization for Economic Co-operation and Development, OECD)的国际学生评价 项目(Program for International Student Assessment, PISA )和国际教育成就评价协 会(International Assessment for the Evaluation of Education, IEA)主持的国际数 学和科学趋势研究(The Trends in International Mathematics and Science Study, TIMSS), 虽然侧重的方面不同,但都极大地推动了参与国基础教育质量的改善和提高。
(一)PISA 1.PISA 的目的
经济合作与发展组织(OECD)从 1997 年开始启动了 PISA 项目,旨在测量义务教育阶段 末期 15 岁在校学生是如何为生活而做准备以迎接知识社会之挑战的。PISA 项目评价的重点 并不在于检验学生是否很好地掌握特殊的学校课程, 而是评价学生是否具有有效地分析、推 理与交流自己的思想观点及终身学习的能力。因此评估的结果没有及格与否的概念,只是体 现学生能达到的水平以及评价年轻一代是否有能力应用知识与技能去面对真实生活的挑战。 此外,该项目还收集学生的学习态度、学习策略、家庭背景以及学校因素等影响学生表现的 背景信息。
2.测试学科与施测情况
PISA 项目每三年举行一次,每次有一个主要测试领域并兼测其它领域。例如,2000 年 的主要测试领域为阅读素养,同时也测验数学素养和科学素养。2003 年主要测试领域为数 学素养,2006 年则为科学素养,从 2009 年开始是第二个周期,主要测试领域又回到阅读素
养。2009 年共有 65 个国家与经济体的 50 多万名 15 岁学生接受了阅读、数学和科学三个测 试项目的评估,中国上海、中国香港、中国台北、中国澳门、新加坡、韩国、日本等亚洲国 家和地区参加了测试,都取得了非常好的成绩,尤其是首次参加该项目的中国上海,在阅读 素养、数学素养和科学素养三项评价中均排在第一位。
3.组卷方式 PISA项目运用了当今非常先进的测量技术,其组卷方式就是最直接的体现。PISA项目通
过运用套卷技术将数学、阅读、科学等评价领域的试题模块整合在一起实行组合测试,而不 是将每个评价领域实行单独测试。以 2003 年为例,共有包含各评价领域的 167 道试题,这
些试题被分为 13 个模块,其中数学主域 7 个模块,阅读、科学、问题解决等评价次域各 2 个模块。13 个模块的试题被轮换分配到不同组合的试卷当中,每套试卷含有 4 个模块,总 共有 13 套试卷,参试学生被随机分配给其中的一套试卷进行测试。[9]例如,如果甲学生被 随机分配第 9 套试卷,他要测试的内容就包括科学模块 2、阅读模块 1、问题解决模块 1 和 数学模块 5。每个模块代表 30 分钟测试时间,每个学生答题时间总共两小时。
4.产生的影响
PISA的评价结果产生了深远的影响。2000 年的测试中,德国在阅读、数学和科学三项 上都低于OECD的平均水平,2003 年的结果虽然好点,但还是被芬兰、韩国、日本远远地甩 在后面。这个结果刺激了德国社会各界检讨其教育政策,2003 年,联邦教研部推出了“未 来教育和关怀”工程,计划在 2003 年至 2007 年的五年内,投入 40 亿欧元将全德 1/3 的学 校(1 万所)由其传统的半日制学校改建为全日制学校,改善学校基础设施和教学条件,提 高教学质量。德国政府也痛下决心改革过早分流的基础教育体制,并计划成立一个横跨各州 的科学机构,依据同样的教育标准检查各州的教学质量。[10]另外,通过PISA测试能发现一 些国家在教育上存在的隐患,比如:日本通过测试发现学生可能每天花了很多时间读书,但 是都在读学校指定读本与做功课,很少享受主动阅读课外书的乐趣,这种缺乏自发阅读兴趣 的现象可能会导致日本学生成年后自我成长缓慢。中国上海在 2009 年的测试中发现,在阅
读项目中非连续文本分量表与连续文本分量表成绩差异高达 25 分,在总成绩高于OECD平均 值的参与国家和地区中,上海在两种文本形式分量表上的成绩差异是最大的,说明上海不同 文本形式的课程内容分布可能不均衡。
(二)TIMSS 1.TIMSS 的组织机构
TIMSS由国际教育成就评价协会(IEA)于 1995 年发起,至今已成为IEA自创办以来最成 功的国际比较研究项目之一,也是当今世界参与国家最多、影响最广且最严格的国际比较教 育研究。IEA在各参与国都指定了协调员和监察员。协调员除了为TIMSS在本国测试筹集资金 以外,还要负责协调本国的测试时间表;审核测试题目,保证翻译可以在本国特定的文化背 景下不会被误解;招募和培训数据录入人员,撰写本国的TIMSS系列研究报告等工作。[11]监
察员,也叫质量控制专员,测试之前接受IEA国际研究中心完整的培训,考核合格后担任该 国的监察员,在TIMSS测试当天负责对本国测试学校的监督,测试结束后负责检查数据录入 和翻译的准确性。
2.测试学科与施测范围
TIMSS 主要测试四年级和八年级学生的数学与科学成绩,每四年开展一次,2011 年,超 过 60 个国家和地区(包括中国香港、中国台北、新加坡、韩国、日本)参加了 TIMSS 项目。 测试的具体领域由数学、科学成就和影响因素两部分组成。和 PISA 相比,TIMSS 跟学校课 程的联系更为密切,数学和科学成就主要考查样本学校四年级和八年级学生对基本概念的掌 握程度和推理应用情况。影响因素包括学生的学习态度、兴趣、学习习惯、学习风格等对学 业成就有影响的相关因素,用来更好的理解学生的学习行为。影响因素通过调查问卷获取信 息。调查问卷共分为学生问卷、教师问卷、课程问卷和学校问卷。
TIMSS项目规定,所有被试的学生必须是正规公立学校的学生,私立学校和职业学校的 学生不参与该研究。由于各参与国入学年龄不同,各国学制有所差异,为了保证接受测试的 学生年龄差别不会太大,TIMSS系列研究质量保障规定:被测试的四年级学生的平均年龄不 得低于 9.5 岁,八年级学生平均年龄不得低于 13.5 岁。在抽样方法上,TIMSS采用二阶段整 群抽样的方法对学生进行抽样,第一阶段抽取样本学校,第二阶段从样本学校目标年级中抽 取班级。一般来讲,一个国家大概有 150 所学校会被抽中。[12]同时,被抽中的学校和学生在 正式测试中的参与率至少要达到 85%,否则该学校或班级的测试结果无效。
3.组卷方式
与 PISA 一样,TIMSS 组卷同样采用多个题本。以 2007 年为例,四年级学生数学共有 179 道题目,科学有 174 道题;八年级学生数学有 125 道题,科学有 214 道题目。每个年级共分
成 14 个题本(数学和科学各七个),题本试题类型为选择题和解答题。 4.产生的影响
TIMSS系列研究的评价结果不仅受到各国教育决策者和研究者的高度重视,在一些国家 还掀起了教育改革的浪潮,同时其研究结果也在一定程度上颠覆了部分关于教育的传统观 念。2006 年 1 月,美国教育部公布了《回应变革世界之挑战——为 21 世纪而加强教育》的 报告,在开篇即指出美国四年级和八年级的学生在 2003 年的TIMSS中,仅有 7%的学生获得 了“高级”水平,而新加坡四年级的学生有 38%达到了高级水平,八年级学生达到高级水平 的有 44%。由此可见TIMSS系列研究的结果对美国联邦政府教育决策者的影响力。另外,TIMSS 的结果也启发了人们深入思考和教育相关的很多方面,比如教育投入和产出之间的关系并不 是简单的正相关,美国学生享受到的教育投资费用比韩国学生多了两倍,可是在考试中却被 韩国学生击败;在课程上所花的时间和这门功课上取得的成绩也没有必然的联系;“小班化” 教育模式的国家,其学生学习成绩远不如东亚国家“大班化”教育模式培养的学生。[13]
三、国内质量监测进展情况
众多国家和国际组织的实践已经证明,建立国家教育质量监测体系就是教育质量保障的 重要举措,也是国家体现对教育责任的重要渠道。由于底子薄和教育体制等诸多原因,我国 的基础教育质量监测工作还处于起步阶段,与上述国家和国际组织还存在着非常大的差距, 但值得庆幸的是,我国的国家义务教育质量监测已经成为我国国家层面议事日程的一部分。 在国务院批转的教育部《2003-2007 年教育振兴行动计划》中,明显提出要深化基础教育课 程改革,建立国家和省两级新课程的跟踪、监测、评估、反馈机制,加强对基础教育质量的 监测;《国家中长期教育改革和发展规划纲要(2010-2020 年)》中明确把提高教育质量作 为教育改革发展的核心任务,并多次强调与“教育质量的监测和评价”相关的内容。随着国 家层面对教育质量的保障越来越重视,实践层面的行动也在逐步开展,国家层面和省级层面 的基础教育质量监测工作正在有条不紊地进行着。
2003 年,在教育部基础教育课程教材发展中心的组织下,成立了“建立中小学学业质 量分析、反馈与指导系统”项目组(简称“项目组”)。项目组以国家颁布的课程标准为依 据,主要通过纸笔测验考察学生学科学习结果,在基本知识和基本技能的基础上关注与学生 未来发展关系密切的核心素养,同时通过学生、教师和校长问卷了解与学生学习相关的背景 因素。项目组成立后没有马上着手于测试,而是开展了有关学生学业质量分析与指导的基础 研究,包括现状分析、比较研究、选题论证等。基础研究完成后,2004 年 12 月 10 日项目
组在大连和浦东组织了有 2 万名中小学生参与的试测,通过这次试测,项目组在命题、数据
收集与分析、测评工作的协调组织等各个环节获得了宝贵的经验。从 2005 年开始,项目组
先后对上海、江苏、甘肃等 6 个省市和近 20 个地市进行了学业质量测试,共有约 335 万人
次的学生参加了学科测试和问卷调查,约 15 万名教师和 1.2 万名校长参加了问卷调查。[14]
随着质量监测各项工作的不断完善,项目组在 2009 年对全国所有省份进行抽样,建立了三 年级和八年级学业质量状况的全国常模,使得各测试地区监测的结果更具有针对性和可比 性。项目组每年组织测试一次,测试的时间一般在每年的 10 月份,测试年级为四年级和九 年级,测试的内容为三年级的语文和数学,八年级的语文、数学、英语和科学。
2007 年 11 月 30 日,“教育部基础教育质量监测中心”(简称“中心”)挂牌成立, 中心是在教育部直接领导下,依托北京师范大学而建立的专业机构。中心的职责包括拟定基 础教育质量监测标准;研究开发基础教育质量监测工具;受教育部委托具体实施全国基础教 育质量监测工作;指导各地开展基础教育质量监测工作,推动全国基础教育质量监测网络的 逐步建立。中心目前监测的主要内容包括学生的思想品德和公民素养;学生的身体和心理健 康水平;学生的学业水平和学习素养;学生的艺术素养;学生的实践能力和创新意识;影响 学生发展的教育环境和社会环境 6 个部分。2007 年 12 月,中心在湖北、浙江和陕西三省进 行试点监测,2008 年 9 月在上海、山东、河南等八省市进行了首次监测,随后每年开展一 次,至今为止已开展了四次。四次监测中,全国已有 27 个省(直辖市)参加测试,共有约
18 万学生、3.3 万教师和 0.5 万校长参加了学科试卷和相应的问卷调查。[15]
省级层面,2006 年,江苏省教育厅与教育部基础教育课程教材发展中心达成协议,加 入“建立中小学学业质量分析、反馈与指导系统”项目,并约定每两年测试一次。为了能全 面掌握江苏省基础教育的质量状况,项目从一开始便覆盖了全省所有的区县,形成了省、市、 区县三级学生学业质量分析报告。2006 年 10 月,全省共有 59829 名四年级学生、53413 名 九年级学生参加了学科测试和问卷调查,2 万多名参测学校校长和教师(四年级所有语文、 数学教师,九年级所有语文、数学、英语和科学教师)参加了问卷调查。为了能进一步加大 监测工作的推进力度,2008 年 3 月,江苏省基础教育质量监测中心在省教科院正式挂牌成 立,这也是在全国范围内成立的首个省级基础教育质量监测机构,表明江苏在全国率先把质 量监测工作纳入基础教育改革发展的整体布局。按照约定,江苏省在 2008 年和 2010 年继续
参加了学业质量测试,测试规模也在不断增大,以 2010 年为例,全省共设有 2109 个考点,
参加测试的学生人数近 20 万。为了能充分的利用学业质量测试结果,江苏省基础教育质量 监测中心办公室(简称“中心办公室”)与无锡市锡山区教育局和淮安市洪泽县教育局建立 了“基于测试分析提升区域义务教育质量”合作项目,争取在两到三年时间里,在区域、学 校、学科三个层面,推进锡山区和洪泽县小学、初中的教育教学改革,建立新型教学及管理 制度,促进队伍发展,改进课程教学现状,区域化提升义务教育整体水平和质量。另外,中 心办公室将加强国内外质量监测模式的比较研究,与加拿大安大略省、美国俄亥俄州等同类 机构进行交流沟通,着手研制全省区域性质量标准的体系框架。区域质量标准体系的实施, 是一项创新性工程,将进一步促进江苏省基础教育质量监测工作走在全国前列。
上海市从 2004 年起便参加了“建立中小学学业质量分析、反馈与指导系统”项目,并
连续 8 年参加了测试,初步建立了上海中小学生学业质量的数据库。为了进一步推动全面实 施素质教育,提高基础教育质量,2009 年 9 月“上海市教育委员会基础教育质量监测中心” 正式成立,挂靠在上海市教研室,作为上海市教研室的一个下设机构。2011 年 9 月,教育 部基础教育课程教材发展中心和上海市教育委员会合作,在全国率先建立了“中小学生学业 质量绿色指标”评价体系。该体系以关注学生健康成长为核心价值追求,分为学生学业水平 指数、学生学习动力指数、学生学业负担指数、师生关系指数、教师教学方式指数、校长课 程领导力指数、学生社会经济背景与学业成绩的关系指数、学生品德行为指数、身心健康指 数以及上述各项指标的跨年度进步指数。[16]
重庆市在 2009 年成立了重庆市基础教育质量监测中心,与重庆市教育评估院合署办公,
并在 2010 年 9 月开展了省级基础教育质量监测实践,组织了近 6000 余名监测工作人员,随
机抽取 40 个区县近 700 所中小学、5 万余人次中小学生、4000 余名数学教师、班主任和 700 名校长进行质量监测。[17]监测的对象为四年级和八年级学生,监测的内容为数学、心理健 康和影响学生学习数学的因素。
北京教育科学研究院基础教育教学研究中心在 2003 年便开始承担北京市义务教育教学 质量监控与评价项目。九年来,基教中心已经对五年级和八年级所有学科进行了监测。为了
能更好的开展这项工作,2011 年 9 月 16 日,“北京市教育督导与教育质量评价研究中心”
(简称“中心”)正式挂牌成立。中心设在北京教育科学研究院,由办公室、督导及评价理 论研究室、工具研发及组织实施室、信息与数据处理中心四个部门组成,主要职责是根据市 政府教育督导室的督导规划和工作安排,开展对全市各级各类教育的督导服务与质量监测评 价工作,全面把握教育质量发展状况,科学诊断教育质量问题,深入剖析教育质量问题成因, 为教育行政部门和教育督导部门提供决策依据。
另外,甘肃省、山东省等其他省份也在省级层面建立了基础教育质量监测机构,杭州市 下城区、江苏省如皋市等区县级层面的基础教育质量监测机构也在全国各地不断地建立,全 国范围内的基础教育质量监测系统正在逐步形成。
四、总结与展望 教育质量直接关系到国民素质,也是我国沉重的人口负担转化为丰富的人力资源优势的
关键所在,而处于整个国民教育体系的基础地位的义务教育的质量是教育的生命线,必须得 到充分的保障。[18]尽管近年来,国家级层面和部分省级层面都纷纷建立起了基础教育质量 监测机构,也取得了一定的成绩,但由于我国的质量监测工作起步晚,无论在理论层面还是 在实践层面与有着几十年监测历史的西方发达国家尚有较大的差距。要缩小与发达国家的差 距,教育行政部门和学校管理者应当肩负起责任。教育行政部门必须加强对基础教育质量监 测工作的保障;鼓励有资质的中介机构进入,建立起高效的教育评价机构。学校管理者和学 科教师必须转换原有的评价思想,树立正确的质量观,充分认识质量监测的目标导向作用。
基础教育质量监测工作是一项工程浩大而政策性很强的的任务,作为从事基础教育质量 监测工作的一员,迫切地希望各级教育行政部门、教研部门和中小学校要群策群力,积极争 取外部专业支持,尽快完善和健全区域性的基础教育学业质量监测制度和运行机制,不断提 高我国基础教育的教学质量,为基础教育改革发展和现代化建设服务。
参考文献:
[1][2]王友文.质量监测为“上好学”提供决策支持——访教育部基础教育质量监测中 心副主任胡平平[N].中国教育报,2007-12-06.
[3][5][6][18]崔允漷,王少非,夏雪梅.基于标准的学生学业成就评价[M].上海:华东 师范大学出版社,2008.38、67、78-79、173.
[4][7][9]“中外重大教育发展战略与改革政策的比较研究”课堂组,李协京.国外中小 学教育质量监测研究报告[C].纪念《教育史研究》创刊二十周年论文集(17)——外国教 育政策与制度改革史研究,2009.1546-1553.
[8][10]辛涛,李峰,李凌艳.基础教育质量监测国际比较[J].北京师范大学学报(社会 科学版),2007,(6):5-10.
[11][12][13][15]教育部基础教育质量监测中心网站[EB/OL].http://www.eachina.org.cn [14][16]张民生.建立科学的中小学学业质量评价系统[J].上海教育,2011,(11).
[17]重庆市教育质量监测工作走在全国前列,重庆市人民政府网[EB/OL]. http://www.cq.gov.cn/zwgk/zfxx/295132.htm
(周世科,江苏省基础教育质量监测中心办公室 江苏省中小学教学研究室,210013)