关于“做中学”科学教育的评测(2)
从事探究式科学教育的专家和教师对总结性评测大都认为不可取,因为其负面作用难以避免。但是,为了对决策者、家长和社会关心教育的各界人士提供有关学校、本地区和国家教育进展的情况,总结性评测总是避免不了的。这就要求尽可能让总结性评测起到较好的正面促进作用,而尽可能地避免它的负面影响,这就是当前IAP探究式科学教育网络正在研究的课题。
我们是这个网络的成员,参加了前年在法国和去年在瑞典召开的会议,没有参加今年在华盛顿召开的专家会议,大概也不会去参加下个月在巴黎召开的专家会议。因为,我国的探究式科学教育还在起步时期,在国家的课程设计上,科学课还不被列为主课,在学校里普遍不被重视。因而,我们中心在情绪能力评测研究方面虽然有特色,也被国际学术界重视,但缺乏结合实际的评测结果和可以总结的经验。因此,接到了参加专家组的邀请之后,经过考虑,还是没有派人出席这两次的专家会议。不过,我们会始终保持和这个网络,特别是专家的联系,并准备派人参加今年下半年在智利召开的会议。
大家可以从国际会议的频繁举行中,看到各国对科学教育和科学教育评测的重视。美国国家教育统计中心(NCES)、美国科学院以及各州都在进行和研究科学教育评测的问题。在国际上。经济合作与发展组织(OECD)支持下的国际学生评测项目(PISA),将在2006年将科学列为重点评测的领域,对不同参与国15岁学生的科学素质进行评测。国际教育评估协会(IEA)支持下有两个评测项目:国际数学和科学教育发展趋向的评测项目(TIMSS),以及国际阅读能力进展评测项目(PIRLS),这些都是很有影响的进行总结性评测的国际项目。他们以一定的年份间隔,如三年,对不同年级的学生进行评测。如PISA对15岁的学生进行语言、数学和科学的评测,NCES对美国4年级、8年级和12年级的学生进行评测、TIMSS对4年级和8年级学生的数学和科学进行评测,PIRLS对4年级学生的阅读能力进行评测。在法国和加拿大总结性评测都只对三年级以上的学生进行。在法国进行三年级学生总结性评测时,不要求学生在考卷上写上自己的名字,以免给学生和教师增加不必要的压力,避免给孩子公开排队,通过总结性评测只是希望从一个方面了解学校的教学情况。我国的新课程改革中提出了不少新的理念,如“以学生为本”、“尊重每一个学生”。“均衡教育”等等,但在实际做法上,可能远远没有到位。学生几乎天天在各个方面被排队。这就是为什么在和网友们讨论时,我认为美国小学生承受的压力和中国的小学生相比是“小巫见大巫”。
现在,在中国的小学里科学教育普遍不被重视,加上不熟悉发展性评估,很多科学教育课没有学生的连续记录,即使是教材中配了记录本,也没有好好利用。我看过几本小学生的记录本,真是“惨不忍睹”。为了对目前科学教育的现状有一点评测数据,我做了一点尝试。
例一,准备一蓝水果,最好包括番茄和黄瓜,让4年级的学生独立的进行观察和比较,并要求他们把结果用自己认为合适的方式表达出来。这个案例是我们在GE项目的幼儿园里正在进行的案例。在培养探究能力方面希望儿童通过各种感官,以及简单的工具,观察物体的外部特征,辨认物体和进行分类。对于小学的学生应该有更高的要求。下面是一位四年级小朋友的观测记录,他用计算机打印的表格来记录观察结果。
| 名称 | 木瓜 | 西瓜 | 苹果 | 椰子 | 核桃 | 黄瓜 | 草莓 | 西红柿 | 枣 | 枇杷 |
| 表皮颜色 | 黄 | 绿 | 红 | 浅肉色 | 深肉色 | 绿色 | 红色 | 红色 | 红色 | 黄色 |
| 重量 | 重 | 重 | 较轻 | 重 | 轻 | 轻 | 轻 | 轻 | 轻 | 轻 |
| 形状 | 椭圆 | 圆 | 园 | 园 | 椭圆 | 不规则 | 上大下小 | 圆 | 椭圆 | 椭圆 |
| 内部颜色 | 黄 | 红 | 黄 | 肉色 | 灰和黑 | 浅绿 | 浅红色 | 红 | 黄 | 黄色 |
| 有无柄 | 有一点 | 无 | 有 | 无 | 无 | 有 | 有很短的 | 有 | 有一点 | 有 |
| 花纹 | 绿斑点 | 黑纹路 | 红黄相间 | 深肉色 | 一点黑色 | 白粒 | 黄粒 | 无 | 无 | 黑斑点 |
| 味道 | 微甜 | 甜 | 甜 | 甜 | 苦 | 黄瓜味 | 酸甜 | 酸 | 甜 | 酸 |
| 有否怪味 | 有 | 无 | 无 | 有一点 | 无 | 无 | 无 | 无 | 无 | 有 |
| 有否凹秃 | 有 | 无 | 有 | 无 | 有 | 有 | 有 | 有 | 有 | 有 |
| 表皮厚度 | 厚 | 厚 | 不厚 | 厚 | 比较厚 | 不厚 | 不厚 | 不厚 | 较厚 | 不厚 |
| 长短 | 长 | 中等 | 中等偏下 | 中等 | 短 | 特别长 | 短 | 较短 | 短 | 较短 |
| 能否切开 | 能 | 能 | 能 | 不能 | 不能 | 能 | 能 | 能 | 能 | 能 |
| 价格(1斤算) | 2元 | 5毛 | 1元 | 1毛 | 10元 | 3元 | 3.3元 | 2元 | 4元 | 10元 |
| 籽、核 | 有 | 有 | 有 | 有 | 有 | 有 | 有 | 有 | 有 | 有 |
对4年级的学生,我们可以试试他们对一些概念的掌握程度,下面是一次对话的记录:
问:你观察和比较了这些水果以后,你分析了它们不同的地方,能告诉我,它们有相同的地方吗?
答:都有皮。
问:还有吗?
答:有核,籽,还有肉。都是圆的。
问:香蕉和黄瓜可不是圆的。
答:是的,可他们总有点椭圆形。对了,它们都长在树上。
问:番茄和黄瓜可不长在树上。
答:它们都是植物。
问:为什么你说它们是植物。
答:因为它们不会动,动物会动。
问:向日葵和含羞草也会动。
答:它们的根不会动。
问:竹子的根,黄花菜的根都能串得很远。
他答不出来了。我请他想想他养鱼和种水仙的过程中,每天做的事有什么不同。他在引导和启发下总结出植物和动物重要的区别是动物需要依靠其他生物供给养分;植物自己依靠天然的物质养活自己,还提供人和动物生存需要的氧气和养料。
通过这次评测活动,说明他基本掌握了进行对物体外部特征进行观察、比较、分类和记录的能力,也能归纳出水果的特征。但是,原来并没有掌握动物和植物最重要的区别所在。而后一点,是我们现在正在制定的“做中学”教育标准中,要求学生在4年级以前掌握的科学概念。
欢迎有兴趣的教师和家长对孩子进行类似的评测,并把结果告诉我们,以便我们了解我国儿童目前科学教育的情况。(待续)
发布于5月11日 16:49 | 评论数(22) 阅读数(6174)


评论
有关计算机,协助是已经在进行了。很多天文,生化,化学,物理等等的研究都是大量的利用计算机在自动从试验和观察的资料里面找出假设,建立试验模式和方式。我想主动不主动的差别在于“动机”而不在于行为。
计算机的功能是人赋予的,但是没有保证他们一定不能超越我们。目前有一群学者在讨论"Singularity"的时代的来临。用天文里面叙述黑洞的界面,来形容当计算机真的变成“电脑”,拥有超越人类思考和思维的能力的那一天。这个听起来有点像是科幻小说,但是目前预测这天来临的日子是2020。
对我来说,我相信这样日子的来临,从2020的数字来看,我的女儿才刚上中学。把日子往后在推十年,也是她刚刚进入社会的时候。如何准备她去接受那样的新环境其实也是让我考虑最多的一些事情。
说的有点远,不过我想计算机的应用已经不是单纯的运算了,在目前科学上,甚至生活上都可以指出很多计算机带来的影响。我觉得如何建立对计算机正确概念对新的一代非常的重要。
Singularity Summit
http://sss.stanford.edu/
我们培养学生,重要的是要让学生学会思考、学会疑问,而不是仅仅让学生学会结果。结果并不重要。
技术是可以给我们带来许多的帮助,但是,技术是不会代替我们的思考、思维,也永远代替不了!
教学技巧方面固然重要,但是科学教育的核心是创新教育。原始创新是不能用简单的教育方法和手段达到的,关键要让学生保持原始创新精神是非常重要的。
在科技飞速发展的今天,必须看到问题的两面性,我们不能让计算机搞混头脑。计算机程序不可能协助科学家,协助有主动之意。只有科学家了解程序的功能,才能使用它。计算机的功能,也是人赋予的。
"他答不出来了。我请他想想他养鱼和种水仙的过程中,每天做的事有什么不同。他在引导和启发下总结出植物和动物重要的区别是动物需要依靠其他生物供给养分;植物自己依靠天然的物质养活自己,还提供人和动物生存需要的氧气和养料。"
是不是一定要让他知道植物和动物的区别?我觉得可以留下疑问,让他去研究、去思考!
资料挖掘是透过不同的技术如统计,人工智能,机器学习等等的方式整理资料,建立资料之间的关系。在现在科学资料爆炸的时代,科学的研究要依靠这样的技术建立资料之间的关系。
现代我们之中已经有不少人是掉了手机就没有朋友的,朋友的电话一个也不记得,都纪录在手机里面了。目前对大脑的研究也是,虽然有人说我们大脑用到的不到1%但是大脑一个器官用了身体30%的能量。我们已经开始把一些比较底层的功能转换到机器上了,把能量花在更高层抽象的思考上。
之前也有提到计算机科技以每年加倍(速度加倍,内存,硬盘加倍)在成长。今天4年纪的小朋友,进入大学是10年后,她用的计算机是今天我们用的1000倍的速度,1000倍的容量。她身上带的MP3可能可以跟今天的超级电脑的运算相比。这样的未来,计算机是一个不可缺的工具,是一个资料储存,整理和显示的工具,不是单纯的运算而已。
除了单纯的资料整理以外,也可以做资料的图形显示,透过图形来研究资料。上面这个资料就可以透过图形整理,让小朋友更本能的去看结果。
底下是一些相关的资料,2020的科学是一个很有趣的文章,希望微软能把它翻译成中文,这个文章里面有提到目前和未来科学研究和计算机的关系。也有一些很不错的资料的图形表示。
商业智能初探
http://www.qianjia.com/news/shownews.asp?id=9912
2020 Science
http://research.microsoft.com/towards2020science/background_overview.htm
我对科学教育信息化应用最感兴趣,“资料挖掘的程序整理这些资料”,具体说来听听 ,谢谢!
另外一个我觉得值得讨论的是计算机在科学教育里面的定位。计算机在现在的科学研究里面已经占领了很重要的地位,协助科学家整理资料,甚至透过资料挖掘的方式,找出有趣的假设,让科学家可以专心在理论的建立上。是不是应该把这样的思考方式融入科学教育的一部分,让小朋友提早接触这些计算机的技术?另外一个是透过网络建立小朋友团队合作的习惯。
在这里提出一个这个可以做的方式,提供一个网站,让小朋友可以把日常生活里面观察到的水果蔬菜拍照和观察资料放到上面,这个网站后面可以有资料挖掘的程序整理这些资料,提出有趣的假设让小朋友讨论。如果这个网络可以有全国不同地区的学校加入,可以包含各地有趣的特色水果,让资料更丰富。
东大王平提到的有效性的问题很有道理,管理学上经常提到“你得到的就是你评价的”来强调评价对制度设计的重要性。
我提出对问的问题的意见是我觉得那个是测量小朋友的常识,而不是科学的概念。科学的突破通常是来自于对常识的怀疑。
李大维 朋友提出了一个在评估上有趣、但很重要又常常被忽略的问题,就是有效性(validity)的问题。通俗地说,就是你评价的东西是否是你想要评价的东西。
评价大体上有三类,总结性评测和发展性/形成性前面各位都有提到,实际上还有一类叫诊断性(diagnostic)。不论哪一类,都有其实用范围,不同的目的使用不同的类型。探究式科学教育之所以重视发展性/形成性评价是因为现在科学教育界认为科学更是一个过程,而不是简单的科学知识。科学教育要让孩子们通过过程建立科学知识。所以,使用发展性/形成性评价就显得尤为重要。同时,它是改进教学的一个重要的工具。
我很同意韦老师的观点,学生进行研究性学习,如果没有研究记录,那是对所作的研究不负责任的表现,也让人怀疑研究成果.这是对学生严谨、负责地做事的有效的培养方式。也是我们对教师和学生进行评价的有力依据。
思考我们现在的教育评价体系,的确有很多弊端:仅仅以考试的分数、制作的成果、教研课题成果和论文数量就对学生和教师进行评价,而没有对考试分数等“成果”的获得过程进行评价,这样的评价结果的可信度是不高的。同样的分数,靠汗水得来与靠研究性学习得来和靠投机得来的性质是有很大区别的;同一个小制作,自己做与别人帮着做和花钱请人做更是区别很大;同样搞课题研究,闭门造车与夸大其辞和实践总结所形成的成果又是不是一样的呢?
我们的教育评价体系是该改革了,应该以务实、发展的观点,以人为本的观点对教师和学生以及我们的教育工作进行评价。
任何课程的评估和测评都对课程的学习有导向作用。英国中小学课程的教学大纲本身就是课程评估的标准。不要预期它是不变的,需要每年不断修订。应该形成专业性的职业化的工作。
初来,问一下:哪里可以看到这个项目的教案阿?或者哪里有买的
韦老师您好:
作为一名科学教师,我在对当前科学教育发展不受重视的现状感到不满的同时,也在庆幸自己有较大的余地可以进行教学方式和评价方式的尝试。
今天在看了您的帖子之后,我希望能够得到更多的关于发展性评价和总结性评价的方法指导。您能够提供帮助吗?
谢谢!
我的邮箱是:lzfly1112@hotmail.com
首先十分敬佩韦老师亲自进行水果篮主题的研究和实践!
看了上面韦老师写的内容,我也得到很多启发,现写出和大家交流和讨论,并希望能够得到批评和指正!
从上面韦老师举例一个四年级学生观察和记录一篮水果的外部特征及对话中得到两个最大的启示:一、把形成性评价作为一种教学策略 二、上述对话属于无操作辅助访谈类型,用来探明儿童眼中的“现实世界”。
想要培养学生的创新意识和能力,必须重视学生平常的科学学习。要用好课堂教学的每一分钟,这样我们的目标才会指日可待。在“做中学”探究式科学教育中我们十分重视形成性评价,并把它作为了解学生前概念、检测学生对概念理解程度、监测教师教学法有效性、教学内容难易程度的重要的策略。通过对科学概念、科学技能各分成三个不同水平的等级对学生进行一课及整个单元的连续评测,这种评测的结果可以给教师、学生、家长、教育行政主管评阅。
《美国国家科学课程标准》中认为,有效的形成性评价具有三个指导性问题的结构框架:
1、 你要达到什么目标?
2、 你现在处于什么水平?
3、 你如何达到目标?(帮助学生寻求达到目标的策略和技能。)(摘自《中小学科学教学——基于项目的方法与策略》[M] 美国 JOSEPH S.KRAJACIK 等著,王磊等译 高等教育出版社 2004.5)
对于如何收集学生对于科学概念、科学探究技能的理解和掌握的信息,主要可以采用观察法、基于概念图的评价方法、基于课堂考试的评价方法等。
绘制概念图要注意几个要点:
1、要列出各个概念的名称
2、各个名称按照相关性来排列,并用连线相接
3、在连线上写下有关的词语,以组成一系列的概念陈述
基于课堂考试的评价方法。这种方法是教师常用的教学方法,通过考试可以为学生和教师提供反馈信息。这是利用好考试的正面例子。但是在编制考试试题的时候需要考虑到,编写试题是具有挑战性的工作,编写低认知水平的题目很容易,编写中等和高难度认知水平的题目不是很容易的。如何编制形成性试题是值得研究的。
上述与四年级学生的对话形式属于无操作辅助访谈类型。皮亚杰的著作《儿童对世界的概念》(1926年)一书中记录了许多对5-15岁儿童的这种访谈。它是发生在儿童和访谈者之间的一种纯口头性的交谈。这种访谈模式有优点也有缺点,例如,一个缺点是口头语言在不同的情境中可以做不同的理解,从而产生误解。
为了克服无操作辅助访谈的缺陷,皮亚杰在1946出版的两书中谈到有操作辅助的访谈,即采用儿童可操作的仪器、物品、实验等可操作性的材料进行访谈。这种访谈更适合对儿童的分类、排序、时间和运动、质量和密度、识别和控制变量等科学概念和科学技能进行更深入的了解和习得。在《儿童如何学科学——概念的形成和对教学的建议》(作者:美国 罗纳德.G.古德 人民教育出版社2005.9)第二章中,对这种有操作辅助的访谈在儿童科学概念和技能的形成有大量应用和举例。
我并不是在做形成性评价(我把形成性评价议程发展性评价),而是在面对面的作总结性评测,评测这位学生观察、对比、分类和归纳的能力,以及对“果实”、动、植物本质区别的理解。我理解发展性评估要在科学教育的过程中进行。皮亚杰对儿童前概念的测评,主要是逻辑概念和数学方面的概念比较多,古德那本书是2005年在中国出版的,但是你仔细读一下,古德是什么时候写的,他引用的参考资料是什么年代的,在那以后人们是怎样评价皮亚杰的,科学教育有了哪些新的进展。l
另外,我进行的也不是无操作辅助访谈,你理解错了。
韦院士关于测评的总体思考我是非常赞同的。认真看过韦院士的探究式学习的书后,更是获益良多。对于目前评测的状况,我有一点想法想请教。对于日常科学教学,发展性评价主要用来促进学生的学习,教师根据课堂中的评测反馈情况灵活改变教学策略,提高科学教育的成效;对于总结性评测,发展性评测虽然提供了学生的信息,但我们需要在更大范围内的如PISA那样的公共测试,以提供整个科学教育状况的信息,这一点,我们国家一直是没有的,由此造成不识庐山真面目的自得。
韦博士使用四年级学生的例证,考察学生观察、对比、分类和归纳的能力以及对“果实”、动、植物本质区别的理解是很好的。我个人感觉对10岁的孩子,这个例子略有些复杂,可能适合大脑发育比较快的学生。对一般学生,是否先选5-6种水果和4-5种特性,然后在扩展。重要的是学生思考的过程,是否学生观察、对比、分类和归纳的思维模式可以建立起来,一开始题目不必过于复杂。
此外,再次邀请关心教育具体问题的人士加入我们《爱人生的BLOG》的讨论: http://blog.sina.com.cn/u/1231524183
对于果实的评测案例,我有一点不同的意见,恳请韦院士执教。
评测对象是四年级的学生,依据个人经验,这个观察活动对这个年龄层的学生的吸引力已经不大,估计这个记录是那种听话的孩子所完成的。为什么要做这个观察记录,它对孩子的吸引力在哪里,对孩子的挑战在哪里?进而还要思考如何让孩子从这些观察的事实中自己去发现科学知识,并在应用中进一步理解。
显然,这个材料是老师事先准备好的,都是典型的果实。我在教学中却总是让学生自己准备材料:“请同学们把自己认为是果实的东西多准备一些带到学校来。”他们带来的材料中,既有典型的果实,也有土豆、番薯等根茎;既有干制去皮了的核桃,也有花生、野草的果实。教师还可以刻意准备一些有争议的。所有这些都是为了激起争执、激发矛盾,使学生的日常概念在这里“打架”,从而激发学生的观察比较欲望,这个时候所做的记录对于学生来说才是有意义的--为了寻找证据而作观察。学生在反反复复的争论和观察后,果实的概念就基本上可以出来了。在这个过程中,我认为要有两方面的记录:一是观点碰撞演进的记录,二是果实的属性的观察记录。我们目前都很重视后者,但是,如果没有前者,观察就可能丧失目的性,成为为记录而记录了。
在这里,我谈的是课堂教学,您谈的是总结性评测,目的不同,但我想,如果是在发展性评价的范畴内,我和您的目标应该是相同的,您看呢?谢谢指教。
教育评测该是必须做也是最难做的了,难得老师们把工作推进到如此深入细致的程度。
我不是科学教育的专业教师,大致想一想,觉得要确定一个不同年龄的孩子所应掌握的科学理念和能力的标准真的是好难。有一位四岁半的小朋友郑重地告诉我“我发现小鸟长大了变成鸡。”我非常高兴于她依自己的观察、推理获得了发现,但并不去纠正她。我相信她养一只小鸡、或者凭借她的观察力完全能够自己获得。这势必需要时间,那么是否可以说所有的科学概念也是如此。
有些问题我会在下一篇博客中回答和讨论.水果蓝的案例会放在汉博网上.联系我们可以用给出的电邮地址.Ireine不妨和她谈谈,问问她,为什么她这么说?她是怎么观察到的?这个问题对四岁的儿童来说,常常是想像,而不是源于观察.
"通过这次评测活动,说明他基本掌握了进行对物体外部特征进行观察、比较、分类和记录的能力,也能归纳出水果的特征。但是,原来并没有掌握动物和植物最重要的区别所在。而后一点,是我们现在正在制定的“做中学”教育标准中,要求学生在4年级以前掌握的科学概念。"
这里我觉得有点问题,一个是提供的资料里面都是“植物”,从科学研究的角度上来看如何去归纳这些跟不在资料里面的“动物”的不同?向日葵,含羞草和竹子也不在观察的资料里面?
科学的研究是观察,建立假设,搜集详尽的资料,透过统计做总结整个资料证实还是推翻假设。是不是我们出给小朋友的问题也应该是合乎科学的呢?
感谢韦老师的点评和中肯批评! 我感觉自己才疏学浅,还需要不断进取!
罗纳德.G.古德教授的 《儿童如何学科学——概念的形成和对教学的建议》一书是对20世纪20年代---80年代有关科学认知研究成果的梳理和总结。他引用的文献是1935年---1974年的。
我理解的形成性教学评测(Formative Assessment),是教学过程中随时了解学生的学习状况(条件、过程、结果),为采取适当的教学措施提供支持。终结性(或总结性)教学评测是指在教学结束后,为相关部门提供证明,是指在学期末或毕业时对学生的综合评估。
在发送讨论后,我还在想:是否应该属于无操作辅助性访谈?还是属于有操作辅助性访谈?现在我想,结合上面对水果的分类、比较、记录等操作,还是应该属于有操作辅助的访谈。
像韦老师提醒我的:要注意文章的作者的写作年代,观点是否是最新?科学教育的研究的历程和基本观点是怎样的?研究方法是否科学、巧妙?等问题。同样在我们的教育领域、科学教育领域确实需要做些实在的研究,确实需要聚集一帮人,研究我们中国当代急需的教育,研究其理论和实践!这种研究的出发点和落脚点都必须是中国的,而外国的经验和结果只能是作为借鉴。
发表评论