导读现代社会中无处不在的丈量与量化是人们知道世界的一种科学办法。以心思学为导向视角,心思学和计算思维被联络起来,以协助树立心思学理论与解说人类行为。不同于温度、压力等物理特点丈量,心思丈量包含对智力、常识、才能、情绪、品格特质的丈...
现代社会中无处不在的丈量与量化是人们知道世界的一种科学办法。以心思学为导向视角,心思学和计算思维被联络起来,以协助树立心思学理论与解说人类行为。不同于温度、压力等物理特点丈量,心思丈量包含对智力、常识、才能、情绪、品格特质的丈量和教育丈量,是一种高度内隐化与笼统化并依赖于模型的研讨范畴。依据对心思丈量具有不完善性的一致,心思丈量学家对科学的一起奉献是将差错的概念引进计算模型,而且开展出对丈量效果进行点评与解说的规范与系统。现在,心思与教育丈量现已渗透到社会日子的各个阶段,跟着跨学科协作的日趋深化,社会开展需求的不断前进,新技能、新仪器以及跨范畴研讨的很多出现,心思丈量理论的开展和实践运用都面临着新的关键与应战。
心思丈量的理论开展
心思丈量学起源于19世纪末20世纪初,经典查验理论(Classical Test Theory, CTT)是最早完成数学方式化的心思丈量理论。该理论将个别在丈量东西上的体现称为查询分数,查询分数既包含丈量东西所测特性的实在值,也包含丈量中存在的差错。尽管实在值无法直接取得,但可以经过查询分数来直接推出,当重复进行无限屡次丈量时,查询分数的期望值就会无限接近于咱们注重的实在值。CTT的理论系统较为完好,模型直观形象、易于了解,已被广泛承受和运用。但该理论仍存在一些局限性,例如,对丈量差错及其来历的知道较为笼统,忽视了丈量情境对差错的影响;对丈量的查验依赖于平行查验,但平行查验的条件在实践运用中较难满意;标题参数的无偏估量依赖于有代表性的样本,易受抽样办法的影响;每次查验对特定整体只要一个丈量规范误,即丈量差错关于每个被试都相同,这并不契合大多数人的一致。
概化理论(Generalizability Theory,GT)提出“丈量情境联络”这一中心概念,认为丈量方针和丈量情境一起构成了丈量情境联络,使丈量拓宽到依据丈量效果所作出的推论或决议计划质量的点评。GT对丈量分数的总方差进行分化、估量差错来历、尽或许减小差错方差,依据概化系数牢靠性指数来点评查验的精度,同一个丈量方针跟着查验的性质和查验情境联络的不同,可以有多个信度。
从经典查验理论到现代查验理论的改变发生在20世纪六七十年代,美国心思丈量学家洛德(Lord)在1952年初次提出双参数正态肩形曲线模型,标志着项目反应理论(Item Response Theory,IRT)的发生。IRT认为被试的潜在特质水平可以解说其在查验中的体现,并用项目特征函数来提醒项目作答行为与潜在特质水平的量化联络。IRT关于不同才能的被试有不同的丈量规范误,这意味着同一道标题关于不同才能丈量的牢靠性和奉献存在差异,使其在理论上更具有说服力。但是,因为IRT的根本假定(单维性、部分独立性和单调性)在大部分查验场景中很难满意,多维项目反应理论以及很多拓宽模型应运而生。曩昔20年,IRT的模型开发、参数估量算法、IRT在点评中的运用等研讨依然是心思丈量学范畴期刊内容的重要组成部分。
20世纪80年代,认知心思学对被试问题处理加工进程的深化知道,为心思与教育查验的编制与剖析供给了新的思路,成为教育点评范畴新的里程碑。无论是CTT仍是IRT,被试的才能均按顺序排列在特定才能或特质的接连体上,而认知确诊模型(Cognitive Diagnostic Model,CDM)可以供给丰厚学习进程和精确学习效果的确诊信息。考生在查验上的体现被看作一系列动态心思进程的加工效果,将动态的心思进程笼统为“认知特点”,便可以将查验标题与认知特点对应起来——Q矩阵,然后经过建构愈加精美的模型来揣度考生在查验所考察认知特点上的常识状况,从教育视点协助学生赶快查漏补缺,为完成对症下药奠定根底。
心思丈量的实践运用
心思丈量的开展不只是理论与模型的研讨进展,还体现在心思丈量的大规模实践运用中。从1904年第一个智力查验量表面世以来,经典丈量理论在前期就被敏捷推行并运用于品格、智力、情绪、爱好、动机、行为方式与认知开展等各种心思品质或本质的丈量中,对心思学奉献十分大,是构建心思学理论或试验研讨的东西。经典丈量理论的开展为处理实际问题供给理论辅导,用于查验丈量的信度和效度的内在不断被更新,从开端的效标效度开展到包含从查验编制到查验施行,从分数解说到决议计划点评,形成了一个确保实践中丈量效果在多大程度上被正确运用的证明系统,并长时间辅导心思丈量实践。20世纪80年代今后,IRT模型以其多种方式对教育点评和人力资源发生的严重影响,从曾经微乎其微的运用开展到现在在许多国家的遍及运用,成为大规模点评项目中运用最广泛的模型。在曩昔的一个世纪里,不断开展的心思丈量理论与模型被广泛运用于教育、人力资源、临床医疗、市场查询、危险决议计划、工业、体育、政治与军事等现代社会的各行各业,使心思丈量成为一个具有巨大商业影响的昌盛范畴。
教育点评仍是心思丈量运用最重要的范畴。心思丈量作为教育点评的东西,可以经过丈量协助教师发现学生的心思问题或学业短板,有针对性地对其进行心思干涉或教育。美国教育研讨协会、美国心思学会和美国国家教育丈量协会一起公布的《教育与心思丈量规范》提出了查验编制、施行所应遵从的根本原则,规则了考试所应到达的技能要求。许多大型考试安排、教育集团、国家教育安排、人事安排投入查验的开发与施行中,例如,美国教育考试服务中心开发了美国大学入学考试、研讨生入学考试、学术才能点评查验、世界交流英语考试、面向母语非英语者的英语才能考试和经企办理研讨生入学考试等。现在,心思丈量被广泛运用于查验的规划、编制与施行、题库建造、分数陈述、公正性查验等一系列教育点评的环节,各种程序与运用现已十分老练。环绕学生的点评包含成果查验、学习才能猜测、人才选拔查验、档案式点评以及学生和成人集体的大规模查询点评,例如品格查询、价值观查询;环绕教师和教育质量的点评包含讲堂点评、增值性点评、教育行为查询办法查询等;环绕世界教育的点评包含世界阅览素质点评研讨、世界数学和科学趋势研讨、经济协作与开展安排施行的世界学生点评项目等。此外,人力资源的开发呼喊高质量的查验。环绕人才选拔与工作选择的点评实践,美国劳工部拟定了《查验与点评:雇主有用攻略》,协助各级办理者及人力资源部分在法令的框架下合理运用查验。各类准入类工作资格考试开端运用于工作选拔,例如医生资格考试、教师资格考试、飞行员选拔查验、建筑师注册考试等,对从业者的工作素质进行考察。此外,心思丈量对方针剖析的支撑和奉献也在添加,不只用于教育理论研讨和点评实际问题的处理计划,也协助政府官员和大众进行重要的方针剖析,触及教师方针、教育改革、法令、性别与教育时机公相等社会问题。
跟着点评从注重效果的单一化点评向注重进程的多元化与形成性点评的转向,认知确诊的思维与模型受到了越来越多来自不同范畴的注重,心思丈量范畴和计算机范畴的一起努力推进了依据认知确诊的自适应学习与自适应测评的开展与运用。多模态数据的搜集与智能处理技能为打破本来实践中难以处理的问题带来更多或许,计算机主动评分技能、交互式、游戏化等新式测评方式不断出现,被运用于各类考试与职业中。面临当下快速更迭的环境与技能,心思与教育丈量的专业人员应坚持敞开与达观的情绪,交融计算机、认知科学等其他范畴的先进技能,推进心思丈量长久以来堆集的经历与办法更好地服务于实践。
智能年代心思丈量面临机会与应战
不断开展完善的丈量理论是处理实践进程中问题的根底,社会持续开展发生的新需求一起也影响着丈量办法和技能的改造。当时,心思丈量学简直涵盖了一切对人类行为和社会科学有用的计算办法,出现出与其他学科快速交融趋势。在这个进程中,心思丈量的理论和实践都面临着史无前例的机会和应战。
智能信息年代出现出很多的实践需求与开展关键。一方面,前进丈量的生态效度、高效方便地进行大规模施测的需求依然存在;另一方面,电子设备逐渐融入咱们的日子,影响着咱们在虚拟和实际环境中的行为和特质。已有研讨为咱们出现了心思丈量与信息化交融的或许。例如,丈量的数据来历不再局限于问卷或查验,可以来自虚拟环境中的行为痕迹和文本信息,乃至还可以是图片和视频信息以及穿戴设备记载的生理信息。在完成对个别特质、才能丈量的根底上,可以为个别供给有用的反应和主张,完成个性化的自适应学习。尤这以后疫情年代加快了在线教育的大规模完成与运用,尽管可以解当务之急,但在线教育与点评的新范式远未到达规范与合理化要求,心思丈量与其他学科范畴的交融与开展还需要留心许多问题。在未来多种丈量范式共存的开展趋势下,现代心思丈量学已不只是心思学与计算学的结合,其与不同的学科范畴也形成了穿插联络。今世心思丈量学是一个多元化的研讨范畴,在爱惜多元化开展的一起,应打破不同范畴各自为营的壁垒,从头考虑心思和教育丈量的规范和概念系统。
心思丈量快速开展的趋势带来了一些应战性的问题。首要,跟着认知科学和信息技能的开展,比以往任何时候都丰厚的个人数据与传统丈量数据有很大不同。其次,数据与模型复杂性的添加导致许多模型都是一个黑盒子,躲藏了重要的算法和假定,而心思丈量及其他学科范畴关于大数据的搜集和解说才能依然十分有限。因而,对丈量东西的开发、施行与解说,应愈加注重数据搜集与处理工作的牢靠性,心思丈量的专业人员有必要作为牢靠的中间人,坚持对丈量效果和运用点评的活跃寻求。科学合理地剖析丈量数据并依据丈量效果做出正确的决议计划,关于当今社会和未来依然至关重要。在这个进程中,心思丈量学家应当秉承慎重与达观的情绪,发挥本身优势,对详细的操作程序与规范规范提出有用的点评计划,统筹丈量的功率与公正。
从未来的开展看,心思丈量学不只仅是一个供给计算与数据剖析模型或办法的东西箱,更重要的是,面临当下快速更迭的运用环境与需求,激起各范畴对丈量意义的考虑,在心思丈量与其他学科理论快速交融的开展期,坚持对丈量方针和办法本质意义的寻求,然后推进心思丈量理论和实践的长足开展与前进。
(作者单位:北京师范大学我国根底教育质量监测协同立异中心)
来历:我国社会科学网-我国社会科学报 作者:辛涛