▲一般来说,测验的项目分析包括定性分析和定量分析。
▲项目的定性分析包括考虑项目的内容效度、题目编写的恰当性和有效性等。
▲项目的定量分析包括对题目难度和区分度等。
第一单元 项目的难度
一、定义:指项目的难易程度。
▲难度P的指标用通过率表示:
P=R/N×100% (公式5-15)
公式中:①P为项目的难度。②R为答对或通过的人数。③N为全体受测者人数。
④以通过率表示难度时,P值越大,难度越小;P值越小,难度越高。
▲在能力测验中通常反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标称通俗性。
二、计算方法:①二分法记分。②非二分法记分。
(一)二分法记分的项目
▲选择题:①通过记1分,错误记0分。②此类题目可直接用(公式5-15)。
▲计算测验总成绩时,将受测者分成三组:①分数最高的27%受测者为高分组(NH)。②分数最低的27%受测者为低分组(NL)。③中间46%的受测者为中间组。
*分别计算NH和NL的通过率,以两组平均通过率作为每题的难度:
P=(PH+PL)/2 (公式5-16)
公式中:①P为每题的难度(两组平均值)。②PH为高分组通过率。③PL为低分组通过率。
▲在370名被试者中,选为高分组和低分组的被试者各有100人,其中高分组有70人答对第1题,低分组有40人答对第1题,则第1题的难度为0.55。P=(0.7 0.4)/2=0.55.
(二)非二分记分的项目
▲当测验项目为问答题或不能用二分法记分的形式时,每题的难度:
P=x̅/Xmax×100% (公式5-17)
公式中:①P为每题的难度。②x̅为全体受测者在该题上的平均分。③Xmax为该题的满分。
▲数学测验的第7题满分为15分,该题平均得分为9.6分,则该题的难度为0.64。P=9.6/15=0.64。
三、难度水平的确定
*进行难度分析的目的:为了筛选项目。
*项目难度的大小:取决于测验的目的、性质以及项目的形式。
(一)项目的难度
▲难度P值:①越接近于0或接近于1,越无法区分被试者之间能力的差异。②相反,P值越接近于0.50,区别力越高。
▲用于选拔或诊断时:①应该比较多地选择难度值接近录取率的项目。②如录取率20%,难度最好确定为20%。
▲对选择题来说:①P值一般应大于概率水平。②P值等于概率,说明题目可能过难或题意不清,受测者凭猜测作答。③P值小于概率,说明题目质量有问题。④是非题的难度值0.75最为合适。⑤四选一的题目,难度值0.63最合适。
(二)测验的难度:直接依赖于组成测验的项目的难度。
▲如果受测者样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分布.
▲偏态分布:得分多数偏高或偏低。分为“正偏态分布”(分数集中在低端,偏难)和“负偏态分布”(分数集中在高端,偏易)。
▲应选择难度在0.50左右的试题比较合适,各题难度应在0.50±0.20之间。
第二单元 项目的区分度(鉴别力)
一、定义
*项目区分度(鉴别力):①是指测验项目对被试者的心理特性的区分能力。②是评价项目质量和筛选项目的主要指标。③也是影响测验效度的重要因素。
二、计算方法:①鉴别指数。②相关法。
*在具体估计项目区分度时,我们常用其他指标替代实际能力水平,其中用得最多的是测验总分。
(一)鉴别指数
▲步骤:①按测验总分高低排列答卷;②确定高分组与低分组,每一组取答卷总数的27%;③分别计算高分组与低分组在该项目上的通过率或得分率;④按下列公式估计出项目的鉴别指数:
D=PH-PL (公式5-18)
公式中:①D为鉴别指数。②PH为高分组通过率。③PL为低分组通过率。
▲1965年,美国测验专家伊贝尔提出用鉴别指数评价项目性能的标准:
(二)相关法(最常用)
▲常用的计算方法:①点二列相关;②二列相关;③ф相关法。
▲区分度取值范围:①介于-1与 1之间。②区分度为正值,则呈正相关。③区分度为负值,说明项目得分与实际能力水平之间呈负相关(必须淘汰)。④相关系数越大,区分度越高。
三、区分度与难度的关系
▲难度与区分度的关系:①较难的项目对高水平的被试者区分度高,②中等难度的项目对中等水平的被试者区分度高,③低等难度的项目对低等水平的被试者区分度高。
▲项目难度的分布:①一般以常态分布为好,②这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试者具有较高的区分能力。
§ 第六节 测验编制的一般程序 §第一单元 测验的目标分析
一、测验的对象:该测验编成后要用于哪些团体。
▲编制测验做到有的放矢:①年龄;②受教育程度;③社会经济水平;④阅读水平。
二、测验的用途:①显示(描述/诊断);②预测(选拔)
(一)显示性测验
是指测验题目和所要测量的心理特征相似的测验(如成就测验)。
▲古德纳夫曾经将显示性测验又分为:
(1)样本测验:①题目取自一个很明确的总体的测验。②如测量四则混合运算能力。
(2)标记测验:①题目取自一个全开放的总体的测验。②如智力测验。
(二)预测性测验:
①预测一些没被测量的行为的测验。②即通过测验分数使我们能预测一个人在不同情境下的行为。
▲显示性测验和预测性测验的区分并不是绝对的(如高考):
①高考题目来自课本,可以说高考是样本测验。②高考成绩用来预测大学里的学习成绩,因些又是预测测验。
三、测验的目标:
指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
▲目标分析:测验编制者既要明确心理测验的目标,还要对测验目标加以分析,将其目标转换可操作的术语。
▲目标分析的分类:①工作分析;②对特定概念下定义;③确定测验的具体内容。
(一)工作分析(任务分析):如职业兴趣测验
对于选拔和预测功用的预测性测验,它的主要任务就是要对所预测的行为活动作具体分析。
▲工作分析的步骤:①确定哪些心理特征和行为可以使要预测的活动达到成功;②建立衡量被试者是否成功的标准(效标)。
(二)对特定概念下定义:如创造力的测量
①为了测量某种特殊的心理品质,必须给所要测量的心理特质下定义。②然后必须发现该特质所包含的维度将通过什么行为表现出来或怎样进行测量。
(三)确定测验的具体内容:如成就测验
①如果是描述性的显示测验,其主要任务则是确定显示的内容和技能,从中取样。②它的内容分析过程主要体现在双向细目表的编制过程中。
第二单元 测题的编写
*编制测验题目: ①是心理测验编制过程中最重要的一环。②涉及写出,编辑,预试,修改等一个循环过程。
一、搜集资料:
题目来源分为三方面:①已出版的标准测验;②理论和专家的经验(如编制态度量表);③临床观察和记录(如MMPI就是从病历记录)。心理测验题目的来源应该排除直接翻译国外测验的题目。
二、命题原则:①内容方面;②文字方面;③理解方面;④社会敏感性方面。
(一)内容方面:
①内容符合测验的目的;②避免贪多而乱出题;③内容取样要有代表性;④题目间内容相互独立。
(二)文字方面:
①使用准确的当代语言;②语句简明扼要;③排除与答案无关的因素;④最好是一句话说明一个概念。⑤意义要明确不得含糊。⑥尽量少使用双重否定句。
(三)理解方面:
①有确切的答案;②除创造力测验和人格测验外不应具有引起争议的可能;③内容不要超出受测团体的知识水平和理解能力;④格式要不被人误解。
(四)社会敏感性方面:
应尽量避开社会敏感性问题,涉及社会禁忌或个人隐私的题目尽量不用。
*菲力普列举三条策略:①命题时假定被试者具有某种行为,使他不得不在确实没有该行为时才否定;②命题时假定规范不一致;③指出该行为是常见的,虽然是违规的。
三、编制要领
*测题分两大类:①提供型(论文题、简答题、填充题)。②选择题(选择题、是否题、匹配题)。
(一)选择题:①题干;②选项(正确答案,诱答)。
*选择题编写必须注意:①题干问题明确,使用简单而明晰的词语;②选项简明扼要;③每题只给一个正确答案;④长度相等;⑤避免题干用词与选项用词一致;⑥选项最好用同一形式。
(二)是非题
*编制是非题应注意:①内容以有意义的概念、事实或基本原则为基础;②每道题只能包含一个概念;③尽量避免否定的叙述,尤其是双重否定;④若是表达意见的题目,最好说明意见的来源和根源;⑤“是”、“非”题的数目应基本相等,随机排列
(三)简答题:①填充题;②简答题。
*编制简答题的原则包括:①宜用问句形式;②填充形式的空格不宜太多,空出的应是关键词句;③每题应只有一个正确答案。编制简答题的原则不包括将其操作化。
(四)操作题:
*编制操作测验的原则:①明确所要测量的目标,并将其操作化;②尽量选择逼真度较高的项目;③指导语要简明扼要,主要让受测者明白要他们做什么和在什么条件下做;④制订评分标准,确定计分方法。
第三单元 测验的编排和组织
一、合成测验
(一)选择与审定试题
1.选择试题的形式:
①测验的目的;②材料的性质;③接受测验的团体的特点;④各种实际因素。
2.审定题目:
①范围应与测验计划的内容技能双向细目表相一致;②数量要比最后所需的数目多一倍至几倍;③难度必须符合测验目的;④题目说明必须清楚明白。
(二)测题的编排:
①难度逐步上升,先易后难;②将同类型的测题组合在一起;③依各种类型测题本身的特点。④答案混合排列。
*测题两种排列方式:
①并列直进式(韦氏智力量表);②混合螺旋式(优点是维持作答兴趣,比内-西蒙智力量表)。
二、测验的预试
(一)预测:目的在于获得受测者对题目如何反应的资料。
*预测应注意:①对象应取自将来正式测验准备应用的群体,注意其代表性;②实施过程与情境应力求与将来正式测验时的情况相近似;③时限可稍宽一些,最好使每个被试者都能将题目做完,以搜集充分的反应资料;④预测过程中,随时记录被试者的反应情形。
(二)项目分析:
①质的分析:从内容取样的适用性、题目的思想性以及表达是否清楚等方面加以评价。
②量的分析:对预测结果进行统计分析,确定题目的难度、区分度、备选答案的适合度等。
*项目分析可以重复再做一次,比较两次的结果一致性。
三、信度和效度考察
四、常模制订
在将来要使用测验的全体对象中,选择有代表性的一部分人(称标准化样本),对此样本施测并将所得的分数加以统计和整理,得出一个具有代表性的分数分布。
五、编写指导手册(测验指导手册)
①测验的目的和功用;②编制的理论背景,选材的原则、方法;③实施测验的说明,测验的标准答案和记分标准;④常模资料。⑤测验的基本特征。
§ 第七节 心理测验的使用 §第一单元 主试的资格
▲主测者的资格:①技术方面(知识结构、心理测验专业理论知识、专业技能);②道德方面(职业道德)。
一、知识结构
①心理学基础知识;②本行业的专业知识。
二、专业理论知识和专业技能
(一)专业理论知识(最基本条件):
①对心理测验的特点、性质和作用的认识;②对心理测验局限性的认识;③了解测验的基本特征;④熟悉保证心理测验标准化的必要性。
(二)专业技能:
①主试者必须具有实际操作心理测验的专业技能和经验。②接受严格、系统的心理测验专业训练。③熟悉有关测验的如下方面(测验内容、适用范围、测验程序、记分方法)。④投射测验对主试者要求更高。
三、职业道德
▲主试者的职业道德包括:①测验的保密;②测验的控制使用;③测验中个人隐私的保护。
▲心理测验的保密涉及到:①测验内容;②测验结果;③个人隐私。
第二单元 测验的选择
▲选择测验必须注意:①适合测量的目的;②符合心理测量学的要求。
一、所选测验必须适合测量的目的
二、所选测验必须符合心理测量学的要求:
①应考虑该测验是否经过了标准化;②注意时效性,不要使用没有重新标准化的经典测验。
第三单元 测验前的准备及注意事项
一、测验的准备工作:
①预告测验;②准备测验材料;③熟悉测验指导语;④熟悉测验的具体程序。
二、测验中主试的职责:
①应按照指导语的要求实施测验,不带任何暗示;②测验前不讲太多无关的话;③主试者不应对被试者的反应做出任何暗示性动作,保持和蔼、微笑的态度;④对特殊问题要有心理准备。
三、建立协调关系:
主试者和被试者之间建立了一种友好的、合作的、能促使被试者最大限度地做好测验的关系。
第四单元 测验实施的程序及要素
一、指导语:
(一)对受测者的指导语:
①如何选择反应形式(口答、书写);②如何记录这些反应(答题纸、录音、录像);③时间限制;④如果不能确定正确反应时该如何操作(是否允许猜测);⑤给例题;⑥有时告知被试者测验目的。
(二)对主测者的指导语:要严格按照施测指导书中的有关规定去做,不要任意发挥和解释。
二、时限:
心理测验除典型行为测验以外,都有时限。
三、测验的环境条件:
①完全遵从测验手册的要求;②记录下任何意外的测验环境因素;③在解释测验结果时也必须考虑这一因素。
▲安排测验材料不是对测验环境条件的要求。
第五单元 受测者误差及控制方法
一、应试技巧与练习效应
(一)应试技巧
被试者对测验的经验或应试技巧会影响测验成绩,“测验油子”的表现有:①能觉察出正确答案与错误答案的细小差别;②懂得合理分配测验时间;③常常是各种题型都见过;④熟悉测验的程序。
(二)练习效应
受练习效应影响较大者的具体表现:①教育背景较差、经验较少、智力较高者;②着重速度的测验;③重复实施相同的测验。④两次测验的时距越大,练习效应越小,相距三个月以上可忽略不计。⑤一般的平均练习效应应约在1/5个标准差之下,并且仅限于第一次及第二次重测,第三次起练习效应增加不明显。
二、动机与焦虑因素
(一)应试动机:
①动机效应在在测量成就、智力和能力倾向等变量时,随受测者动机情况,表现明显。②动机效应在测量态度、兴趣及人格等典型行为表现时也有影响。③受应试动机影响不大的测验是投射测验。
(二)测验焦虑
▲适度的焦虑会提高最高行为测验,即智力测验、成就测验和能力倾向测验的成绩。
▲焦虑对测验成绩的影响呈倒U形曲线。
▲测验高焦虑的影响因素:①对自己能力没有把握;②抱负水平过高,求胜心切;③缺乏自信、患得患失、情绪不稳定;④测验成绩关系重大,压力过大;⑤对测验程序不熟悉。
▲降低焦虑的方法:①教学或辅导。②熟悉测验程序。③主测对测验目的和程序清楚的解释。④适当鼓励。
三、反应定势(反应风格):
指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试者得到不同的测验分数。
▲几种常见的反应定势:①求“快”与求“精确”;②喜好正面叙述;③喜好较长选项;④喜好特殊位置;⑤猜测。
(一)求“快”与求“精确”的反应定势
▲有时间限制的测验:求“精确”的反应定势就可能降低测验成绩。
▲纯粹的难度测验:求“快”的反应定势就可能降低测验成绩。
▲对策:除非“反应速度”本身即为重要的研究目标,否则让被试者有充分的时间反应,同时注明每题的答题时间,以减少求“快”与求“精确”定势的影响。
(二)喜好正面叙述的反应定势(肯定定势)
▲对策:在编制是非题时,“是”、“否”题大致相等或答“否”题略多。
(三)喜好特殊位置的反应定势
▲对策:在测验编制过程中,在整个测验中正确答案出现在各位置的概率相等。
(四)喜好较长选项的反应定势
▲对策:在编制测验时,只要我们尽量使选项的长度一致,就不难避免这类问题。
(五)猜测的反应定势
第六单元 测验的评分
一、原始分数的获得
▲使评分尽可能客观应:①及时而清楚地记录反应情况(口试和操作测验);②要有记分键;③将受测者的反应和记分键比较,对反应进行分类。④记分和分数的合成要准确无误。
二、原始分数的转换
第七单元 测验结果的报告
一、测验分数的综合分析:
①根据心理测验的特点进行分析。②不能把分数绝对化,更不能根据一次测验的结果轻易下结论。③对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料。④来自不同测验的分数不能直接加以比较。
▲测验分数一般应是一个范围而不是一个确定的点:如在韦氏智力测验中,通常是用测得的IQ值加减5(85%~90%的可信限水平)的方法判断IQ值的波动范围。
▲不能把分数绝对化,具体表现:①为了能对测验分数做出有意义的解释,必须将个人在测验前的经历考虑在内。②测验情境也是一个需要考虑的因素。
▲在解释测验分数时,一定要依据从如下获得的资料:①最匹配的情境;②最相近的团体。
▲为了使不同测验分数可以相互比较,必须将两者放在统一的量表上。有两大类方法将两种分数等值化:
①一类叫等百分位等值法(用相同的百分等级作等值的基础);
②另一类叫线性等值法(用相同的标准分数作等值的基础)。
二、报告分数的具体建议:
①应告诉知对于测验分数的解释,并非仅仅报告测验分数;②避免使用专业术语;③保证当事人知道该测验测量或预测什么;④要使当事人知道他与什么团体比较;⑤要使当事人知道如何运用他的分数;⑥考虑给当事人带来的心理影响;⑦要让当事人积极参与测验分数的解释。