时间:2023-08-30 16:38:33
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇统计学的标准差范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
摘 要:平均差优于标准差这一观点一直以来都存在一定支持者,但仔细分析不难发现这一观点根本不能成立。从计算方式、数学关系、敏感性和正态分布下的换算公式推导四个方面对标准差与平均差展开研究,可以得出以下结论:第一,标准差与平均差有着统一公式和数学关系。第二,平均差计算过程有低估变异性问题。第三,平均差难于动摇标准差在统计学中的重要地位。
关键词 :统计学;平均差;标准差
中图分类号:O212文献标识码:A文章编号:1673-260X(2015)08-0003-02
1 问题的提出
标准差与平均差都是人为构造出来,使用统计学手段,反映统计样本或总体的离散程度的统计指标。一般来说,标准差在实际应用中要比后者广泛一些。多数国内统计学教材在编写时对两者采取了平行介绍的方式进行处理,并从实用角度出发,偏重介绍应用更广的标准差,并认为平均差计算存在不便。对此,十余年来一直有学者提出反驳意见,认为平均差优于标准差,相关论文和著作较多但观点较为相似,试总结如下:
(1)认为在数字计算时,平均差计算不存在乘方和开方计算,计算量低于标准差,由此认为平均差更简便,并使用例题举证;
(2)从自己的实际工作经验出发,发现标准差计算结果往往大于平均差,由此提出观点,认为标准差存在高估变异性的问题,并使用例题举证;
(3)从测量离差一般水平的思路出发,进而认为标准差是平均差的代替,所以标准差不如平均差;
(4)认为在高性能计算机大量普及的情况下,平均差即使有计算不便,但两者在计算上的差异是可以被忽略的,使用哪种区别不大。
由以上观点,进一步得出了平均差优于标准差,并且应当大力推广平均差的结论。
2 平均差优于标准差的观点不能成立
对于此种观点,笔者作为一名从事高校统计学教学的教师,委实不敢苟同,现将以上所列论点进行逐条分析:
(1)对于平均差计算更简便的问题,上述论证只能说明平均差在进行具体数字的手工算术计算时计算量要小于标准差,而对代数计算只字不提,对于具体数字来说,绝对值计算不需要讨论正负问题,当然计算量要小,但对于不涉及具体数字的代数计算来说,绝对值的讨论当然要复杂一些。平均差计算更简便的观点只在算术领域成立,在代数领域难以成立。
(2)标准差计算结果往往大于平均差是一个实际计算观察的结果,而且也确实符合实际情况,后面笔者也会对此进行代数证明。但是标准差计算结果大于等于平均差这一现象其实无法得出标准差存在高估变异性的问题的结论,只能说明两者对变异性的测量存在差异,到底是标准差高估了变异性还是平均差低估了变异性,这一现象是不足以说明的。
(3)与其说是标准差代替了平均差,不如说是由于标准差的优点获得了广泛使用,变异指标的意义在于衡量分布的变异性,并不是说越接近离差的一般水平变异指标就越好。
(4)即使在高性能计算机大量普及的情况下,平均差与标准差的差异也是不能忽视的。首先是标准差函数可导,平均差函数不可导,这一区别导致两者在微积分处理上存在巨大差异。其次,标准差对应的是二阶矩,对所有平方可积的函数适用,平均差对应的是另一种范数,其适用函数的空间不同于平方可积函数的空间。而平方可积函数的空间具有许多更好的性质。平均差与标准差函数的可导性和可积空间上有很大差异,没有了导数存在且连续的标准差,大量的数学推导都无法展开,所以建立在标准差基础上的数理统计体系很难使用平均差代替。因此平均差与标准差的差异不光在算术计算上,更重要的是在数理推导上的差异,而后者与计算机性能的高低并没有太大关系。
综上所述,认为平均差优于标准差的观点无法成立。
3 平均差与标准差的数理关系分析
3。1 平均差与标准差的计算方式的联系
平均差和标准差的计算方式都是以离差概念为基础的,离差是单项数值与平均值之间的差,公式可写作,离差是一个向量,其绝对取值代表了单项数值偏离平均值的程度,正负号代表了单项数值偏离平均值的方向,如果想要构造一个衡量总体变异性的统计指标,使用离差来作为构造的基础是很自然的选择,但是也很容易证明,由于离差取值的方向性,其数学期望恒为零。因此,取消离差的正负号后再来构造统计指标才有意义,从这个角度出发,我们可以构造出方差和标准差两种指标,即和。前者是离差平方的数学期望,后者是离差绝对值的数学期望,而方差本身计算出来的指标要比统计量高一阶,所以可以对其求平方根进行标准化,就得到了标准差。由此可见,平均差和标准差的计算方式存在着密切联系,其中,平均差的计算公式可以转化为,而标准差的计算公式可以转化为,所以,平均差和标准差的计算公式可以统一为:,其中平均差为该统计量取一阶的结果,标准差为该统计量取二阶的结果。因此,平均差和标准差应当看作同源、同类但不同阶的统计量,不存在谁是谁的替代品的问题。
3。2 平均差与标准差的相互关系
在得出平均差与标准差的一般公式之后,我们可以看出两者的计算过程存在比较紧密的关联,但两者呈现的数量关系却无法直接显现,前面提到,实际数据观察似乎支持标准差大于等于平均差的观点,但直接对两者进行相减的话,绝对值号又影响了进一步的讨论。但是,既然平均差和标准差都大于等于零,如果可以证明标准差的平方即方差与平均差的平方之差大于等于零,其实也就证明了标准差大于等于平均差。计算如下:,所以标准差确实大于等于平均差,其中只有在离差绝对值的方差等于零时两者相等。但这一结果不能说明标准差高估了变异性,前面的证明可以看出,方差之中包含了平均差包含的所有用离差反映的变量值的变异性信息之余,还包含了离差本身的变异性信息,进一步来说,既然方差可以被分解为变量值的平均差的平方与离差绝对值的方差之和,那么离差绝对值的方差也可以被分解为离差平均差的平方与离差的离差绝对值的方差之和,由此可以形成一个关于平均差的无穷级数,而这一无穷级数之和收敛于变量值的方差。由此可以看出,其实方差包含了变量值各级离差的平均差所反映的所有变异性,而且这些变异性之间不存在重复计算问题,而标准差正是方差的标准化,所以,并非是标准差高估了变量的变异性,而是平均差只测量出了变量值包含的所有变异性的一部分。
3。3 平均差函数与标准差函数对变异性敏感程度的比较
如果从平均数的角度观察平均差函数与标准差函数,不难发现其中的一些区别,平均差函数可做如下变化:A.D.=,可以看出平均差函数即离差的简单算术平均数,离差的大小并不影响其权重,所以对于平均差来说,极端变量值的变异性被同等看待了。而标准差可做如下变化:,可以看出根号内的公式可以看成以离差本身大小为权重的加权算术平均数,所以越极端的变量值会被给予越多的关注,这一点更符合人们对于数据变异性的直接感觉。可以直观的构造如下两组数说明这种区别:1,1,0,-1,-1和2,0,0,0,-2,两者拥有相同的均值0和平均差0。8,但直观感觉前者的变异性较小,如果使用标准差,则前者标准差为0。89,后者为1。26,就有效的衡量出了这种变异性。
3。4 在正态分布下平均差与标准差的取值讨论
如假设X服从正态分布,,则有,由此可以看出,在正态分布下,平均差与标准差的取值存在稳定的倍数关系。同理其实不难证明,在参数确定的特定分布下,平均差与标准差的取值都存在该分布特有的稳定关系。至于是否可以在具体数字计算时结合这种稳定关系,使用平均差估算标准差,还有待后续研究证明其可靠性。
4 总结
由以上分析可见,标准差与平均差是有着统一公式和数学关系的两种变异指标,并不存在排他性问题,其中平均差在具体数字计算时有一定优势,但不利于代数运算和数学推导,同时平均差在计算变异性时存在信息损失低估变异性的问题,因此难于动摇标准差在统计学中的重要地位。
参考文献:
(1)韩兆洲,杨林涛。极差、平均差和标准差之间测度关系研究[J]。统计与信息论坛,2008(04)。
(2)桂文林,伍超标。标准差和平均差的内在关系及应用研究[J]。数理统计与管理,2005(02)。
在统计学及其相关课程中,有关差异指标(也称“差异量数”,下同)的教学要点有二:一是差异指标的意义,二是差异指标的种类。前者的要义可概括为:综合反映总体(或样本)各个单位标志值(或数据)的差异程度(或离中趋势、离散程度等);后者的意思是说:差异指标的种类很多,它们各有自己的计算方法和特点。如果我们把后者的这种不同种类、特点也统称做“差异”的话,那么,我们在统计学有关学科的教学过程中,就应把这两个方面的“差异”向学生交代清楚,使他们对差异指标之“差异”有个客观、全面而准确的理解,从而避免由于理解的片面性得出错误的判断。
一、正确理解不同差异指标之间的“差异”
人教版初中代数第三册教师教学用书第171页有这样一段话:“在表示各数据与其平均数的偏离程度时,……为什么对各数据与其平均数的差不取其绝对值,而要将它们平方,……这主要是因为在很多问题里含有绝对值的式子不便于计算,且在衡量一组数据波动大小的‘功能’上,方差更强些。例如有两组数据:
甲 9 ,1 ,0 ,-1 ,-9;
乙 6 ,4 ,0 ,-4 ,-6。
从直观上看,甲组数据的波动要比乙组数据大些,但它们的平均差都是4,区分不出其波动大小;而甲组数据的方差是32.8,乙组数据的方差是20.8,用方差可将它们的波动大小区别开来。”
其实,上述的一段描述是在告诉读者这样一个命题:在平均差与方差(或标准差)之间,方差(或标准差)表示数据波动大小的“功能”强于平均差。
这个命题是真的么?请看下一个例子:
在一次射击比赛中,甲乙两射手成绩记录如下:
甲 9 ,7 ,9 ,9 ,7 ,7 ,7 ,9;
乙 6 ,8 ,8 ,8 ,10 ,8 ,8 ,8 。
计算他们的平均值、标准差、平均差(如表)。
在这里,两组数据的标准差都是1,区分不出波动的大小,但甲组的平均差为1,乙组的平均差为0.5,我们通过平均差得出结论:甲组成绩的波动性大于乙组的波动性。于是又否定了上述命题,并得到一个于完全相反的命题(叙述从略)。
显然,若综合以上两种(假)命题,取其正确部分的话,那么,正确命题应为:
平均差和标准差(或方差),在所反映的总体(或样本)单位标志值的差异性上具有一致性,但区分这种差异大小的“功能”谁更强些不是绝对的。
那么,为什么人们在学习、应用统计学的多个差异指标时更多关注的是标准差呢?主要有以下理由:(1)反映灵敏,它随任何一个数据的变化而变化;(2)严密确定,一组数据的标准差有确定的值;(3)适合代数运算,可以将几个标准差合成一个总的标准差;(4)可以用样本数据推断总体差异量;(5)在计算其它统计量时,如差异系数、相关系数、标准分数等,都需要标准差。
二、正确理解同一个差异指标值在实际背景中释义的“差异”
某社出版的数学辅导教材有题如下:
甲乙两组学生各有8人,参加某门学科测试成绩如表2(100分制),请比较两组学生的成绩哪组较好一些。
因为 ,甲组成绩的波动比乙组小一些,所以甲组学生的成绩较好一些。
笔者认为:标准答案制订者是建立在“组内学生之间学习差异越小,成绩越好”的教育教学理念下做出这一判断及结论的。要知道,在新课程的教育教学理念下是允许学生与学生之间存在差异的,倡导学生在学习各门课程时敢于“冒尖”、创新,不搞“一刀切”,要让学生在全面发展的基础上培养个人特长。在评价学生时,以多元智能理论为依据,多方法、多手段、多尺度地考查学生的学习效果。基于此,我们又可以认为乙组的成绩好于甲组。甚至,倘若再对照例题中两组学生的其他指标情况,比如优秀率:若规定90分以上为优秀,则两组持平;若规定85分以上为优秀,则甲组为1/8,乙组为1/2,也会得出乙组的成绩好于甲组的结论。
0 引言
高等学校英语应用能力考试是高职高专公共英语唯一的全国性考试,其前身是普通高等专科英语考试,是国家为检测和提高普通高等专科英语课程教学质量而建立的,1997年开始试运行,1998年正式投入使用,距今已有16年。高等学校英语应用能力考试现已被高职院校普遍采用作为评价师生教学效果的手段。考试的结果通常以考试成绩暨分数体现。在高职公共英语课程教学研究中,对考试成绩进行统计分析已有涉及,但更多的也只涉及到某一方面,如求出平均分。这些分析不能准确全面的反映学生的考试情况,也就不能公正对师生的教学效果进行评价,这就需要我们对考试成绩科学的统计分析。本文将使用统计学中的集中量数、差异量数及标准分对我校学生高等学校英语应用能力考试测试成绩进行统计分析,以期通过学生的测试成绩来全面科学的了解测试结果,给教师的教学效果和学生的学习效果做出公正的评价。
1 集中量数
集中量数是代表一组数据典型水平或集中趋势的量(王孝玲,2001)。它主要有两个作用:第一,它是一组数据的代表值,用来表示这组数据的典型情况。第二,组间的集中量数是可以比较的,通过比较可以判断组间数据的差别。集中量数主要三种形式,它们分别是平均数、中数和众数。平均数是教师对考试成绩普遍采用的一种统计分析方法。平均数最严密也最易于理解,因此应用也最广。但平均数存在着很多的不足,比如:平均数的典型性容易受极端数据的影响。如果一个班的分数之间差距很大,有的分数很高有的分数很低,这种情况下算出的平均数就不具有典型性。基于此,我们需要采用其它的统计方法,这就是中数和众数。中数又名中位数,是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。众数是一组数据中出现次数最多的数。通过平均数、中数和众数的三者结合,可以为我们的考试成绩提供更全面的信息。
表1
从表1我们可以看出供电1和供电2两个班的高等学校英语应用能力考试成绩平均分都是73。如果仅从平均分这个角度来比较两个班的考试成绩,我们就会得出两个班的考试成绩的集中趋势的量是一样的。但我们通过统计分析发现供电1和供电2考试成绩的中数和众数是不一样的。之前我们讲了,平均数是容易受极端数据的影响,但是中数是不会受到极端数据的影响。从表1我们可以看出供电1有两位学生的考试成绩低于45,属于极端数据,所以此组的集中趋势的量应该用中数来表示即76,供电2组的集中趋势的量可以用平均数来表示即73。
相对而言,平均数、中数和众数是三个较为常见的集中量数,都能在一定程度上反映数据的集中趋势,所以具有内在的关联性。当平均数、中数和众数三者相等时,这组数据即成正态分布,数据的次数分布图就会完全对称,三个数数轴上重合为一点。当平均数、中数和众数三者不相等时,具体地说,当平均数>中数>众数,叫作正偏态。当考试成绩出现正偏态时,说明试题太难。当平均数
2 差异量数
描述一组数据的特征仅用集中量数是不够的。我们在研究一组数据的特征时,不但要了解其典型的情况,而且还要了解特殊情况(韩宝成,2000)。例如在比较同一个年级的几个教学班高等学校英语应用能力考试成绩时,只比较集中量数是不够的,还要对它们的分散程度进行比较。在统计学中,我们用差异量数来描述数据分散程度。常用的差异量数包括标准差和全距。标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的分散程度。标准差的公式如下:
σ=■
表2
从表2中我们可以看出这10个班的高等学校英语应用能力考试成绩平均分比较接近。特别是应电1和供电2,应电2和计算1。它们的平均分依次差0.01、0.18。从平分来看应电1和供电2不分伯仲,应电2要比计算1要稍微好点。但从标准差来看供电2的分散程度要比应电1的小,说明供电2的考试成绩相对集中,故供电2的成绩要比应电1的成绩好。从全距来看,应电1的全距是49,而供电2的全距是36,这也说明供电2的考试成绩相对集中。应电2和计算1的情况也类似。
平均数在一组数据中典型性程度高低也取决于这组数据的标准差和全距,如果标准差和全距小,说平均数的典型性程度高,反之则小。
3 标准分
考生在考试后,按照评分标准对其作答反应直接评出来的分数,叫原始分。原始分反映 了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异 状况,不能刻划出考生相互比较后所处的地位。标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。标准分是以标准差为单位来表示某一分数与平均数的差。标准分的公式是Z=(X-X_bar)/S,式中X为原始分数,X_bar为原始分的平均数,S为原始分的标准差。
表3
将原始分转换成标准分之后,我们就可以很直观的看出某个学生的考试成绩在整个班级中所处的位置。
把原始分转换成标准分之后,标准分成了一个抽象的数据,不受原测量单位的影响(李跃平,2003)。这样我们就可以将某个学生在不同时间参加的考试进比较,不同科目之间的成绩也可以用来进行比较,这是原始分所不能的。
4 结束语
通过把学生的高等学校英语应用能力考试成绩进行统计分析,算出反映数据集中趋势的集中量数、反映数据分散程度的差异量数以及标准分,才能是考试成绩客观全面的反映师生的教学情况,帮助师生改进教学,实现既定教学目标。
【参考文献】
中图分类号:G445 文献标识码:A
Correlation of Student Grades, Attendance and Seating Distribution
――Based on Spatial Statistical Analysis Methods
ZHANG Zhen, KONG Li, XU Xin
(College of Agronomy and Biotechnology, Southwest University, Chongqing 400715)
Abstract Based on spatial statistic analysis, with the help of Geoda, the spatial distribution of the classroom and exam data manifest a statistical relationship which exists between grades, attendance and the distribution of seating. A significant spatial correlation is found that students who have high attendance tend to sit in the front row, and students who score higher tend to sit in the front row.
Key words seating distribution; grades; attendance; spatial statistical analysis
0 引言
空间统计分析主要用于空间数据的分类和综合评价,其核心是发掘基于空间地理位置的统计数据间的空间依赖、空间关联或空间自相关,通过空间地理位置建立数据间的统计关系,并作出各种相关的统计分析,来探究各变量之间的内在关系。
近年来,利用空间统计分析作为研究方法,吕安民(2002)曾对中国省级人口增长率进行了研究,并以空间统计分析方法研究了其内在的空间关联;左相国(2004)曾对人均GDP和农业人口比重对第三产业发展的制约作用进行了分析,研究国民经济发展水平和农业人口比重对第三产业发展的制约机制的规律性;杜国明(2007)等曾以沈阳市为例,研究了城市人口分布的空间自相关;以空间统计分析为研究方法的学术成果十分丰富。
以教室或考场为空间范围,在日常教学过程中可发现学生的座次、出勤率、考试成绩等呈现出较明显的空间分布特征,因此以空间分析工具开展教学研究将有助于揭示相关变量背后的关系。本文借助Geoda软件,利用西南大学2012-2013学年度第二学期2011级某专业课程上,各个同学的座次、成绩、出勤率等数据,分析了出勤率、学习成绩与上课座次与考试座次之间的空间相关关系,也即以空间统计分析――一种更直观的可视化的方式证明并显示了座次与出勤率之间、座次与成绩之间的空间相关性。
1 研究对象概况与数据来源、研究方法
1.1 研究对象概况与数据来源
本研究以某专业2011级69名同学为对象,统计了69名同学在2012-2013学年度上课座位分布数据,并分析了座位分布于69名同学的期末考试成绩之间的相关关系。
由于课程教学地点不一,根据研究设计,学生的上课座位分布都在12列8排的96个座位范围内(未考虑讲台、门窗、过道对分布的影响)。期末考试根据全校统一安排,学生的座位分布在7列11排的77个座位范围内。本文建立的教室与考场地图――也即座位的空间坐标方法①如下:
教室地图与考场地图编号方式如图1图2。不论是考场地图还是教室地图,两者都以下方(即85~96或71~77这一排)为教室最前排,以最上方(1~12或1~7这一排)为教室最后一排。
图1 教室地图 图2 考场地图
1.2 研究方法
1.2.1 确定空间权重矩阵
空间权重矩阵表达了不同空间对象之间的空间布局,如拓扑、邻接关系等,通常定义一个二元对称空间权重矩阵,来表达几个位置的空间区域的邻近关系,其形式如下:
(1)
其中,表示空间单元个数,表示区域与(在本文中即座位与)的邻居关系。本文以两个教室与考场内的96、77个座位建立基于空间邻接关系的权重矩阵,这里邻接的意思是具有公共边界,规则如下:
(2)
1.2.2 求局域空间自相关指标
局域空间自相关指标(Local indicators of spatial association,缩写为LISA)用于反映一个座位的数据属性与邻近座位的相关程度。局部Moran指数被定义为:
= (3)
1.2.3 标准差地图
标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根,它反映组内个体间的离散程度。借助Geoda095i软件,可以以可视化的方式呈现空间上的成绩、出勤率等差异。其定义方式为:
= (4)
2 研究假设
根据研究设定,本文提出以下假设:(1)座次分布与出勤率之间存在空间相关性。出勤率高的同学倾向于前排就坐,出勤率低的同学倾向于后排就坐,即前排座位上的同学倾向于具有高出勤率,后排座位上的同学倾向于具有低出勤率;(2)座次分布与成绩之间存在空间相关性。成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,即前排座位上的同学成绩较高,后排座位上的同学成绩较低。
3 实证分析
3.1 座次与出勤率之间的空间相关性分析
图3 以出勤率为变量的教室标准差地图
图4 以出勤率为变量的教室标准差地图中的高出勤率空间聚集
统计数据记录了每次课每个座位上的同学的学号,然后将每个同学的出勤率与学号匹配,则可得到每次课每个座位上的同学的出勤率在教室座位上的空间分布。以此类推,根据可得18个课时分别对应的空间分布。此分析以每个座位为研究对象,有人坐记为1,无人坐记为0,赋予每个座位以数次出勤率,②再取这数次出勤率的均值,即可得到平均出勤率为每个座位赋值,以不同的颜色表示。也即在此分析中以每个座位为研究对象,求得坐在某座位的(不同或相同的)同学的出勤率的均值,将这个均值赋予此座位,表示坐在此位置上的(不同或相同的)同学的平均出勤率。然后借助软件可得教室地图中的出勤率分布的标准差地图,如图3。
在阴影区域(见图4)高出勤率占比最大(93.33%),高出勤率在此区域有明显的空间聚集特征,也即出勤率与座次之间存在明显的空间相关性,可以认为,出勤率高者倾向于坐在这一区域。其次可以发现,前五排中高出勤率者占到73.33%,低出勤率者仅占26.67%,前后差异十分明显。
为了验证这一点,可再求局域空间自相关指标LISA,以反映某座位的数据属性与邻近座位的相关性程度,算法如前述公式(3)。借助软件可得LISA Cluster Map,如图5。
图5 以出勤率为变量的教室局域空间自相关指标地图(LISA Cluster Map)
高高点指此座位自身的出勤率高且相邻接的座位的出勤率也高,意味着此处有高出勤率的空间聚集特征;低低点指此座位自身的出勤率低且相邻接座位的出勤率也低,意味着此处有低出勤率的空间聚集特征;低高点指此座位自身的出勤率低但相邻接座位的出勤率高,意味着此座位周围出现高出勤率的空间聚集特征;高低点指此座位自身的出勤率高但相邻接的座位出勤率低,意味着此座位周围出现低出勤率的空间聚集特征。
通过分析图5,可见高高点与低高点全在前四排,低低点全在后三排(高低点只有一个,故可忽略不计)。这个结果说明,前四排是高出勤率聚集之处(虽然有三个低出勤率点,但此三点周围却仍是高出勤率聚集),后三排是低出勤率聚集之处。此外,五个高高点中有四个分布在左侧,也即在前排中,高高点并非左右均匀分布,而是倾向于分布在左侧。
结合以上以出勤率为变量的地图及相关分析,可以得出结论:座次分布与出勤率之间存在空间相关性;高出勤率的同学倾向于前排就坐,且在前排左侧③出现明显空间聚集特征;低出勤率的同学倾向于后排就坐;也即前排(尤其是左侧)就坐的同学倾向于拥有较高出勤率,后排就坐的同学倾向于拥有较低出勤率。因此证明了本文提出的第一个假设。
3.2 座次与学习成绩之间的空间相关性分析
3.2.1 平均座位排数与成绩的统计描述
图6是位于33教的统计学考试的考场地图,是成绩的标准差地图。每个方格的不同颜色代表坐在此位置上的同学的成绩。也即反映了统计学考试的考场中,每个同学的分数在考场座位中的空间分布。在图中可发现,阴影区域的同学成绩普遍较高,这一区域的成绩分布有明显的空间聚集特征。为了探求这些同学较高的成绩是否与平时上课的座位排数――坐在较前排或较后排相关,也即其成绩是否影响其座位选择,分析图6。
图6 以成绩为变量的考场标准差地图
图7也是33教统计学考试的考场地图,但方格的属性发生了变化――每个方格的不同颜色代表了坐在此位置上的同学平时上课所坐位置的平均排数。也即图7为平均排数的标准差地图,反映了在统计学考试的考场中,每个同学平时上课所坐位置的平均排数在考场座位中的空间分布。对比图6与图7,可以发现,图6中成绩较高的阴影部分刚好对应图7中的平均排数较低的阴影部分。
图7 以平均排数为变量的考场标准差地图
因此可以推论,平时上课的平均座位排数较低(即前排就坐)的同学倾向于拥有较高成绩,而平均座位排数本身即反映了座次分布,故可以初步推论座次分布与成绩之间存在空间相关性。
3.2.2 座次与成绩之间的空间相关性分析
为了验证上述初步推论,分析18个统计学课时中每个同学的座次分布。
如座次与出勤率之间的空间相关性分析,数据记录了在32教每次课每个座位上的同学的学号,将每个同学的分数与学号匹配,则可得到每次课每个座位上的同学的成绩在教室座位上的空间分布。以此类推,可得18个课时分别对应的空间分布。与图6图7的分析不同之处在于,此分析中不再以每个同学为研究对象,而是以每个座位为研究对象,即赋予每个座位以数次成绩,④再取这数次成绩的均值,即可得到为每个座位赋予的成绩属性,以不同的颜色表示。也即在此分析中以每个座位为研究对象,求得坐在某座位的(不同或相同的)同学的成绩的均值,将这个均值赋予此座位,表示坐在此位置上的(不同或相同的)同学的平均成绩。见图8,以成绩为变量的教室标准差地图。
图8 以成绩为变量的教室标准差地图
分析图8可知,图中阴影区域呈现出明显的空间聚集特征,表明平时坐在这一区域的座位上的同学们的成绩较高,⑤前排就坐的同学的成绩倾向于高于后排就坐的同学,也即成绩高的同学倾向于选择前排就坐,成绩低的同学倾向于后排就坐。
为了更严密地验证这一点,可采取以下分析。
第一,以成绩的均值68.835为界。以前后四排为单位,在教室前四排48个座位中,高于平均成绩者33个,低于平均成绩者15个,分别占比68.75%、31.25%;在教室后四排48个座位中,高于平均成绩者15个,低于平均成绩者33个,分别占比31.25%、68.25%。以前后两排为单位,在前两排24个座位中,高于平均成绩17个,低于平均成绩者7个,分别占比70.83%、29.17%;在后两排24个座位中,高于平均成绩6个,低于平均成绩者18个,分别占比25%、75%。
第二,以前后四排为单位,在48个高于平均成绩者中,有33个分布在前四排,15个分布在后四排,分别占比68.75%、31.25%;在48个低于平均成绩者中,有15个分布在前四排,33个分布在后四排,分别占比31.25%、68.25%。以前后两排为单位,在23个高于平均成绩者中,有17个分布在前两排,6个分布在后两排,分别占比73.91%、26.09%;在25个低于平均成绩者中,有7个分布在前两排,18个分布在后两排,分别占比28%、72%。
第三,选出成绩的后十名(如图9)考察,发现后十名中坐在前四排者有2个,坐在后四排者有八个。而选出成绩的前十名(如图10)考察,发现前十名中坐在前三排者有4个,在第四五排者有五个,而在后三排者只有一个。
图9 以成绩为变量的教室标准差地图中的成绩后十名者
图10 以成绩为变量的教室标准差地图中的成绩前十名者
通过以上分析可得结论:成绩与出勤率之间存在空间相关性。在教室前后,成绩差异较大,而前后两排成绩差异尤为明显。成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有较高成绩,后排座位上的同学倾向于具有较低成绩。
4 结论
本文以课程18个课时中的各同学座次分布及其成绩、出勤率数据为支撑,对其进行了空间统计分析,证明了本文提出的相应的两个假设:第一,座次分布与出勤率之间存在空间相关性:出勤率高的同学倾向于前排就坐,出勤率低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有高出勤率,后排座位上的同学倾向于具有低出勤率;第二,座次分布与成绩之间存在空间相关性:成绩高的同学倾向于前排就坐,成绩低的同学倾向于后排就坐,也即前排座位上的同学倾向于具有较高成绩,后排座位上的同学倾向于具有较低成绩。
本文借助Geoda软件进行分析,无疑具有直观、简洁的优点。但是不可避免,本文仍存在不足之处。如某些因素可能对本文分析的两种空间相关性产生影响(如同宿舍的同学倾向于聚集)。若将这种影响纳入本文的分析,虽在建模上可行,但是由于实际操作层面存在诸多困难,故未纳入本文的分析。因此,关于座位分布、成绩、出勤率之间的空间相关性,仍有待进一步更详实的实证研究。
基金项目:重庆市高等学校人才培养模式创新实验区项目;西南大学教育教学改革研究项目(2012JY047)
*通讯作者:孔立
注释
① 为了处理数据的方便,地图中未考虑教室中的过道,但这并不影响本文的分析与论证.
② 由于座位数大于同学人数,所以每个座位被坐次数6.
③ 之所以呈现出左右分布不对称,从生活经验可知是因为32教与35教上课的教室中PPT投影皆位于(面向讲台)左侧.
④ 如脚注2,每个座位被坐次数6.
⑤ 如脚注3,出现左右分布不对称是因为上课的教室中PPT投影位于左侧.
参考文献
[1] 吕安民,李成名,林宗坚,等.中国省级人口增长率及其空间关联分析.地理学报,2002.57(2):143-150.
[2] 左相国.人均和农业人口比重对第三产业发展的边际贡献.统计观察,2004(4):58-59.
[3] 杜国明,张树文,张有全.城市人口分布的空间自相关分析――以沈阳市为例.地理研究,2007.26(2):383~389.
[4] Anselin L.Spatial Econometrics: Methods and Models.1988.
[5] Anselin, L, J Le Gallo, H. Jayet. Spatial panel econometrics.2005.
[6] Huang Runlong, Shuai Youliang. The logistic model and application study on population increase. Journal of Nan-jing College for Population Programmer Management,2000.16(3):25-27.
保证考试质量是数学活动中不容忽视的重要组成部分。如何提高考试质量,不仅应在试前对试卷质量进行预测分析,更应结合试后考试成绩分析作出最终评价。用学生的考试成绩可以定量对命题质量进行评价与分析。观察统计学生考试成绩的直方图,其分布大致可分为5种情形:(1)单峰且对称、单峰大体对称;(2)单峰但峰值向左移;(3)单峰但峰值向右移;(4)双峰或多峰;(5)大体上可以一个平台型为代表等等。如果把这5种情形的直方图外廓线描出,则大致为如图所示几种情形的曲线。
2学生成绩正态分布曲线分析
根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩应接近正态分布。也就是说,当学生的成绩接近于正态分布时,则说明此次考试基本达到了教学要求。判断成绩是否接近正态分布,最直观,最有效的方法是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。当然,学生成绩呈现正态分布是理想化状态。考试成绩完全呈正态分布有一定的困难,也不现实。但我们要以正态分布为标准模式,加以对比,找出不足。
利用教育统计学研究发现,对于难度适中、客观有效的考试成绩一般都符合正态分布,且平均分在75分左右,标准差在9 ― 5之间。因此,我们有理由使用各种高级统计方法处理考试分数,以挖掘更多的教育信息。考试成绩是考生水平的反映,同时考试成绩分布是否正态分布反映了命题质量。根据正态分布曲线呈现的形态,可以进行考题相对难度分析。
平均成绩的差异引起曲线的水平位置变化,平均成绩偏低,如低于65分说明试卷难度较大;而偏高在90分以上说明试卷难度太小。若学生成绩分布属附图(1)所示的形态,这表明试卷命题的质量是比较好的.这里又有两种情形:在标准差不变的情况下随着平均分数的增加曲线向右移说明考生答题逐渐轻松;相反,随着平均分数的减小说明考题逐渐变难,学生成绩逐渐降低。在学生和教师工作正常情况下,题目越容易曲线越向右移。在平均分不变的情况下,标准差较小如低于6,成绩分布较集中,正态分布曲线呈陡峭型状态说明试卷区分度太小,表示中等难度试题所占比重太大;标准差较大如大于9,成绩分布较平坦,试卷区分度太大,则表示中等难度试题偏少。
若学生成绩分布属附图(2)所示形态, 即负偏态分布说明难度较大的试题比例偏高,表明试卷题目偏难;若学生成绩分布属附图(3)所示的形态, 即正偏态分布说明难度较小的试题比例偏重,则表明试卷题目偏易。若学生成绩分布属附图(4)或附图(5)等所示的形态,则表明试卷的命题质量不好,随意性较强,这样的试卷成绩不能很好地测量出学生对所学知识掌握情况。
3正态分布应用的结论
考题相对难度是指考题从整体上讲相对考生其难易程度的合理性,用学生成绩的平均分数衡量考题相对难度应是合理、可行的。对于高校结业类型的考试,经统计平均分数在77分附近时,考题相对难度是适中的。通过确定恰当的偏离度等级标准,对试卷做出试题难度相对学生①考题合理、②考题稍偏易或稍偏难、③考题较易或较难、④考题过易或过难、⑤考题难度不合理的5个等级判断。
将2012年8月至2013年8月在我院接受治疗的39例患者作为研究对象,所有患者均自愿参加本次实验。患者中男19例,女20例。年龄41~81岁,平均年龄(53.26±3.28)岁。首次接受根治性放疗的患者39例,患者的病灶部位有胸下段、胸中段以及胸上段三处。其中病灶位于胸下段的患者有5例,病灶位于胸中段的患者有13例,病灶位于胸上段的患者有21例。
1.2摆位误差测量方法
建立坐标系,规定x轴为患者的左、右方向,y轴为患者的胸、背方向,z轴为患者头、脚方向,其中患者的右方向、头方向以及后方向为坐标系的正方向。以顺时针沿x轴以及z轴旋转的方向为正方向,逆时针方向为负方向,利用图像引导、以CT模拟定位图像作为参考图像,以颈椎和胸椎的椎体作为参考标志,将CBCT扫描重建后的图像与CT模拟定位的图像,在图像引导下在线进行自动配准和人工配准,获得误差数值。
1.3设备
23EX直线加速器(瓦里安公司),机载图像引导系统,机载锥形束CT,热塑面膜(戈瑞公司)。
1.4数据处理
计量资料使用均数±标准差(x-±s)表示,使用t检验计量资料,采用SPSS16.0统计学软件对个体随机误差、个体系统误差进行正态性检验。利用配对t检验比较相关指标的差异,P<0.05,数据间差异具有统计学意义。
2结果
2.1摆位误差
在放疗时,对所有患者均采用热塑面膜进行固定,重复模拟定位,利用三维激光灯,按物理计划要求摆位后,对患者进行CBCT扫描,每个患者每周1次CBCT扫描,各扫描5次,共计195次。所有患者的随机误差以及个体系统误差均服从正态分布。
2.2CTV和PTV之间的间隙值
所有患者在x轴、y轴以及z轴上平移的个体系统误差的标准差分别是3.01、3.51、1.86mm;在x、y以及z轴上个体随机误差的标准差为1.61、2.11、1.16mm。根据公式(Mptv=2.5×系统误差的标准差+0.7×随机误差的标准差),计算CTV和PTV之间的间隙值。其中x轴、y轴以及z轴上CTV和PTV之间的间隙值分别是8.65、10.25、5.46mm。
学生评教是通过学生系统地搜集教师在教学中的表现,对教师的教学活动是否有效、是否满足学生学习需要做出判断的过程。目前,学生评教已成为国内外高校评价教师教学效果的主要信息来源。有效的学生评教是保障高校教学质量的有力手段,而评教数据的有效性是学生评教能够激发教师的积极性,真正服务于教学改革的保证。学生评教数据的科学化处理是对学生评教原始数据进行汇总分析得到有效信息的过程,主要包括以下几个方面。
一、设置不合理打分限制机制
为避免个别学生仅凭个人好恶草率地对教师作出评价,评教系统对学生提交的评教结果设置限制,各测评项目全为很好或差的评教结果不予提交,促使学生端正态度,客观地对教师教学作出公正评价。
二、对学生评教数据进行异常值剔除
统计表明,一个班级的学生对任课教师的评价打分趋向于正态分布。按照“三倍标准差原理”,学生评教成绩落在区间(μ-3σ,μ+3σ)之外的概率等于0.003,为“小概率事件实际不可能原理”。因此,把区间(μ-3σ,μ+3σ)看作是评教成绩实际可能的区间,对游离于此区间外的数据加以剔除,从而剔除了异常高和异常低的分数。
三、学生评教结果的影响因素研究及标准分优化处理
影响和干扰学生评教效果的因素很多,可以归结为教师因素、学生因素及课程自身因素三类。研究表明,教师性别、年龄、职称、学历对学生评教的有效性并无显著影响,[1]而教龄、教师的科研成果,以及教师的个性特质则是影响学生评教效果的主要因素;学生的出席率、学习兴趣及学习成绩可对评教结果产生影响;不同课程类别对学生评教的结果影响很大,有学者研究表明,学生倾向于给予选修学科的教师较高的分数,而给予必修学科的教师较低的分数。[2]
要提高学生评教的信度与效度,使其达到提高教学质量的目的,就必需对学生评教的影响因素进行定量分析,并通过对影响因素的控制来改进学生评教工作。本文研究分析了不同课程类别对江苏某高校2009―2010学年第二学期学生评教结果的影响。
(一)不同课程类别对学生评教的结果影响
根据该校教务系统将课程分为公共选修、普通教育、专业基础、专业方向四个类别,在全校11个学院中按文科、理科、工科进行抽样,以人文学院、数学与统计学院、计算机科学与工程学院共三个学院的学生评教成绩形成数据库,对不同课程类别学生评教成绩的统计见表1。采用单因素方差分析法对不同课程类别对学生评教成绩的影响进行分析,结果见表2。显著性水平p值为0.000<0.05,从统计学的意义上看,课程类别对评教结果有显著的影响。
表1:不同课程类别评教原始成绩统计表
表2:不同课程类别对评教原始成绩的方差分析表
(二)对学生评教原始成绩的标准化处理
在学生评价系统中引入原始测评数据标准化处理手段,将原始分数转换为等距量表,即标准分。标准分以被测者的平均分数作为比较,以标准差为尺度进行衡量,[3]它能准确反映被测试者的实际水平,能够消除一些因素对结果的影响,它具有可比、可加的特性而且稳定。具体计算方法为:标准分=(课程得分-课类原始均分)/课类标准偏差。
课程得分是指教授某类课程的教师的学生评教原始得分,课类原始均分是指某类课程的学生评教的平均分,课类标准偏差是指某类课程的学生评教原始分数的标准差。
(三)对标准分的优化处理
标准分描述的是某一个数据在所在组中的相对位置,使教授各个不同课程类别教师得分结果有相同的基准点和相同的度量单位,从而消除不同课程类别对得分的影响。教师的得分大于课程平均分得到的标准分就大于零,相反则小于零。因此标准分在数值上就出现了大量的小数和负数,使得学生评教分数不直观,不易理解,因此设计对标准分进行优化处理的方法,将标准分换算成标准成绩。换算方法为标准成绩=校平均分+标准分*校标准差。
校平均分为全校教师的平均得分,校标准差是全校教师得分的标准差。
(四)对标准成绩的方差分析
通过对学生评教原始分进行标准化和优化处理后,采用单因素方差分析法对不同课程类别对学生评教标准成绩的影响再次进行分析,结果见表3和表4。显著性水平p值为1.000>0.05,从统计学的意义上看,课程类别对评教标准成绩无显著性影响,课程类别对评教结果的影响通过标准成绩的修正而得以消除。
表3:不同课程类别评教标准成绩统计表
表4:不同课程类别对评教标准成绩的方差分析表
(五)标准成绩与原始成绩的配对t检验
采用配对t检验对标准成绩与原始成绩进行均值检验,结果显示:t值=0.000,p值=1.000>0.05,表明标准成绩与原始成绩具有相等的统计学意义。
四、按人数加权平均计算教师最终成绩
当同一教师承担多门课程时,班级参评学生数的多少对教师评价总成绩有较大影响。因此,在计算教师评价总成绩时,不是先计算单个班级评价成绩后再求各个班级平均得分,而是将一位教师全体参评学生的评价结果纳入总体进行计算作为最终评价成绩,由此消除了班级参评人数差异引入的误差。
通过以上设置不合理打分限制机制、剔除异常值、标准分优化处理及加权平均法的应用等四种数据处理方式,有效地消除了多方面因素对学生评教数据客观性和科学性的影响,提高了学生评教的效度和性度,实现了通过学生评教提高教学质量和改善学校管理水平的目的。
参考文献:
[1]EI-Hassan,K.Students’ratings of instruction:generalizability of findings[J].Student in Educational Education,1995.21,(4):411-429.
[2]Wachtel,H.K.Student evaluation of college teaching effectiveness:a brief review[J].Assessment and Evaluation in Higher Education,1998.23,(2):191-211.
一、引言
考试是学校教育的一个极为重要的组成部分,是检查教学质量、评价教师教学水平、检验学生知识掌握及能力结构的主要环节。过去评价学生成绩时,常常使用原始分数,如认为语文得90分的学生语文学得好,而外语得70分的学生则外语能力较低;再有,同一名学生期末数学得80分,语文得65分,于是认为该生是学理科的材料,文科不好。这些认识是不够科学的,因为试题的难易程度是决定学生分数的主要因素,题目难,原始分数就偏低;题目容易,原始分数就偏高,从而导致了原始分数之间的不可比性。试题还受区分度大小的影响,因而造成考试的内容不同质、不等效、不可加。由于考试分数或原始分数没有绝对的零点,也没有统一的单位,因而不能将一个学生前后多次考试的成绩进行比较,不能对不同科目的成绩进行比较,难以判断学生成绩的变化趋势。因此,原始分数得到的信息不够准确,不科学,用原始分来评价学生的成绩缺失公正性和合理性。采用标准分数对考试成绩进行分析,就可以克服以上缺点,因此,用标准分比用原始分数评价学生成绩更科学、更合理和公正。
二、标准分的定义及计算方法
标准分是由均数和标准差规定的相对地位量。它是统计学中最重要、用途最广的统计量,标准分的定义为:以标准差为单位标定某一分数离开团体均数的距离。公式为:
z==
式中X为某一原始分数,为N个原始分数的平均数,x-是离均差,即某一分数离开均数的差数,S为标准差,Z即为标准分数,因此标准分数常称为Z分数。Z分数有正值和负值。当Z为正数时,则X>;当Z为负数时,则X<;当Z=0时,则X=。Z分数的绝对值|Z|,表示某分数与在此分布上的平均数的距离,|Z|越大,表示某分数离开均数的位置越远。计算机(利用Excel表)可以方便地将原始分转换成标准分。
三、标准分的意义
标准分是一种具有相等单位的量数。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。其意义在于:
1.标准分的分布与原始数据的分布相同。
2.各科标准分的单位是绝对等价的。无论各科的平均分、标准差怎样不同,一经转换成标准分,就形成以平均数为0、标准差为1的统一的、固定不变的标准形式。
3.标准分数值的大小、正负,反映某一考分在全体中所处的位置,它是相对分数。
4.当总体均服从同一分布时,总体的标准分之间具有可比性。
5.用标准分表示的样本间可以进行算术运算。
因此,标准分在考试成绩评价中具有重要作用。
四、标准分的作用
标准分在考试成绩评估中的用途很多,一是能够明确各个分数在总体中的位置;二是能客观地比较不同学生不同学科的总成绩及其优劣;三是可以比较某学生不同学科、与阶段的考试成绩,正确评价其学习的发展。
(一)能明确各个分数在总体中的位置。
标准分是按正态分布原理而建立的分数制度,其主要特点是:分数不但可以反映考生的水平高低,而且可以直接反映出该分数在全体考生中的位置。
依据Z标准分数的意义,Z分数为0的原始成绩是全班的平均分。Z分数大于0的原始成绩高于全班的平均分;Z分数小于0的原始成绩则低于全班的平均分。也就是说,标准分数值的大小、正负,反映某一考分在全体中所处的位置。以表1为例。
表1是某高校10级商英2班第一学期外语三科期末考试的成绩统计。表1中学生01的泛读得分为34,其泛读标准分为-1.690,这表明学生01所得的泛读分数低于全体考生平均数1.690个标准差,在总体的位置靠后;学生02的泛读得分为65,泛读标准分为0.158,这表明学生02的泛读分数高于全体考生平均数0.158个标准差,在总体的位置则靠前。
再如,学生32的精读和泛读的原始分数都是73分,这个分数是高还是低?该学生在全体考生中的位置靠前还是靠后?单从原始分数看不出来,因为没有一个稳定的参照点。若把原始分数转换成标准分后,该学生在全体考生中的位置则一目了然:该生精读原始分数为73分,标准分为1.211,高于全体考生平均数,原始分数73分应算较高的成绩了;而泛读的标准分为0.635,接近全体考生平均数,原始分数73分则只算中等成绩,由此可见,原始分数很难准确说明分数所反映的考生实际水平,也不能确定分数在群体中的位置。而标准分则可以直接反映出该分数在全体考生中的位置。|Z|越大,表示某分数离开均数的位置越远。
(二)能客观地比较不同学生不同学科的总成绩及其优劣。
从表1可以看到,若按原始分累计总分,学生09、学生10和学生22的总分都是140,三者学习成绩处于并列的位置,没有优劣或高低之分;但将原始分数转换成标准分数后,以Z值的总和相比较,学生09的Z总为-1.013,学生10的为-1.189,学生22的为-0.777,则可以看出学生22的成绩要比学生09的高,而学生09的成绩又比学生10的要高。从“Z总”这一栏,我们可以明确地看到学生22、学生09和学生10在班级成绩中的排名分别为第26、第29和第31。三者原始总分相等,没法比较,但按标准分来分析,他们这几科的总成绩却有高低之分。
从表1还可以看到,学生07的总分为189,学生28的总分为195,以三科的总分来判定成绩的优劣,学生28排第8名,学生07则排第12名。表面上学生28的成绩似乎要比学生07的成绩好。但是,按原始总分计算只考虑了分值,并没有考虑各分值在各自总体(即各自科目的分数总体)中的价值,这种考虑是欠妥的。分数的价值应用最佳地位量标准分数来表示。那么将学生07和学生28的三科考分都换成Z值(见表1),以Z值的总和相比较,Z为1.748,而Z为1.433,则可看出学生07的分数价值要比学生28的高。学生07的成绩优于学生28,两者的排名恰与原始分数的排名截然相反。若要推荐优秀生,推荐学生07更为合理。其道理从学生08的泛读为84分,其Z值为1.291,与学生30的听力为84分,其Z值为1.775的比较分析可以显示出来。从原始分数看,同是84分,但由于分别位于不同科目的不同分布中,其价值是不同的。受试题难度和区分度大小的影响,导致了泛读的“1分”与听力的“1分”不等值,便造成了这样的现象:同样是84分的两科成绩却反映出两种高低不同的水平。
上述例子表明,使用原始分数难以对学生的水平进行科学的比较。将原始分数相加得到总分的方法,就好比将100元人民币加上100元港币再加上100元美元得到300元一样,是不能反映三种货币在总额中的真实价值的。由此可见,原始分数不具有简单的可加性,几门原始成绩的总分并不能说明个体在团体中的实际排名,不能确切评价学生成绩的优劣,甚至会产生与学生实际水平截然不同的结果。而标准分是以群体的平均分为参照、以标准差为度量单位的一种分数,是在消除考试难度、考生不确定因素产生的抽样误差影响,将考试成绩(分数制)通过某种变换而得到的具有明确区分、比较特性的考试成绩。所以标准分能够直接比较不同学生不同学科的总成绩,能够客观、公正地反映各个学生的成绩在群体成绩中的实际地位或实际排名。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
(三)可比较某学生不同学科与阶段的成绩,正确评价其学习的发展。
我以某高校某学生第一学年(两个学期)大学语文与大学英语成绩为例来说明这个问题,见表2。
按表2中的原始分数评价,有人认为该生的语文成绩有进步,而英语学习有退步。而若将该生的成绩标准化后,不难发现,该生的语文成绩在班上的相对位置没有变化,而英语成绩第二学期虽比第一学期低7分,但标准分数提高了,说明该生在班上的相对成绩有所提高。同样,若仅看该生的第二学期成绩:语文86分,英语80分,不少人会认为该生的语文比英语学得好。但我们从表2中可知,该生的语文成绩高于平均成绩0.96个标准差,英语成绩高出平均成绩1.16个标准差,英语成绩比语文成绩在班上的相对位置高,因而相对来说该生的英语学得较好。所以只凭借原始分数盲目评价学生是不恰当的。如果教师采用标准分数,就可以掌握每个学生学习某科成绩发展趋势,了解学生知识的掌握程度。
五、结语
无论用原始分数比较单科成绩还是比较总成绩都是不科学的,因为各原始分数分别位于不同科目的不同分布中,价值不同,没有同一的测量尺度,因而不可加与不可比。标准分是采取统计学的计算方法计算出的一种数据,利用这种计算方法可以避免多次考试因试题量不同及试题难度不同而造成的前面提到的对学生的学习情况评价不确切的情况发生,使课程之间、学生之间、班级之间、年级之间和学校之间具有可比性,可对同一考试各科进行横向比较,也可对同一学科不同时期的考试纵向比较,找到个体在总体内的位置,从而对全校教学情况一目了然,教学管理也可以做到心中有数。
当前,仍有相当一部分教师用原始分数作为考试成绩评价的依据,尚未认识到原始分数的局限性。因而,我认为对标准分数的认同需要宣传,让教师更了解标准分的意义和作用,尽快地接受标准分,并运用标准分更好、更科学和更合理地评价学生的考试成绩,客观地了解学生的学习动态,做到有的放矢、因材施教。
参考文献:
[1]罗玉莲等.标准分及其应用[J].吉安师专学报,1998,VOL19,(5).
[2]刘晓莉.标准分与考试成绩评估[J].佛山科学技术学院学报(自然科学版),1999,VOL17,(4).
[3]廖平胜等.考试学[M].武汉:华中师范大学出版社,1988.
[4]张玉田等.学校教育评价[M].北京:中央民族大学出版社,1998.
[5]将庆伟等.教育科研中的量化方法[M].北京:中国科学技术出版社,1997.
一、引言
当今社会,科学技术日益革新,统计思想逐步成熟,统计工具也被应用于统计领域,该领域也随之得到延伸和发展。而所谓的统计学其主要的内容是通过对数据的收集、统计、整理分析、数据处理等方法,从而更加深入的发掘数据存在的内部规律,以达到更科学、更合理的解释客观事物的目的,加深对该事物的认知。在具体工作和现实生活中,很多客观规律的分析及归纳是运用统计的方法实现的,通用的操作方法如下:首先需要在分析之前对客观事物进行研究和设计,了解该事物的基本特点;其次针对该事物进行抽样调查,调查的范围要全面;再次利用相应的统计软件和数学思想,建立相应的数学模型,对抽样的结果进行统计分析,让数据呈现一定规律;最后便是根据统计分析的结果作出结论性成果,以便能更加深入的研究及分析客观事物存在的内在规律和普遍性原则等。统计学被应用的领域广泛,本文主要针对统计学在财务方面进行研究。
二、统计学应用于财务方面的意义
(一)将统计学应用于财务,能满足企业和行业对产值、资金等方面的计算需求。行业或企业财务数据极为庞大,运用统计方法进行财务统计,便于反应企业或行业的劳动成果和产能产效,为国家统计国内生产总值、人均GDP等提供数据支撑。
(二)将统计学应用于财务,可以帮助企业或个人进行负债核算、资金流核算等,提供基础数据。运用统计学进行财务统计,既可以作为分析企业经济实力的标准,又可以将统计的数据作为核算资产负债的数据来源。
(三)将统计学应用于财务,可以用于研究分析个人、企业、国家三者之间的利益分配关系,通过统计学研究出的普遍性规律来制定符合大多数人需求的收入分配制度,从而达到合理调整利益关系的目的。
三、如何合理运用统计学解决财务管理问题
(一)利用统计学方法进行财务的收益与风险计算财务管理的过程中,经常需要计算财务收益与风险,而对应在统计学中即为算数平均值与标准差的计算。比如,企业在运营过程中,需要计算期望现金流量,往往在现实运营过程中,存在诸多影响未来现金流量的不可控因素,因此计算出的未来的资金流量存在很大的不确定性,但如果采用单一的现金流量,在一定程度上可以保证现金流量的确定性,却不能全面的反应企业的资金运营情况。在这种大背景下,可结合统计学方法,如期望现金流量法,计算未来的现金流量,能提高计算的准确性,取得较好的效果。此外,在企业财务管理的过程中,需要运用到许多基于统计学的财务预算方法,如在预测资金需求量的情况下,可以运用回归法预测、平滑法预测等。当今,基于统计学原理,已经形成了很多专业的财务预算方法,如:预计资产负债表法、线性回归法等,这些方法的运用,加快了财务管理的效率,为财务人员处理庞大的财务数据提供了方法。
(二)利用统计学方法进行审计统计抽样抽样调查是统计学常用的统计方法,而审计抽样,则是抽样调查在财务应用的体现,主要是指审计人员在审计时,审查主体数据量比较庞大,因此仅抽取部分样本进行审查分析,通过分析抽取样本的审查结果,从而大致推断出总体的审查结果,这也是我国财务审查的主要方法之一。统计抽样之前需要先进行假设检验,即在抽样调查之前需要确定抽样规模、范围、基本参数等,之后还需对选取的样本进行初步审核。若在实际审查的过程中,抽取的样本不能满足审查要求,还可对样本的规模进行逐步扩大,以达到抽样结果的特征与总体情况基本相符的目的。在审查的最后,根据样本的审计结果进行推导,从而得出基本符合总体特征的结论。在实际的审计过程中,抽样的方法有很多,如货币单位抽样、变量抽样等。而在选择抽样方法时,审计人员应该根据审计的目标、效率及审查总体的特征合理选择,以达到审查的最终目的。
四、统计方法在财务管理中的应用
当今社会,统计学方法被大量应用于财务管理的各个方面,其最终目的在于提高财务管理的效率,分析财务活动的合理性,为财务活动的预测、决策、控制等提供科学依据。本文从收益率的预测、概率图的运用、数据的准确性及数据变异系数的分析四个方面着手,对统计学在财务方面的应用进行研究分析。
(一)预测未来收益率,提高企业收益。一个企业在实际运营过程中,能很好的把控未来的发展状态及收益情况,是企业发展的重要途径。利用合适的统计学方法可以实现利用已有的数据预测未来一段时间的数据。对应到企业中去,即运用统计学的方法,对企业现有的资源进行统计分析,预测未来一段时间内的收益情况,从而根据预测的收益率指定相应的实施方案,从而达到提高企业收益的目的。
(二)利用概率分布图,进行数据分析及投资决策。在具体的财务管理过程中,可利用统计学方法对已有数据进行处理,并根据需求绘制相应的概率分布图,那么各种数据的变化规律便一目了然,以便于决策者根据其变化规律进行投资或运营。比如在计算企业未来收益率时,可以根据现有的数据进行统计分析并绘制出一条概率与结果近似关系的连续性曲线,并根据该曲线推导出未来的收益率,从而进行投资决策。概率图有两个最主要的特点:概率分布图越集中,则其预期结果越趋向于实际结果,则其风险越小,投资回报率越高。当所得到的概率分布图越集中时,则说明实际结果越有可能接近预期值;反之,概率分布图越稀疏,则实际结果与实际结果的差距越大,风险也越大。
(三)利用标准差,确保数据的准确度。在财务的实际管理过程中,经常需要确定数据的准确程度,而财务人员通常是是利用统计学中的标准差的大小来判断所得到数据的精确程度。计算标准差的步骤如下:第一,根据现有的数据进行预测,得出收益的预测值;第二,将收益率的预测值和实际值相减,得到离差值;第三,计算概率分布方差,即将离差值求平方,并将得出的平方值与预测值相乘,再将这些乘积相加;第四,对方差进行开方计算,得到标准差。
(四)运用数据变异系数,度量单位收益风险。变异系数是标准差与平均数的比值,主要是用来衡量数据的变异程度,即用于度量单位收益下的所面临的风险。这种单位收益的风险判断为企业的决策提供了有效的借鉴。因为变异系数既能计算风险还可以反映企业收益,因此在企业的财务管理中被大量应用。
五、结论
企业或行业的财务管理过程中会面临大量的数据处理,合理利用统计学方法进行数据的统计及分析,对简化数据处理,提升数据准确度、精确度,甚至对于财务决策等各方面均有所助益,因此,将统计学方法引入财务管理具有非常重要的意义。
【参考文献】
[1]李金昌.关于统计思想若干问题的探讨[J].统计研究.2006,(3).
本文根据近年来砌筑砂浆技术不断进步,砖底模已经被淘汰,钢底模的试配强度计算还不够完善的现状。将JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算方法进行比较,从而对砌筑砂浆配合比规程中的试配强度计算方法进行评判。
1、JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算比较
在JGJ/T98-2010砌筑砂浆配合比规程中试配强度计算与JGJ98-2000的砌筑砂浆配合比规程中的计算方法不一样。JGJ98-2000的试配强度计算为fm,0=f2+0.645。其中fm,0指的是砌筑砂浆的试配强度。f2指的是砌筑砂浆的抗压强度平均值,其中抗压强度由三轴抗压强度实验获得,一般情况下由三个试块的抗压实验结果进行平均,平均值作为砌筑砂浆试块的代表值。指的是砌筑砂浆的现场强度标准差,是根据多年现场的资料进行收集与统计得来的。由于近几年来砌筑砂浆的技术不断进步,砖底模已经被淘汰,钢底模不断在施工中得到应用。我国针对变化及时的调整砌筑砂浆配合比方法,提出JGJ/T98-2010砌筑砂浆配合比规程。以适应现阶段砌筑砂浆施工要求。JGJ/T98-2010的试配强度计算公式为fm,0=kfm,k。其中k(与k值如表1所示)为经验参数,它是通过多年现场的资料进行收集与统计得来的;fm,k指的是砌筑砂浆的强度等级值,也就是砌筑砂浆的设计强度标准值。
表1 JGJ/T98-2010规范中的砌筑砂浆强度标准差与k值
通过以上所述的JGJ/T98-2010与JGJ98-2000砌筑砂浆配合比规程中的试配强度计算可以看出:
1)公式参数不同。JGJ98-2000的规范中所提及的砌筑砂浆的抗压强度平均值f2并没有运用到JGJ/T98-2010中。这是由于现阶段的砂浆试模由砖底模改变为钢底模,所以变异系数、标准差均相对JGJ98-2000的阶段有所减小。所以在JGJ/T98-2010中并没有体现砌筑砂浆的抗压强度平均值。直接可以通过砌筑砂浆的强度等级值,就可以对试配强度进行计算。
2)计算公式不同。JGJ/T98-2010的试配强度计算公式引入了k值,由JGJ/T98-2010试配强度计算与JGJ98-2000的比较可以看出试配强度计算方法更为简化,只利用k与强度等级值就可以进行试配强度计算。但是k并没有明确的物理意义,只是对强度标准差率的转化。弥补JGJ98-2000中出现的砌筑砂浆的抗压强度平均值与设计标准值之间的偏差问题,减小了绝对误差。
3)标准差没有在公式中体现。本文通过研究与论证,在JGJ/T98-2010中所规定的仍然采用JGJ98-2000中所规范的数据。所以在试配公式中没有采用,可以降低钢底模与砖底模之间的误差,而k值在JGJ/T98-2010也是采用材料强度的概率分布中的正态分布来确定。在规范中k值的解释是这样的:“当标准差为0.25倍的砂浆强度等级要求的强度的情况下,fm,0为1.2倍的f2,进行试配后的砂浆测得的强度均不低于强度等级要求的强度78.8%”。 当标准差为0.30倍的砂浆强度等级要求的强度的情况下,fm,0为1.25倍的f2,进行试配后的砂浆测得的强度均不低于强度等级要求的强度79.9%”。本研究通过以下介绍的强度综合评定法可以对砌筑砂浆配合比规程中的试配强度计算方法中的k值范围进行评判。通过非统计学的角度,评判k值是否可以代替进行试配强度的计算。
2、强度综合评定法评判JGJ/T98-2010的试配强度计算方法
强度综合评定法是基于混凝土的较为完整的评定体系得来的。由于混凝土与砂浆的配比机理相似,所以可以借鉴混凝土的强度综合评定公式以及概念。但是由于砂浆的立方体抗压试块相对于混凝土试块组数较少。所以拟采用非统计方法进行砂浆试配强度计算。即mf21.15fm,k和fmin0.95fm,k;其中mf2指的是同一验收批的砂浆立方体抗压强度的平均值;fm,k指的是砂浆立方体抗压强度标准值; fmin指的是同一验收批的砂浆立方体抗压强度的最小值。如果按照混凝土的生产质量水平划分,混凝土的实际强度要不低于强度等级所要求的强度的85%。但是通过砌筑砂浆施工工作的总结,砌体为一种特殊的结构,是多种材料的结合体。砌筑砂浆仅仅是多种材料中的一种,所以砌筑砂浆的强度对于砌体的强度影响是有限的。通过利用砌筑砂浆工程施工资料的收集与统计,当砌筑砂浆的抗压强度降低10%的情况下,砌体强度值则一般下降5%左右。在此情况下可以确定在一般的生产条件下,砌筑砂浆的强度达到强度等级规定的强度的75%~80%即可满足施工要求。所以可以将混凝土的强度综合评定公式中的fmin0.95fm,k修改为fmin0.75fm,k.。比较适合现阶段砌筑砂浆施工的实际情况。由于fm,0=kfm,k带入公式mf21.15fm,k、fmin0.75fm,k中可以得到kmf21.15fm,0和kfmin0.75fm..0 。在这两个公式中mf2的物理意义是同一验收批的砂浆立方体抗压强度的平均值,而fmin则为砂浆立方体抗压强度的最小值。所以则有kmf2kfmin0.75fm,00.75fmin。根据工程实际与试验中的验证不同批次的砂浆立方体的抗压强度的平均值与抗压强度的最小值之间的差距不大于1.533,即为1.15与0.75之商。所以k值的范围可以是1.533k0.75。所以在JGJ/T98-2010的试配强度计算方法中提出的k值为1.15、1.2、1.25均在这一范围内,符合强度综合评定法计算的强度需求范围。
几点建议与看法
通过以上对JGJ/T98-2010中规定的试配强度计算方法进行强度综合评定法评判,我们可以看出其符合强度综合评定法计算的强度需求范围。但是我感觉还是有不足之处有待于在以后的规定中做出完善与修改。本文就JGJ/T98-2010中规定的试配强度计算方法提出以下几点建议与看法:
(1)JGJ/T98-2010的试配强度计算方法中提出的k值在强度综合评定法评判的范围内,可以证明k值的取值是合理的,但是在JGJ/T98-2010的规范中k值的准确值则是由统计学角度来进行确定的。现阶段由于砂浆试模由砖底模改变为钢底模,所以变异系数、标准差均应与JGJ98-2000有所不同。但这一点并未在JGJ/T98-2010中体现出来。在此情况下k值的准确值仍然需要一个长期的资料统计与分析,最好对各种不同条件下的砌筑砂浆施工,采用不同的试配强度计算方法。
(2)钢底模相对于砖底模的强度较大,所以引起的变异系数就会相对减小。标准差也会相对降低,这样就会导致利用JGJ/T98-2010中规定的试配强度计算方法计算出的试配强度相对较高。
所以还要在以后的工作中加强收集钢底模的砌筑砂浆施工的有效数据,通过对大量资料的统计得出新的标准差与k值。这样会使试配强度计算方法施工更加精确,为以后新的砌筑砂浆配合比规程的规范提供参考。
参考文献:
[1] JGJ98-2000 砌筑砂浆配合比设计规程