基于统计图表的学生考试成绩可视化分析
作者:余水发,张惠锋,傅海婷,李子杭,李秀央
来源:《教育教学论坛》 2015年第8期
    余水发1,张惠锋1,傅海婷1,李子杭1,李秀央2
    (1.浙江省杭州市第二中学,浙江杭州310058;2.浙江大学流行病与卫生统计学系,浙江杭州310058)
    摘要:学生考试成绩分析是教学工作的一个重要组成部分,一方面可以深入了解学生对知识的掌握情况,另一方面可以了解教学质量。目前,在考试研究中常用方法是算术平均数和直方图。随着计算机技术的不断发展,统计图的制作越来越方便,能从不同角度来描述数据特征统计图的应用也日益广泛。为了进一步推广使用统计图在教学研究中的应用,本文以2014年杭州某中学12个班学生统测成绩为实例进行介绍。
    关键词:统计图表;考试成绩;可视化
    中图分类号:G632.474 文献标志码:B 文章编号:1674-9324(2015)08-0077-03
    一、资料与方法
    1. 资料来源:2014年杭州某中学12个班学生统测成绩,科目包括语文、数学、英语和政治。
    2.统计分析方法:服从正态分布的计量资料采用x+s,偏态分布的计量资料采用M(QR),成绩分布采用箱式图,不同班级之间平均成绩比较采用雷达图,总体水平描述采用误差图。数据整理和处理采用IBMSPSS Statastics20.0统计分析软件,雷达图使用Excel2007。
    二、结果
    1.基本情况。2014年6月杭州市对高一班级学生进行语文、数学、英语和政治等4门功课的期末统一测试考试,。杭州市某校高一共12个班级,其中2个是实验班(411班和412班),10个平行班,学生共436人,缺考7人,实考人数429人。
    2.成绩分布。12个班4门功课的成绩分布情况见图1所示。图1显示:4门功课的平均成绩均以实验班为高。语文和英语没有出现极高值点,数学出现2个极高值点,政治1个。极低值出现最少的是政治,其次为语文,数学和英语的比较多。
    三、平均成绩比较
    本次考试语文和英语的成绩比较好,语文平均分为72.50(7.00)高于杭州市8所省重点中学学生的总体平均水平(72分),其中有7个班级的语文平均成绩高于杭州市平均数,以411班为最高,其次为412班。英语平均分为76.00(13.00),与杭州市平均水平持平,其中有6个班级的英语平均成绩高于杭州市平均数,以412班为最高,其次为411班。数学成绩不是很理想,平均分为54.00(13.00),只有2个实验班的数学成绩高于杭州市平均水平(58分)。政治平均分为73.00(13.00),有4个班平均成绩高于杭州市平均水平(74分),以2个实验班成绩为较优,见表1、图2和图3。
   
   
   
数据可视化图表分析   
    四、总体水平比较
    4门功课12个班的误差图见图4所示。4门功课总体平均成绩411班和412班之间差异没有统计学意义。411班、412班数学和政治总体平均成绩均优于其他班级;语文差别不大,以403班为最差;数学以411和412班为较好,以402和405班为较差;英语以411、412、401、403、404和408为较好;政治以411和412班为较好,404、409和410班次之。
    五、讨论
    1.统计表与统计图是描述研究对象的一般特征的一种常用表达方法,相对于描述性指标而言,统计表与统计图具有直观、更便于相互之间进行比较的特点。统计表是以表格的形式简明地表达事物间数量关系的一种形式,它不仅可以代替冗长的文字叙述,而且便于阅读和相互之间的比较。统计图通过点的位
置、线段的升降、直条的长短或面积的大小等方法来表达数据与变量的关系。统计图辅以简洁的文字说明,就可以直观地反映统计数据所蕴含的内在信息,并可大大提高统计报告的可读性。对于同一份资料,有时可以同时制作统计表和统计图。一般来说,统计图用几何图形表达结果较统计表直观。不同研究目的、不同资料类型采用的统计图也不相同。
    2.箱式图又称箱图,是一种描述连续性变量分布特征,可用来表达定量资料的5个特征值,即扣除异常值和极值以外的最小值P25、P50、P75和扣除异常值和极值以外的最大值。由P25-P75构成图形的“箱”,由扣除异常值和极值以外的最小值-P25和P75-扣除异常值和极值以外的最大值构成“箱子”上下的两条“触须”。异常值又称离值,是指大于1.5倍四分位数间距的数值,在箱式图中常用圆圈“。”表示。极值是指大于3倍四分位数间距的数值,在箱式图中常用星号“*”表示。箱图用于多组定量资料分布描述。横坐标为各组的名称,纵坐标为定量资料均数和分位数值。误差图是一种用于描述均数、标准差、标准误和总体均数可信区间等指标的统计图,常用于原始数据分布和研究结果的表达和比较。雷达图又称戴布拉图、螂蛛网图,起先是财务分析报表的一种,目前在其他领域可作为一种能对多变量资料进行综合分析的图形,它是以一点为中心,每个变量为一轴,由内向外发射状的图形。
    3.在统计表与统计图应用中应注意的事项。①统计图表的制作要求规范。统计表一般采用三线表或四线表;不同类型的数据要有纵标目,需要时还得加上度量衡单位。统计表的制作最好采用Microsoft OfficeWord软件中插入表格的方法来完成,因采用绘制表格的方法,容易出现标题和表中文本和数据分
家的现象,不便于排版。②统计图的制作一般可以采用统计软件来制作并在相应软件中进行编辑,但是个别的统计图需要采用特殊软件处理,如雷达图可以使用MicrosoftOffice Excel软件来制作。③统计图的选用应该正确,一般按照研究目的和资料类型来选定,如:箱图一般适用于实验数据分布特征的描述和表达,而误差图主要用于对研究结果的表达和比较,为了解释结果方便起见,误差图中最好采用总体均数的95%可信区间。
    参考文献:
    [1]陈坤,陈忠.医学科研方法[M].第一版.北京:科学出版社,2011.