数据的集中趋势与离散程度——知识讲解
撰稿:杜少波  责编:张晓新
【学习目标】
1、掌握平均数加权平均数的意义和求法,体会用样本平均数估计总体平均数的思想.
2、了解中位数和众数的意义,掌握中位数的求法,并会一组数据的众数.
3、了解方差的意义及求法,体会用样本方差估计总体方差的思想,能用方差解决一些实际问题.
4、从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用.
【要点梳理】
要点一、平均数和加权平均数
1.平均数
一般地,如果有个数据,那么,就是这组数据的算术平均数,简称平均数,用“”表示.即.
要点诠释:
(1)平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.
(2)平均数的大小与一组数据里的每个数据均有关系,其中任意一个数据的变动都会引起平均数的变动,所以平均数容易受到个别特殊值的影响.
2.加权平均数
若数据出现次,出现次,出现次……出现次,这组数据的平均数为,则=(其中++…+=n,k≤n)
在一组数据中,数据重复出现的次数f叫做这个数据的.按照上述方法求出的平均数,叫做加权平均数.
    数据的权能够反映数据的相对“重要程度”.
要点诠释:
(1)越大,表示的个数越多,“权”就越重. “权”越重,对平均数的影响就越大.加权平均数的分母恰好为各权的和.
(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算.
要点二、中位数和众数
1.中位数
一般地,当一组数据按大小顺序排列后,位于正中间的一个数据(当数据的个数是奇数时)或正中间两个数据的平均数(当数据的个数是偶数时)叫做这组数据的中位数.
要点诠释:
(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.
(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.
2.众数
一组数据中出现次数最多的数据叫做这组数据的众数.
要点诠释:
(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个.
(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.
要点三、平均数、中位数与众数的联系与区别
联系:平均数、众数、中位数都是反映数据集中趋势的统计量,能从不同的角度提供信息.
区别:平均数能充分利用数据提供的信息,它的使用最为广泛,能刻画一组数据整体的平均状态,但不能反映个体性质,易受极端值的影响.中位数代表了这组数据数值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.众数反映一组数据中出现次数最多的数据.一组数据中,众数可能不止一个,也可能没有.
总之,要根据具体问题来选择刻画一组数据的集中程度的统计量,选择的统计量要能够更客观地反映实际背景.
要点四、方差
设一组数据是,它们的平均数是,我们用来衡量这组数据的离散程度,并把它叫做这组数据的方差.
一组数据的方差越大,说明这组数据的离散程度越大,越不稳定.
在两组数据的平均数相差较大时,以及在比较单位不同的两组数据时,不能直接用方差来比较它们的离散程度.
要点诠释:
(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.
(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.
(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
要点五、用样本估计总体
在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.
要点诠释:
(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.
(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.
【典型例题】
类型一、平均数、众数和中位数
1、某选手在青歌赛中的得分如下(单位:分):99.60,99.45,99.60,99.70,98.80,99.60,99.83,则这位选手得分的众数和中位数分别是(  )
A.99.60,99.70        B.99.60,99.60
C.99.60,98.80        D.99.70,99.60
【思路点拨】根据众数和中位数的定义求解即可.
【答案】B;
解析解:数据99.60出现3次,次数最多,所以众数是99.60;数据按从小到大排列:99.45,99.60,99.60,99.60,99.70,99.80,99.83,中位数是99.60.故选B.
总结升华本题考查了中位数,众数的意义.中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个,则中间两位数的平均数.众数是一组数据中出现次数最多的数据,注意众数可以不止一个.
举一反三:
【高清课堂  数据的分析 例8】
【变式1】若数据3.2,3.4,3.2,,3.9,3.7的中位数是3.5,则其众数是________,平均数是________.
【答案】3.2;3.5;
解:由题意,所以众数是3.2,平均数是3.5.
【变式2】某中学随机地调查了50名学生,了解他们一周在校的体育锻炼时间,结果如下表所示:
则这50名学生这一周在校的平均体育锻炼时间是(  )
A.6.2小时    B.6.4小时    C.6.5小时    D.7小时
【答案】B;
解:根据题意得:
(5×10+6×15+7×20+8×5)÷50
=(50+90+140+40)÷50
=320÷50
=6.4(小时).
故这50名学生这一周在校的平均体育锻炼时间是6.4小时.   
类型二、利用平均数、众数、中位数解决问题   
2、某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如下表所示:
测试项目
测试成绩
教学能力
85
73
73
科研能力
70
71
65
组织能力
64
72
84
    (1)如果根据三项测试的平均成绩,谁将被录用,说明理由;
    (2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5:3:2的比例确定每人的成绩,谁将被录用,说明理由.
【思路点拨】(1)运用求平均数公式即可求出三人的平均成绩,比较得出结果;(2)将三人的成绩按比例求出测试成绩,比较得出结果.
【答案与解析
解:(1)甲的平均成绩为:(85+70+64)÷3=73,
乙的平均成绩为:(73+71+72)÷3=72,
丙的平均成绩为:(73+65+84)÷3=74,
∴ 候选人丙将被录用.
    (2)甲的测试成绩为:(85×5+70×3+64×2)÷(5+3+2)=76.3,
乙的测试成绩为:(73×5+71×3+72×2)÷(5+3+2)=72.2,
丙的测试成绩为:(73×5+65×3+84×2)÷(5+3+2)=72.8,
      ∴ 候选人甲将被录用.
总结升华5、3、2即各个数据的“权”,反映了各个数据在这组数据中的重要程度,按加权平均数来录用.
举一反三:
【高清课堂  数据的分析 例10】
【变式】小王在八年级第一学期的数学成绩分别为:测验一得89分,测验二得78分,测验三得85分,期中考试得90分,期末考试得87分,如果按照平时、期中、期末的10%、30%、60%量分,那么小王该学期的总评成绩应该为多少?
【答案】
解:小王平时测试的平均成绩(分).
所以(分).
答:小王该学期的总评成绩应该为87.6分.
【高清课堂  数据的分析 例11】
3、下表是七年级(2)班30名学生期中考试数学成绩表(已破损).
    已知该班学生期中考试数学成绩平均分是76分.
    (1)求该班80分和90分的人数分别是多少?
    (2)设此班30名学生成绩的众数为,中位数为,求的值.
【答案与解析
解:(1)设该班得80分的有人,得90分的有人.
根据题意和平均数的定义,得
整理得  解得
    即该班得80分的有8人,得90分的有5人.
    (2)因为80分出现8次且出现次数最多.所以=80,第15、16两个数均为80分,所以=80,则=80+80=160.
总结升华本题为统计题,考查平均数、众数与中位数的意义.解题的关键是准确理解题意,建立等量关系.
举一反三:
【变式】某教师为了对学生零花钱的使用进行教育指导,对全班50名学生每人一周内的零花钱数额进行了调查统计,并绘制了统计图表如图所示的统计图.
零花钱数额(元)
5
10
15
20
学生个数(个)
15
20
5
请根据图表中的信息,回答以下问题.
    (1)求的值;
    (2)求这50名学生每人一周内的零花钱额的众数和平均数.
【答案】
解:(1) =50-15-20-5=10.
(2)众数是15.
平均数为(5×10+10×15+15×20+20×5)=12.
类型三、方差
4.甲、乙两班举行汉字输入比赛,参赛学生每分钟输入汉字的个数经统计计算后,填入下表:
班级
参加人数
中位数
方差
平均字数
  55
149
191
  135
  55
151
110
  135
    分析此表得出如下结论:(    )
    (1)甲、乙两班学生成绩的平均水平相同;
    (2)乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字150个为优秀)
    (3)甲班学生成绩的波动情况比乙班成绩波动大.
3d走视图    A.(1)(2)    B.(1)(2)(3)    C.(2)(3)    D.(1)(3)
【思路点拨】理清表格中所列数据代表的含义,以及数据差异而导致的不同.
【答案】B
【解析】甲、乙两班学生的平均字数都是135个/分钟,所以平均水平相同;从中位数上看,乙班的151大于甲班的149,表明乙班优秀的人数多于甲班优秀的人数;从方差上看,甲班的方差大于乙班的方差,所以甲班学生成绩的波动情况比乙班成绩波动大.因此,(1)(2)(3)都正确,选B.
总结升华此类题关键是要能从表格中筛选出所需要的信息,理解每个数据所代表的含义.
举一反三:
【变式】甲、乙两人各射击6次,甲所中的环数是855,A,B,C, 且甲所中的环数的平均数是6,众数是8;乙所中的环数的平均数是6,方差是4.根据以上数据,对甲、乙射击成绩的正确判断是(  )