matlab画箱型图均值⽅差,Matlab绘制箱线图
⽂章⽬录
前⾔
主要介绍箱线图(Box-plot)和利⽤Matlab绘制箱线图。
⼀、箱线图介绍
统计指标⼀般包括:四分位数、均值、中位数、众数、⽅差、标准差等,箱线图作为⼀种数据统计的⽅法,内容包括:最⼩值,第⼀分位,中位数,第三分位数,最⼤值。
箱线图于1977年由美国著名统计学家约翰·图基(John Tukey)发明,能够明确的展⽰离点的信息,同
时能够让我们了解数据是否对称,数据如何分组、数据的峰度。
箱线图(Box-plot)是⼀种⽤于显⽰⼀组数据分散情况的统计图,多⽤于多组数据的⽐较,相对于直⽅图,既可以节省空间,还可以展⽰更多信息(如均值、四分位数等)。
箱线图包含数学统计量,能够分析不同类别数据各层次⽔平差异,还可以揭⽰数据间离散程度、异常值、分布差异等。
四分位数:
⼀组数据按照从⼩到⼤顺序排列后,把该组数据四等分的数,称为四分位数。第⼀四分位数 (Q1)、第⼆四分位数 (Q2,也叫“中位数”)和第三四分位数 (Q3)分别等于该样本中所有数值由⼩到⼤排列后第25%、第50%和第75%的数字。第三四分位数与第⼀四分位数的差距⼜称四分位距(interquartile range, IQR)。
(1)第⼀个四分位数Q1:也称作25th百分位数,表⽰最⼩数(不是“最⼩值”)和数据集的中位数之间的中间数。
(2)第⼆四分位数Q2:也称作中位数Median/50th百分位数,表⽰数据集的中间值。
(3)第三四分位数Q3:也称作75th百分位数,表⽰数据集的中位数和最⼤值之间的中间值(不是“最⼤值”)。
(4)四分位间距IQR:第25⾄第75个百分点的距离。
(5)离值:Outliers
(6)最⼤值max、最⼩值min
根据数据分布偏度这⼀度量,箱线图形状可以分为三类:
左偏:均值 < 中位数 < 众数
对称:均值 = 中位数 = 众数
右偏:众数 < 中位数 < 均值
⼆、Matlab 绘制箱线图
【注】以下内容为MATLAB官⽅帮助⽂档。
Boxplot函数:⽤箱线图可视化汇总统计量。
语法:
boxplot(x) %创建 x 中数据的箱线图。如果 x 是向量,boxplot 绘制⼀个箱⼦。如果 x 是矩阵,boxplot 为 x 的每列绘制⼀个箱⼦。
%在每个箱⼦上,中⼼标记表⽰中位数,箱⼦的底边和顶边分别表⽰第 25 个和 75 个百分位数。须线会延伸到不是离值的最远端数据点,离值会以 '+' 符号单独绘制。
boxplot(x,g) % 使⽤ g 中包含的⼀个或多个分组变量创建箱线图。boxplot 为具有相同的⼀个或多个 g 值的各组 x 值创建⼀个单独的箱⼦。
boxplot(ax,___) %使⽤坐标区图形对象 ax 指定的坐标区和任何上述语法创建箱线图。
boxplot(___,Name,Value) %使⽤由⼀个或多个 Name,Value 对组参数指定的附加选项创建箱线图。例如,可以指定箱⼦样式或顺序。
参数:
x输⼊数据
在boxplot(x,g)中,x是输⼊数据,可以是数值向量(绘制⼀个箱⼦)或数值矩阵(为x的每列绘制⼀个箱⼦)。在每个箱⼦上,中⼼标记表⽰中位数,箱⼦的底边和顶边分别表⽰第25个和第75个百分位数。虚线会延伸到不是离散值的最远的端点,离散值会以‘+’符号单独绘制。
g分组变量
分组变量g指定为数值向量、字符数组、字符串数组、元胞数组或分类数组。分组变量中包含缺失值 (NaN)、空字符向量、空值或 字符串或值的组将被忽略,并且不会计⼊其他参数考虑的组数中。
图形属性参数
matlab直方图函数表达式:boxplot(x,Name,Value)。请查阅Matlab中boxplot函数的⽂档介绍,常⽤箱⼦外观属性整理:
绘制箱线图:
创建箱线图过程:
load carsmall %加载数据
%根据样本数据创建每加仑英⾥数 (MPG) 测量值的箱线图,按车辆的原产国 (Origin) 分组。添加标题并为坐标区加标签。boxplot(MPG,Origin)
title('Miles per Gallon by Vehicle Origin')
xlabel('Country of Origin')
ylabel('Miles per Gallon (MPG)')
每个箱⼦直观地表⽰来⾃指定国家/地区的汽车的 MPG 数据。意⼤利的“箱⼦”显⽰为⼀条线,因为样本数据只包含该组的⼀个观测值。修改图形属性参数:
如绘制带有缺⼝的箱线图:
1)⽣成两组样本数据
rng default % rng函数控制随机数⽣成
x1 = normrnd(5,1,100,1);% x1 包含从 mu = 5 和 sigma = 1 的正态分布⽣成的随机数
x2 = normrnd(6,1,100,1);% x2 包含从 mu = 6 和 sigma = 1 的正态分布⽣成的随机数
2)创建x1和x2的带缺⼝的箱线图
figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'})
title('Compare Random Data from Different Distributions')
3)修改属性值:boxplot([x1,x2],'Notch','marker','Labels',{'mu = 5','mu = 6'})
根据需求可以在MATLAB官⽅⽂档进⾏查看与修改属性。
参考资料
标签:线图,数据,中位数,位数,四分,绘制,boxplot,Matlab