ECOLOGY区域治理基于R聚类—因子分析的城市空气质量
影响因素研究
重庆工商大学数学与统计学院  徐艳平,徐培姜
霹雳布袋戏歌曲摘要:为明确城市空气质量影响因素,有效推进城市空气污染防治,提出使用R聚类—因子分析法对影响城市空气质量的气象因素进行筛选,结合既往文献已明确的城市空气质量影响因素,构建更为全面、具体的影响因素体系,现对重庆市2018年1月1日—2019年12月31日的19项气象数据进行R聚类—因子分析法进行筛选,最终筛选出平均气压、平均相对湿度、最大风速风向、极大风速风向、平均地表气温、最大风速、降水量共计7项因素作为影响城市空气质量的气象因素。结合已有研究,最终构建包括污染物浓度、季节、气象因素三类共计14项因素在内的城市空气质量影响因素体系。
关键词:R聚类;因子分析;气象参数;城市空气质量
中图分类号:X831  文献标识码:A  文章编号:2096-4595(2020)44-0164-0003
一、引言
随着工业的发展、化石燃料消费增加及中国城市化进程的不断加快,城市空气污染问题日趋严重,给社
会生活生产带来了极大的不良影响。明晰城市空气质量影响因素,有助于有针对性地进行污染防治,推进绿发展。
通过广泛阅读既往文献,结合专家学者对城市空气质量影响因素的研究发现,城市空气质量影响因素主要分为三个方面:一是大气污染物浓度,它是影响城市空气质量的最直接因素,也是当前国际社会公认的城市空气质量评价指标。丁卉等[1]使用污染物浓度采取模糊—灰聚类法构建了城市空气质量预测模型;陈颖等[2]基于6项污染物浓度通过聚类分析和主成分分析对山西省11个市的空气质量进行了科学评价;李勇等[3]选取6项污染物浓度作为评价因子构建了基于熵权法的城市空气质量评价模型。众多学者使用污染物浓度进行城市空气质量预测或评价均取得了较为准确的结果,验证了污染物浓度作为影响因素的科学性。二是季节因素。大量文献显示,除却大气污染物的影响,同一城市在不同季节下的空气质量也会有所差异。陈辉等[4]通过分形模型研究西安市空气质量发现,季节因素对空气质量有较大影响,夏秋两季空气质量较好,冬春两季空气质量较差;李婕等[5]通过研究发现珠三角城市的空气质量具有显著的季节特征;丁梓越等[6]采用时空地理加权回归模型研究众多因素对城市空气质量指数的影响发现,河南省空气质量指数具有较强的季节性变化。三是气象因素。很多地区和城市的大气污染突发事件并非出于污染物浓度的突然增加,而是由于气象条件不利于污染物扩散,从而导致空气质量恶化。因此,
气象因素也是城市空气质量变化的影响因素
之一。何建军等[7]研究了风速、风向、温
度、相对湿度、气压和能见度等气象因素对
河北廊坊城市空气质量的影响;杨张婧等[8]
以污染物浓度及温度、气压、湿度、风速等
因素为自变量,构建了基于大数据的城市空
气质量时空预测模型;柳晓燕[9]指出城市
空气质量与降水量、气温、废气排放等存在
显著相关关系;单芸[10]提出降水量、温度、
气压等因素对城市空气质量存在显著影响。
综上所述,大气污染物浓度与季节因素
是众多学者通过研究验证的影响城市空气质
量的主要因素;然而在研究气象因素对城市
空气质量的影响时,不同学者所选取的气象
因素有所差异,在因素选择时极具主观性,
容易造成重要气象因素丢失或因素间相关性
强、冗余信息多等问题。对此,本文提出使
用R聚类—因子分析法在众多可获取的气象
因素中,筛选具有代表性的气象因素,有消
除各因素间的相关性,删除冗余因素,并结
合污染物浓度与季节因素构成城市空气质量
影响因素。
二、R聚类—因子分析法
(一)数据预处理
为消除数据量纲对筛选结果的影响,通
过式(1)—(3)对原始数据进行标准化处理:
*ij j
ij
j
x x
python中len用法
x
s
=        (1)
j
s
=(2)
1
j ij
i
x x
n=
=∑(3)
式中,*ij x为第j个气象因素的第i个取值
标准化后的数据;ij x为第j个气象因素的第
i个原始数据;j x为第j个气象因素的总体均
值;j
s为第j个气象因素的总体标准差;n表
示每项气象因素的数据个数。
(二)R型聚类
假设有m个气象因素,最终聚类为l类,
第i类的离差平方和(1,2,...,)
i
S i l
=为:
()()
1
()()
i
n
j j
i i i i i
j
S X X X X
=
=−−
∑ (4)
式(4)中,i n为第i类的气象特征个数,
()j
i
X为第i类中的第j个气象特征标准化后的
样本值向量(1,2,...,i
j n
=),
i
X表示第i类气
象特征的样本平均值向量。
根据式(4)的第i类的离差平方和i S可
以计算所有k个类的总离差平方和S为:
()()
11
()()
i
n
k
j j
i i i i
i j
S X X X X
==
=−−
∑∑(5)
Ward聚类法的具体步骤为:
(1)将m个气象特征看作m个类别。
(2)将m类指标中任意两个合并成一
类而其他类保持不变,共有
(1)
2
m m−
种合并
方案;根据式(5)计算各合并方案的总离
差平方和,按总离差平方和最小的合并方案
进行新的分类。
(3)重复步骤(2),直到最后分类数
目为l。
目前对于聚类数目的确定还没有一种普
遍使用的方法,为了避免聚类数目的确定受
主观随意性影响,赵宇哲等[11]提出对聚类
后的指标进行非参数K-W检验来判断聚类数
目的合理性。非参数K-W检验的原假设为不
同指标在数值上无显著差异。若每一类的显
著性水平ig0.05
S>,则接受原假设,即同
一类的气象特征之间无显著差异,分类数目
合理;反之,则重新聚类。
(三)利用因子分析提取代表气象因素
作者简介:徐艳平,生于1995年,重庆工商大学2018级硕士研究生,统计学专业,研究方向为经济统计。
ECOLOGY
区域治理因子分析的实质是将所有因素进行约简,即用少数具有实际意义的公因子的线性组合来表示。因子分析模型为:
1122i i i ik k i x a F a F a F ε=++++L  (6)式(6)中,i x 为影响城市空气质量的
气象因素i ,j F 为提取的第(1,2,...,)
j j
k =个公因子,ij a 为第i 个气象因素在第j 个公因子上的因子载荷,i ε为影响因素i x 的特殊
因子。
利用因子分析提取代表气象因素的主要步骤为:
php explode 变量(1)针对进行R 聚类后的各类数据,分别进行因子分析。
(2)在每一类中提取公因子个数由累积方差贡献率达到80%作为判断标准,保留每个公因子中因子载荷量最大的因素,其他因素删除。
(3)对于一类只有一个因素的情况,该因素直接入选,无需再进行因子分析。
三、研究结果
(一)数据来源与预处理1.数据来源
根据既往文献对影响城市空气质量的气象因素的研究,结合气象因素的可获取性,本文选取平均气温、最高气温、最低气温、平均相对湿度、最小相对湿度、平均风速、最大风速、最大风速风向、极大风速、极大风速风向、日照时数、降水量、大型蒸发量、
平均气压、最高气压、最低气压、平均地表气温、最高地表气温、最低地表气温等19项因素作为待筛选气象因素。所使用的数据为2018年1月1日—2019年12月31日重庆市历史气象数据,数据来源于国家气象科学数据中心爬虫获取。
2.数据预处理
在上述所确定的影响因素中,最大风速风向与极大风速风向均属于非数值型因素,对此,本文对其进行了量化,将非数值型因素转化为离散的数值型因素。本文将风向方位分为17类,分别为北、北偏东、东北、东偏北、东、东偏南、东南、南偏东、南、南偏西、西南、西偏南、西、西偏北、西北、北偏西及无风。并对其取值为[1,2,3,…,15,16,17]。
(二)基于R 聚类的影响因素筛选
将数据标准化后的因素进行R 聚类,利用SPSS 软件完成,聚类结果见表1第2列。R 型聚类将气象因素共聚为7类,其中,平均气压、最高气压、最低气压为第一类,均为反映气压的因素;平均相对湿度、最小相对湿度为第二类,主要反映湿度;最大风速风向与极大风速风向分别为第三类与第四类;最低气温、最低地表气温、平均气温、平均地表气温、最高气温、最高地表气温、大型蒸发量、日照时数等与日照、气温等相关性较大的指标聚为第五类;最大风速、极
大风速、平均风速三个反映风速的因素聚为第六类;降水量为第七类。
为保证气象因素聚类数目的合理性,利用Python 软件分别对聚类后的每一类气象因素进行非参数K-W 检验,检验结果见表1第3列。每一类别的非参数K-W 检验的显著性水平Sig 均大于临界值0.05,因此聚类结果是合理的。
(三)基于因子分析的影响因素筛选
对R 聚类后的每一类别中的气象因素利用SPSS 软件进行因子分析,计算公因子个数与因子载荷,保留各公因子中因子载荷最大的因素,删除其余因素。结果见表1第4列—第6列。
最终在19个气象因素中,筛选出平均气压、平均相对湿度、最大风速风向、极大风速风向、平均地表气温、最大风速、降水量7个气象因素。
(四)城市空气质量影响因素确定根据R 聚类—因子分析法筛选影响城市空气质量的气象因素、删除冗余因素,结合既往文献对城市空气质量影响因素的研究,本文最终确定城市空气质量的影响因素为以下三类:
一是污染物浓度。包括  2.5PM 、10PM 、
2SO 、2NO 、3O 、CO ;
二是季节因素;
三是气象因素。包括平均气压、平均相对湿度、最大风速风向、极大风速风向、平均地表气温、最大风速、降水量。
五、结论
为明确城市空气质量影响因素,有效推进城市空气污染防治,很多学者研究分析影响城市空气质量的相关因素。在此背景下,本文使用R 聚类—因子分析法科学筛选影响城市空气质量的气象因素,结合既往文献已明确的城市空气质量影响因素,构建更为全面、具体的影响因素体系。以重庆市2018年1
月1日—2019年12月30日的19个气象因素相关数据进行实证筛选,最终筛选出平均气压、平均相对湿度、最大风速风向、极大风速风向、平均地表气温、最大风速、降水量共计7个气象因素。结合已有研究,最终构建包括污染物浓度、季节、气象因素三类共计14项因素在内的城市空气质量影响因素体系。
参考文献
[1]丁卉,刘永红,曹生现.基于模糊-灰聚类方法的城市空气质量评价研究[J].环境科学与技术,2013,36(S2):374-379.
[2]陈颖,张仲伍.基于聚类分析和主
(下转第221页)
表1 气象因素的R 聚类—因子分析的筛选结果
Table1screeningresultsofr-cluster-factoranalysisofmeteorologicalfactors
区域治理WISDOM EXCHANGE
课程时缺乏硬件支撑。
常规教学、体质测试等缺乏硬软件的支持。高校公共体育若全面实施线上教学,在硬件平台和软件App的匹配程度上要求较高。同时因为高校体育教师缺少信息技术处理能力,难以解决线上教学出现的疑难杂症,使得教学现代化滞后。大学生体质测试亦面临着同样的问题。
(二)智慧体育在高校公共体育领域的应用探析
随着大学体育课程教学改革的进行,很多高校开始落实“体育选修课+社团俱乐部+户外素质拓展活动”的“三位一体”公共体育教学模式。智慧体育的应用将为“三位一体”的体育教学模式提供最优的路径选择。除此之外,智慧体育还将在大学生体质测试这一领域提供技术性保障。
1.在体育选修课程中的应用爬虫软件 app
目前大部分高校开展的公共体育选修课,基本是以教授专项动作技能为主,学生虽然在课程中可实现身体锻炼,但整体的技术学习能力较差。为此,高校的体育教研室必须对教学模式进行创新,将智慧体育纳入课程教学中,让学生可以对所学的技术动作产生探究兴趣。
教师可运用线上线下混合式教学。采取线上预习的方式,让学生提前接触即将学习的内容,教师将提前准备的教学资源(关于运动项目相关的图片、短视频)等推送到平台上,并进行一定程度的监测,即查阅每名学生的观看进度。课堂上,体育教师可拍摄教学视频,尝试多角度、慢动作拍摄分解动作,学生模仿分解动作实时参与互动,学生做的每一个技术动作都可以立刻得到反馈和纠正。
运用智慧教学工具和智慧平台系统后,录入及时学生的信息(包括性别、身高、体重、病史、兴趣、专业背景等),教师能够随时根据学情作出分析,并能够动态监测每一个学生的学习状况,学生的出勤、课中的运动
量和运动强度、练习时遇到的困难、答题状
况、讨论反馈等都能实时显示。教师根据每
位学生的特点,指导其定位合适的学习层次,
选择合适的运动项目,最后使用最适当的考
核手段。
2.在体育社团、俱乐部中的应用
高校体育社团、体育俱乐部是高校公共
体育特有的文化现象,他们会举办和开展不
同类型的体育文化赛事,但缺少场馆是其需
要解决的一大难题。智慧体育的应用可以提
升高校体育场地资源的信息化,改善场地资
源的利用率。无论是室内场馆还是室外场地
都需分类编号录入智慧体育平台,实现随时
查看场地使用情况、在线申请租借等功能,
不仅协调了体育社团的场地问题,还在一定
程度上规范了赛事活动的场地秩序。
另外,在社团俱乐部组织的相关比赛与
活动方面,智慧体育的参与可有效完成活动
的线上宣传推广、在线报名、费用报销、实
况直播等。智慧体育平台的建构、高校社团
俱乐部管理系统的开发,也促进了社团、俱
乐部的运行管理正规化,使成员之间的信息
交流更畅通。
3.在户外素质拓展训练中的应用
户外素质拓展训练目前普遍作为高校公
共体育的创新课程,是以主题性的团体项目
为主,在素质拓展中常常加入定向运动、体
育游戏等内容。为丰富素质拓展训练的体验
性,激发学生对它的兴趣,高校可围绕素质
拓展建设信息化的智慧营地,投入智慧体育
产品(运动手环、运动手表、智能跑鞋等),
教师组织学生通过智慧体育App在智慧营地
进行活动,使学生沉浸在科技与体育结合的
现代化体验中,并最终对学生的表现进行在
线实时评价,再根据评价结果实施奖惩措施,
还可依据学生在素质拓展活动中的表现连接
至综合素质学分平台,完成学分核算。
4.在大学生体质测试中的应用
vistas
近年来,大学生体质测试成为一个热点
话题,差强人意的体测结果也从侧面反映出
高校的体质健康系统不是很完善。高校智慧
体育平台的运行,可以在相应的板块建立体
质健康系统。体质健康系统不仅能通知学生
端其参与体测的环境、体测教师、各项结果、
最终分数,还可以把打分机制以及提升建议
推送至学生端,学生的体质健康各项成绩数
据在线实时更新,学生可登录自行查询,这
不仅方便学生掌握自身情况,也便于学校及
时地、全面地了解学生的身体健康状况。
测试手段上也可以应用智慧体育来缓解
体育教师的工作压力,高校可采购上线一批
智慧型体测仪器,并与学校的智慧运动平台
进行绑定,完善体质健康系统的建立。实现
大学生体质测试的数据共享,将极大地提升
高校大学生体质测试的工作效率。
五、结论与建议
智慧体育的发展,势必会推动整个高
校公共体育教学的改革进程。现阶段,智
慧体育在高校的建设与应用还不完善,仍处
于起步阶段,但发展态势良好;智慧体育在
高校公共体育的应用关系到大学生的切身利
益,高校可适当加大对智慧体育各项目的支
持力度;同时广大师生应该积极推广智慧体
育,大家共同促进智慧体育在大学体育中的
应用,打造特亮点,为进一步促进高校公
共体育的内涵式发展作出贡献。
参考文献
[1]教育部.全国普通高等学校体育课
程教学指导纲要[Z].2002(8):1.
[2]教育部.教育信息化十年发展规划
(2011-2020年)[Z].2012(3):3.
[3]国务院办公厅关于印发体育强国建
设纲要的通知[Z].国办发〔2019〕40号.
[4]国务院.中国制造2025[Z].2015(5):28.
[5]韩松.基于移动互联网构建
我国智慧体育的思考[J].体育科学研
究,2016,20(3):36-42.
(上接第165页)
成分分析的城市空气质量评价——以山西省11个地级市为例[J].山西师范大学学报(自然科学版),2020,34(4):72-78.
[3]李勇,丛怡,贾佳.基于熵权法的汾渭平原城市空气质量模糊综合评价[J].环境工程,2020,38(8):236-243+206.
[4]陈辉,厉青,杨一鹏,申维,赵祥.基于分形模型的城市空气质量评价方法研究[J].中国环境科学,2012,32(5):954-960.
[5]李婕,滕丽.珠三角城市空气质量的时空变化特征及影响因素[J].城市观
js里的switch语句怎么用察,2014(5):85-95.
[6]丁梓越,刘海砚,陈晓慧,麻洪
川.河南省城市空气质量指数时空演变及其
影响因素的时空异质性[J].测绘科学技术
学报,2020,37(2):190-196.
[7]何建军,吴琳,毛洪钧,李瑞芃.气
象条件对河北廊坊城市空气质量的影响[J].
环境科学研究,2016,29(6):791-799.
[8]杨张婧,阎威武,王国良,车继
勇.基于大数据的城市空气质量时空预测模
型[J].控制工程,2020,27(11):1859-1866.
[9]柳晓燕.城市环境空气质量问
题及影响因素分析[J].资源节约与环
保,2020(6):12.
[10]单芸.气象因素对盐城市环境
空气质量的影响探析[J].科技创新导
报,2020,17(15):145+148.
[11]赵宇哲,刘芳.生态港口评价指标
体系的构建—基于R聚类、变异系数与专家
经验的分析[J]科研管理,2015,36(2):124-
132.