要。虽然我国目前关于井下涡轮电机状态的检测技术远远达不到我们所希望的目标,但是相信通过电机检测系统的一线员工不断的实验不断的探索,以及不断向国外先进检测技术学习,不远的将来,我们一定可以实现检测技术的自动化、智能化,进一步提高我国电机运行效率,我国检测技术的发展也一定会有为更多的领域带来更高的效益。
【参考文献】
[1]闫文辉,彭勇,张绍槐,李军强.旋转导向钻井工具稳定平台单元机械系统的设计[J].钻采工艺,2006(04):73-75+3. [2]闫文辉,彭勇,施红勋.旋转导向钻井工具液压分配系统的设计[J].钻采工艺,2005(05):69-72+2.
[3]赵方剑.电潜泵生产系统工况诊断理论与技术研究[D].中国石油大学,2010.
[4]钱坤.数控往复式潜油电泵故障诊断系统的设计与研究[D].东北石油大学,2015.[5]杨金芳.电机电器状态检测与故障诊断[J].中国新技术新产品,2014(09):122.
[6]李霏,顾含,董庆丰.电特性检测在电机预防性检修和故障诊断中的应用研究[J].机电工程,2018,35(04):402-406+413.
[7]张颖,卜丽丽,吴玉美.精密点检在电机状态检测上的应用[J].黑龙江科技信息,2015(32):58.
[8]柯思勤.永磁电机故障诊断和容错技术概述[J].大功率变流技术,2017(02):11-16.
[9]李建帮.煤矿电机常见故障分析及诊断方法[J].内蒙古煤炭经济,2014(03):64+66.
基金项目:国家自然基金青年科学基金项目,51704238,强振动旋转钻具弱SNR信号的随机共振提取2018.01-2020.12。
作者简介:吴秦英(1995-),女,汉族,陕西华阴人,西安石油大学硕士研究生在读,研究方向:导向钻井工具工作状态监测技术研究。
1  引言
数据可视化是数据视觉表现形式的科学技术研究,主要是借助图形化的手段来清晰有效地传达与沟通信息。但这绝不意味着数据可视化必须为实现其功能而去深究枯燥的绘图代码,亦或是为了使图画看上去高端绚丽而显得过于复杂。
Python是数据科学与数据分析领域的优先选择。丰富的第三方库、开源社区、及不断优化的使用文档,为许多非计算机领域的学习者提供了广阔的入门与精通渠道。所以本文将以Python为舟,简要介绍Python在数据可视化中的思路与应用场景。
2  Python 中的数据可视化工具
在Python强大的“计算生态”中,Matplotlib与 Seaborn这两个静态绘图库首当其冲。Seaborn其实是在 Matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用Seaborn就能做出很具有吸引力的图,而使用Matplotlib亦能制作具有更多特的图。作为数据可视化的学习者,我们应该把 Seaborn视为Matplotlib的补充,而不是替代物。至于年度总结会议等场景常用的交互式或动态的数据可视化,Boken、Echarts、Plotly等绘图库亦可很好的满足我们的需要。而对于暂时没有计算机背景的数据可视化学习者,现成的软件如Tableau,Power BI以及各种新兴的大数据可视化平台如阿里云,派可等也能满足其他学科日益增长的数据可视化需求。
最常见的数据可视化分析包含以下分类:贡献度、对比、分布、周期性、相关性等。
3  利用 Python 第三方库进行数据可视化
频率直方图是用于展示数据的分组分布状态的一种图形,用矩形的宽度和高度表示频数分布,通过直方图,用户可以很直观的看出数据分布的形状、中心位置以及数据的离散程度等,再辅以数据分布的拟合曲线与希望对比的同等条件(如数据规模,标准差,平均值相等)下的某拟合曲线类型(正态分布或泊松分布曲线等),可以清晰立体的了解数据分布的情况,同时也可提前准备后续的特征工程方面的工作。
本例通过Python网络爬虫,获取租房网站巴乐兔中广州部分地区(天河,海珠,白云,中山)的租房价格,经过数据评估、清洗与预处理,再使用Python来绘制带有正态拟合曲线的频率直方图,并以多子图组合来作为最
基于Python的数据可视化
罗博炜
(五邑大学  广东  江门  529099)
【摘要】在数据科学飞速发展的今天,拥有丰富的工具包与活跃的开源社区的Python语言,在机器学习,文件批处理,数据可视化等领域的的价值日渐增长。能够对数据进行行之有效的探索性数据分析,并使用便捷的工具实现美观的数据可视化至关重要。本文叙述了Python软件中绘图工具与主流分析库的应用,并使用Matplotlib和Seaborn库进行数据可视化,分析广州部分地区的房价分布情况,通过实践展示Python库的强大功能和绘图步骤,为学习数据可视化的读者提供参考与借鉴。
【关键词】Python;数据分析;数据可视化;第三方库
【中图分类号】TP311.13          【文献标识码】A          【文章编号】1009-5624(2019)12-0072-03
72
73
终的图片呈现形式。
注:本文代码使用的编辑器为 Jupyter Notebook。2.1 数据预览
数据规模与类型并随机展示 5 条数据。
2.2 广州部分地区租房房价分布绘制代码# 绘图库与统计学库
import matplotlib.pyplot as plt import seaborn as sns
from scipy.stats import norm # 布局设置
fig = plt.figure(figsize=(22, 20))ax1 = fig.add_subplot(221)ax2 = fig.add_subplot(222)ax3 = fig.add_subplot(223)ax4 = fig.add_subplot(224)# 主体
sns.distplot(tian_he['price'], fit=norm, color='#099DD9', kde_kws={"color" : '#099DD9', "lw" :3 }, ax=ax1)  # 天河
s n s .d i s t p l o t (h a i _z h u ['p r i c e '], f i t =n o r m ,c o l o r ='#4C B 5A B ',k d e _kws={"color":'#4CB5AB', "lw" :3 }, ax=ax2)  # 海珠
sns.distplot(bai_yun['price'], fit=norm, color='#F77B72', kde_kws={"color" : '#F77B72', "lw" :3 }, ax=ax3)  # 白云
sns.distplot(zhong_shan['price'],fit=norm,colo r='#7885CB',kde_kws={"color":'#7885CB', "lw" :3 }, ax=ax4)  # 中山
# 图例设置# 天河
(mu, sigma) = norm.fit(tian_he['price'])
ax1.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=${:.2f} )'.format(mu, sigma)] ,loc='best')# 海珠
(mu, sigma) = norm.fit(hai_zhu['price'])
ax2.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=$ {:.2f} )'.format(mu, sigma)] ,loc='best')# 白云
(mu, sigma) = norm.fit(bai_yun['price'])
ax3.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=${:.2f})'.format(mu, sigma)] ,loc='best')# 中山
(mu, sigma) = norm.fit(zhong_shan['price'])
ax4.legend(['Normal dist. ($\mu=$ {:.2f} and $\sigma=$ {:.2f} )'. format(mu, sigma)] ,loc='best')
# 子图标题
ax1.set_title('天河'); ax2.set_title('海珠')ax3.set_title('白云'); ax4.set_title('中山')# 总标题
plt.suptitle('广州部分地区租房房价分布')# 装饰 与 图片保存
sns.despine(trim=True, left=True, offset=10)plt.show()
plt.savefig('广州部分地区租房房价分布.png')2.3 成图效果
3  代码与结果分析
为了更有效地传达可视化图形中的思想概念,美学形式与功能需要齐头并进,本文选用彩柔和,透明度适中的颜组合来绘制图形,防止过于鲜艳扎眼的彩抢夺用户注意力。同时,上左右的边框隐去,横坐标轴轻微向下偏移,可以使视野更加聚焦于图形。
3.1 代码分析
利用Python 代码来实现数据可视化的过程并不是一蹴而就的,即代码完成的顺序并非自上而下一气呵成,正确而严谨的顺序应为:整体布局-->图形主体-->图形标注-->细节布局与调整。
整体布局:确定是绘制单张图片还是多子图的形式,设置图片的初步大小,对应代码步骤中的布局设置和总标题。
图形主体:确定绘图类型,调用Python 可视化绘图库中对应的图形代码,添加或更改参数,Seaborn 中的绘图函数display 的特点与参数解释:kde_kws 表示开启数据的拟合曲线,该曲线不是正态的,而是更好地拟合了数据的分布情况,kde_kws 内部的参数可设置拟合线的颜
与线宽(通常与柱子颜相同),参数fit表示需要对比的是同等条件下正态分布的拟合曲线。
图形标注:plt.legend()完成图形中图例的添加(子图图例则使用ax.legend()),自动放置在不遮挡图形的最佳位置,当然也可以显式设置
细节布局与调整:在整体布局中设置的图片的初步大小有可能会差强人意,需要反复尝试直至到最优的长宽比,关于坐标轴是否隐去以及是否需要通过plt. grid(True) 来添加网格背景,则需要视具体情况来决定。
3.2 结果分析
整体来看,不难发现数据集中的四个地区的租房房价分布情况均可以较好地拟合正态曲线,为保险起见,笔者也分别进行了正态性的显著性检验(Shaprio/Anderson-Darling),p值均大于2,故无法拒绝正态性假设,即可以认为这数据集中这四个区域的租房房价分布是正态的,这为我们后面的更深层次的探索如特征工程等提供了很好的帮助。
局部来看,分别对每个子图进行分析,可知:就租房房价波动范围而言,广州海珠区的最大,中山最小,四个地区的租房房价都呈现不同程度的右偏态分布,峰度都在 -1~1间,未出现明显的双峰分布;整体的房价范围绝大多数在500~2500间,价格区间在800~1500的房子数目较多。
4  结论
在熟悉Python可视化中各种常用且经典的图形后,考虑到常用的图形所需的绘图代码依然存在较为冗长的缺点,所以建议根据个人习惯与喜好,并结合现实需求,将Seaborn和Matplotlib库中的常用图形的源代码单独封装在自己定制的库中,并根据需求添加或修改部分参数,最终可又好又快的实现自写库的调用与图形的生成。
Python在近几年飞速增长的背后是快速扩张的数据科学用户社区,以及他们每天使用的工具和框架,其
中包括许多由Python驱动的核心数据科学软件包如Numpy、Pandas、scikit-learn、SciPy等,这些软件包降低了数据科学工作的障碍,成为了学术界和产业界项目的基础。
总的来说,数据可视化与信息图形、科学可视化、数学建模及统计图形密切相关。在研究、较学和开发领域,数据可视化乃是一个极为活跃且关键的方面,再加上近十年的开源运动,已然有着强大”计算生态“的Python在数据科学中各方面的应用,值得我们去不断探索与实践。
【参考文献】
[1][美]Wes McKinney.利用Python进行数据分析[M].徐敬一,译.北京:机械工业出版社,2018.
1  引言
在现代军事战争中,为对抗敌方的军事侦察和武器攻击,保证部队隐蔽地采取军事行动,伪装必不可少。在多种伪装技术中,迷彩伪装是最基础也是最重要的一种伪装技术。在迷彩伪装的设计中主要由两部分组成:生成迷彩轮廓的技术和提取背景图像颜的技术。本文对不同作战环境进行分类处理,借助图像处理技术,提出了一种基于背景图像的迷彩轮廓生成技术,而后进行颜填充,形成迷彩图案。将生成的迷彩图案用于坦克,通过与文献[1]中提出的迷彩伪装斑点设计方案相比,证明本方案具有更好的静态伪装效果。同时,通过对运动目标的动态伪装场景进行伪装效果评估,与文献[2]进行对比可以发现本文的伪装设计技术具有更好的动态伪装效果,从而提高了迷彩伪装设计的实时性和准确性。
2  相关工作
python是做什么的通俗易懂的
迷彩伪装技术是将作战装备设计成与作战背景相近的颜,它分为保护迷彩伪装技术、变形迷彩伪装技术和数码迷彩伪装技术等[3]。20世纪初俄国的土褐军服等[4]保护迷彩伪装技术由于伪装方式和彩单一,在现代军队中已经很少使用。变形迷彩主要用于伪装活动目标,是一种实用有效的降低活动目标被发现概率的方法。为对抗高分辨率航空航天光学成像侦察、红外及雷达侦察等,数码迷彩根据目标特点和所处背景既可以设计成变形迷彩,也可以设计成仿造迷彩。喻钧等[5]提出了一种根据目标背景图像生成仿造数码迷彩的设计方法。在抗战胜利70周年大阅兵上可以看到多个装备使用了数码迷彩,这种迷彩伪装技术将对武器装备的伪装性能带来巨大影响,具有极大的应用价值。
3  迷彩轮廓生成方法
依据作战季节及作战地点不同,本文将作战环境的背景图像分为冬季草地、冬季山地、夏季草地、夏季山地、森林和荒漠等六类。通过对每类背景进行轮廓提取、择优和建库处理生成迷彩轮廓。
迷彩伪装中基于背景的轮廓生成技术
李春彦,王  珍,罗  毅,虞明根
(航天工程大学士官学校  北京  102200)
【摘要】目的:为更好地躲避敌方侦察、隐藏自身装备,需要进行必要的迷彩伪装。方法:本文先对不同环境下的背景图像进行分类,然后提取轮廓、择优选择,同时借助K-means算法对背景图像进行颜提取,将提取后的颜填充到择优轮廓中,生成迷彩图案。结果:结果表明该迷彩图案可以使目标与自然环境更好的融合,从而降低被发现的概率。结论:证明本方案具有较好的迷彩伪装效果。
【关键词】图像分类;轮廓生成;迷彩伪装
【中图分类号】TP391              【文献标识码】A          【文章编号】1009-5624(2019)12-0074-02
74