Python 数据分析与应⽤--Matplotlib 数据可视化基础之学习笔记
#Matplotlib绘图基础
#1.创建画布与⼦图
#2.添加画布内容
#3.保存与显⽰图形
import numpy as np
import matplotlib.pyplot as plt
#pyplot基础绘图语法
data = np.arange(0,1.1,0.01)
plt.title(‘lines’) ## 添加标题
plt.xlabel(‘x’)## 添加x轴的名称
plt.ylabel(‘y’)## 添加y轴的名称
plt.xlim((0,1))## 确定x轴范围
plt.ylim((0,1))## 确定y轴范围
plt.plot(data,data2)## 添加y=x^2曲线
plt.plot(data,data4)## 添加y=x^4曲线
plt.legend([‘y=x 4’])
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\pyplot的基础绘图语法.png’)
plt.show()
包含⼦图绘制的基础语法
rad = np.arange(0,np.pi*2,0.01)
##第⼀幅⼦图
p1 = plt.figure(figsize=(8,6),dpi=80)## 确定画布⼤⼩
ax1 = p1.add_subplot(2,1,1)## 创建⼀个两⾏1列的⼦图,并开始绘制第⼀幅
plt.title(‘lines’)## 添加标题
plt.xlabel(‘x’)## 添加x轴的名称
plt.ylabel(‘y’)## 添加y轴的名称
plt.xlim((0,1))## 确定x轴范围
plt.ylim((0,1))## 确定y轴范围
plt.plot(rad,rad2)## 添加y=x^2曲线
plt.plot(rad,rad4)## 添加y=x^4曲线
plt.legend([‘y=x 4’])
##第⼆幅⼦图
ax2 = p1.add_subplot(2,1,2)## 创开始绘制第2幅
plt.title(‘sin/cos’) ## 添加标题
plt.xlabel(‘rad’)## 添加x轴的名称
plt.ylabel(‘value’)## 添加y轴的名称
plt.xlim((0,np.pi 2))## 确定x轴范围
plt.ylim((-1,1))## 确定y轴范围
plt.plot(rad,np.sin(rad))## 添加sin曲线
plt.plot(s(rad))## 添加cos曲线
plt.legend([‘sin’,‘cos’])
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\包含⼦图绘制的基础语法.png’)
plt.show()
2’,'y=x 2’,'y=x
#调整线条的rc参数
x = np.linspace(0, 4*np.pi)## ⽣成x轴数据
y = np.sin(x)## ⽣成y轴数据
plt.plot(x,y,label="")## 绘制sin曲线图
plt.title(‘sin’)
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\默认sin曲线.png’)
plt.show()
修改rc 参数后的图
plt.plot(x,y,label="")## 绘制三⾓函数
plt.title(‘sin’)
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\修改rc参数后sin曲线.png’)
plt.show()
#调节字体的rc参数
plt.plot(x,y,label="")## 绘制三⾓函数
plt.title(‘sin曲线’)
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\⽆法显⽰中⽂标题sin曲线.png’)
plt.show()
##设置rc参数显⽰中⽂标题
设置字体为SimHei 显⽰中⽂–pyplot 字体不⽀持中⽂字符的显⽰
matplotlib中subplot
plt.plot(x,y,label="")## 绘制三⾓函数
plt.title(‘sin曲线’)
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\显⽰中⽂标题sin曲线.png’)
plt.show()
分析特征间的关系,以散点图,折线图为研究对象
#散点图主要⽤于分析特征间的相关关系
#折线图⽤于分析⾃变量与因变量之间的趋势关系
import numpy as np
import matplotlib.pyplot as plt
data = np.load(‘D:\pycharm file\数据分析与科学可视化\国民经济核算季度数据.npz’,allow_pickle=True)
name = data[‘columns’] ## 提取其中的columns数组,视为数据的标签
values = data[‘values’]## 提取其中的values数组,数据的存在位置
plt.figure(figsize=(8,7))## 设置画布
plt.scatter(values[:,0],values[:,2], marker=‘o’)## 绘制散点图—scatter函数,marker接收特定的string,表⽰绘制的点的类型plt.xlabel(‘年份’)## 添加横轴标签
plt.ylabel(‘⽣产总值(亿元)’)## 添加y轴名称
#在matplotlib中ticks表⽰的是刻度,⽽刻度有两层意思,⼀个是刻标(locs),⼀个是刻度标签(tick labels)。在作图时,x轴y轴都是连续的,
#所以刻标可以随意指定,就是在连续变量上寻位置,⽽刻度标签则可以对应替换
‘’’
xticks()返回了两个对象,⼀个是刻标(locs),另⼀个是刻度标签
locs, labels = xticks()
sin (x )sin (x )sin (x )sin (x )
显⽰x轴的刻标
xticks( arange(6) )
显⽰x轴的刻标以及对应的标签
xticks( arange(5), (‘Tom’, ‘Dick’, ‘Harry’, ‘Sally’, ‘Sue’) )
‘’’
Rotation⽤来指定字符串的旋转⾓度
plt.title(‘2000-2017年季度⽣产总值散点图’)## 添加图表标题
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\2000-2017年各季度国民⽣产总值散点图.png’) plt.show()
#绘制2000-2017年各产业各季度国民⽣产总值的散点图
plt.figure(figsize=(8,7))## 设置画布
绘制散点1
plt.scatter(values[:,0],values[:,3], marker=‘o’,c=‘red’)
绘制散点2
plt.scatter(values[:,0],values[:,4], marker=‘D’,c=‘blue’)
绘制散点3
plt.scatter(values[:,0],values[:,5], marker=‘v’,c=‘yellow’)
plt.xlabel(‘年份’)## 添加横轴标签
plt.ylabel(‘⽣产总值(亿元)’)## 添加纵轴标签
plt.title(‘2000-2017年各产业季度⽣产总值散点图’)## 添加图表标题
plt.legend([‘第⼀产业’,‘第⼆产业’,‘第三产业’])## 添加图例
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\2000-2017年各产业季度国民⽣产总值散点图.png’)
plt.show()
折线图的主要功能是查看因变量y随着⾃变量x改变的趋势,最适合⽤于显⽰随时间(根据常⽤⽐例设置)变化的连续数据,同时还可以看出数量的差异,增长趋势的变化
plt.figure(figsize=(8,7))## 设置画布
绘制折线图
plt.plot(values[:,0],values[:,2],color = ‘r’,linestyle = ‘–’)
plt.xlabel(‘年份’)## 添加横轴标签
plt.ylabel(‘⽣产总值(亿元)’)## 添加y轴名称
plt.title(‘2000-2017年季度⽣产总值折线图’)## 添加图表标题
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\2000-2017年各季度⽣产总值折线图.png’)
plt.show()
plt.figure(figsize=(8,7))## 设置画布
plt.plot(values[:,0],values[:,2],color = ‘r’,linestyle = ‘–’, #linestyle指定线条类型,marker表⽰绘制的点的类型
marker = ‘o’)## 绘制折线图
plt.xlabel(‘年份’)## 添加横轴标签
plt.ylabel(‘⽣产总值(亿元)’)## 添加y轴名称
plt.title(‘2000-2017年季度⽣产总值点线图’)## 添加图表标题
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\2000-2017年季度⽣产总值点线图.png’)
plt.show()
#plot函数可以⼀次接收多组数据,添加多条折线图
plt.figure(figsize=(8,7))## 设置画布
plt.plot(values[:,0],values[:,3],‘bs-’,
values[:,0],values[:,4],‘ro-.’,
values[:,0],values[:,5],‘gH–’)## 绘制折线图
plt.xlabel(‘年份’)## 添加横轴标签
plt.ylabel(‘⽣产总值(亿元)’)## 添加y轴名称
plt.title(‘2000-2017年各产业季度⽣产总值折线图’)## 添加图表标题
plt.legend([‘第⼀产业’,‘第⼆产业’,‘第三产业’])
plt.savefig(‘D:\pycharm file\数据分析与科学可视化\Matplotlib图⽚\2000-2017年各季度产业⽣产总值折线图.png’) plt.show()
>####
#实践分析2000~2017各产业与⾏业的国民⽣产总值 >####
>>
#绘制2000~2017各产业与⾏业的国民⽣产总值散点图
import numpy as np
import matplotlib.pyplot as plt
data = np.load(‘D:\pycharm file\数据分析与科学可视化\国民经济核算季度数据.npz’,allow_pickle=True)
name = data[‘columns’]## 提取其中的columns数组,视为数据的标签
values = data[‘values’]## 提取其中的values数组,数据的存在位置
p = plt.figure(figsize=(12,12)) ##设置画布
⼦图1

发表评论