Python爬⾍---爬取⽹络上的图⽚Python爬⾍---爬取⽹络上的图⽚
什么是爬⾍这个在这⾥就不多说了(毕竟有度娘),那么如何爬取⽹络上的图⽚呢?
1、打开⽹站后点右键--》查看⽹页源代码
然后是不是发现了⼀些规律呢如下⾯的图⽚格式⼤都是.jpg  alt 是图⽚的描述对吧。
2、发现完这个规律那么我们就可以开始写代码啦 (⽤正则表达式来表⽰这个规律然后把⽹页是地址传进去就ok啦)
quest
import re
图片下载站源码
import urllib
#根据给定的⽹址来获取⽹页详细信息,得到的html就是⽹页的源代码
def getHtml(url):
page = quest.urlopen(url)
html = ad()
return html.decode('UTF-8')
def getImg(html):
reg = r'src="(.+?\.jpg)" alt'
imgre = repile(reg)
imglist = imgre.findall(html)#表⽰在整个⽹页中过滤出所有图⽚的地址,放在imglist中
x =0
path = 'D:\\neg'
# 将图⽚保存到D:\\test⽂件夹中,如果没有test⽂件夹则创建
for imgurl in imglist:
return imglist
html = getHtml("www.ivsky/search.php?q=%E6%B5%B7&PageNo=9")#获取该⽹址⽹页详细信息,得到的html就是⽹页的源代码print (getImg(html)) #从⽹页源代码中分析并下载保存图⽚
print("hello 123456")
这样就爬取到这个⽹站上的图⽚啦~~~~~~~