python-爬虫示例-技巧代码--688IT编程网

Python编写百度贴吧的简单爬虫

主要介绍了Python编写百度贴吧的简单爬虫，简单实现了下载对应页码的页面并存为以当前时间命名的html文件，这里分享给大家，抛砖引玉。

操作：输入带分页的地址，去掉最后面的数字，设置一下起始页数和终点页数

功能：下载对应页码的所有页面并储存为HTML文件，以当前时间命名

python新手代码示例代码：

# -*- coding: utf-8 -*-

#----------------------------

# 程序：百度贴吧的小爬虫

# 日期：2015/03/28

# 语言：Python 2.7

# 操作：输入带分页的地址，去掉最后面的数字，设置一下起始页数和终点页数

# 功能：下载对应页码的所有页面并储存为HTML文件，以当前时间命名

#----------------------------

import urllib2

import time

def baidu_tieba(url, start, end):

for i in range(start, end):

sName = time.strftime('%Y%m%d%H%M%S') + str(i) + '.html'

print '正在下载第' + str(i) + '个网页，并将其储存为' + sName + '...'

f = open(sName, 'w+')

m = urllib2.urlopen(url+str(i))

n = m.read()

f.write(n)

f.close()

print '成功下载'

baiduurl = str(raw_input('请输入贴子的地址，去掉pn后面的数字>>\n'))

begin_page = int(raw_input('请输入帖子的起始页码>>\n'))

end_page = int(raw_input('请输入帖子的终止页码>>\n'))

baidu_tieba(baiduurl, begin_page, end_page)

以上所述就是本文的全部内容了，希望能够对大家学习Python制作爬虫有所帮助。

发表评论

688IT编程网

python-爬虫示例-技巧代码

发表评论

推荐文章

维修电工高级(三级)PLC流程图

绘制ns流程图实现九九乘法表的方法

三类流程图基础

mysql begin end的用法

2.1计算机解决问题的过程课堂练习高中信息技术教科版必修1

热门文章

3程序控制逻辑

程序流程图编写规范_(终极整理版)

第章语言程序的流程控制_图文

小学生四则运算(java编程)201571030135

2022-2023学年新疆乌鲁木齐市某校高一(上)期中信息技术试卷+答案解析...

二级C++笔试-311_真题-无答案

软件工程第5章习题解答

汇付的流程图及解释英文版

软件工程应用题专项训练

python算法和流程图的教案

NCT-Python编程三级-模拟卷5(含答案优质程序填空阅读填空程序试题

高中数学必修三总结及经典例题解析(全)

Do Loop循环

覆盖率(白盒)测试(二)_真题(含答案与解析)-交互

第4章流程控制笔记

记录使用echarts的graph类型绘制流程图全过程(一)-x,y位置的计算

2《do...while循环》教学设计模板

(完整word版)WHILE循环语句的翻译程序设计(简单优先法、输出四元式...

高中数学必修三知识点总结

C语言课程设计-仪器仪表管理系统

最新文章

维修电工高级(三级)PLC流程图

绘制ns流程图实现九九乘法表的方法

mysql begin end的用法

流程图ns图pad图pdlhipo

编译原理实验报告一简单样本语言的词法分析器

传统流程图中判断转化为c语言的方法

标签列表

688IT编程网

python-爬虫示例-技巧代码

发表评论

推荐文章

维修电工高级(三级)PLC流程图

绘制ns流程图实现九九乘法表的方法

三类流程图基础

mysql begin end的用法

2.1计算机解决问题的过程课堂练习高中信息技术教科版必修1

热门文章

3程序控制逻辑

程序流程图编写规范_(终极整理版)

第章语言程序的流程控制_图文

小学生四则运算(java编程)201571030135

2022-2023学年新疆乌鲁木齐市某校高一(上)期中信息技术试卷+答案解析...

二级C++笔试-311_真题-无答案

软件工程第5章习题解答

汇付的流程图及解释英文版

软件工程应用题专项训练

python算法和流程图的教案

NCT-Python编程三级-模拟卷5(含答案优质程序填空阅读填空程序试题

高中数学必修三总结及经典例题解析(全)

Do Loop循环

覆盖率(白盒)测试(二)_真题(含答案与解析)-交互

第4章流程控制笔记

记录使用echarts的graph类型绘制流程图全过程(一)-x,y位置的计算

2《do...while循环》教学设计模板

(完整word版)WHILE循环语句的翻译程序设计(简单优先法、输出四元式...

高中数学必修三知识点总结

C语言课程设计-仪器仪表管理系统

最新文章

维修电工高级(三级)PLC流程图

绘制ns流程图实现九九乘法表的方法

mysql begin end的用法

流程图ns图pad图pdlhipo

编译原理实验报告一 简单样本语言的词法分析器

传统流程图中判断转化为c语言的方法

标签列表

编译原理实验报告一简单样本语言的词法分析器