第一章单元测试
python爬虫开发
1、单选题:
下列不属于常见爬虫类型的是()。
选项:
A:增量式网络爬虫
B:通用网络爬虫
C:浅层网络爬虫
D:聚焦网络爬虫
答案: 【浅层网络爬虫】
2、单选题:
下列不属于聚焦网络爬虫的常用策略的是()。
选项:
A:基于内容评价的爬取策略
B:基于深度优先的爬取策略
C:基于链接结构评价的爬取策略
D:基于语境图的爬取策略
答案: 【基于深度优先的爬取策略】
3、单选题:
下列不属于常用反爬手段的是()。
选项:
A:人工筛选
B:反爬频度
C:账号权限
D:验证码校验
答案: 【人工筛选】
4、单选题:
下列属于反爬虫目的的是()。
选项:
A:限制用户访问权限
B:限制访问人数
C:防止网站信息被竞争对手随意获取
D:变换网页结构
答案: 【防止网站信息被竞争对手随意获取】
5、单选题:
下列属关于Python爬虫库的功能描述不正确的是()。选项:
A:HTML/XML解析器pycurl`
B:通用爬虫库urllib3
C:爬虫框架Scrapy
D:通用爬虫库Requests
答案: 【HTML/XML解析器pycurl`】
6、判断题:
搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。()
选项:
A:错
B:对
答案: 【对】
7、判断题:
<文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着的是可以爬虫的网页。()
选项:
A:错
B:对
答案: 【错】
8、判断题:
爬虫是手动请求万维网网站且提取网页数据的程序。()
选项:
A:对
B:错
答案: 【错】
9、判断题:
每个网站都有文件。()
选项:
A:错
B:对
答案: 【错】
10、判断题:
爬虫爬取的是网站后台的数据。()
选项:
A:对
B:错
答案: 【错】
第二章单元测试
吉多设计Python的灵感来源于()。
选项:
A:Unix shell
B:C语言
C:ABC语言
D:Java语言
答案: 【ABC语言】
2、单选题:
下列关于Python语言的特点说法中,错误的是()。选项:
A:Python语言是非开源语言
B:ANSI C
C:Python语言是跨平台语言
D:Go
答案: 【Python语言是非开源语言】
3、单选题:
Python源代码文件的后缀名是()
选项:
A:pdf
B:doc
C:py
D:png
答案: 【py】
4、单选题:
列表list=[1,2,3,4,5],下列选项中为空的是()
选项:
A:list[1:]
B:ist[1:1]
C:list[1:-1]
D:list[:-2]
答案: 【ist[1:1]】
5、单选题:
Python语言中用来定义函数的关键字是()
选项:
A:class
B:def
C:return
D:function
答案: 【def】
在安装Python时,需要根据已有的系统来选择相应的安装程序。安装后,也需要配置环境变量。()
选项:
A:错
B:对
答案: 【对】
7、判断题:
elif语句可以单独使用。()
选项:
A:错
B:对
答案: 【错】
8、判断题:
元组的元素不能修改。()
选项:
A:对
B:错
答案: 【对】
9、多选题:
下列选项中,不能创建元组的语句是()。
选项:
A:tup=[1,2,3]
B:tup = (1,2,98)
C:tup=tuple([1,2,3])
D:tup=(2)
答案: 【tup=[1,2,3];
tup=(2)】
第三章单元测试
1、单选题:
如果站点服务器支持安全套接层(SSL),那么连接到安全站点上的所有URL开头是( )。
选项:
A:SHTTP
B:HTTP
C:SSL
D:HTTPS
答案: 【HTTPS】
2、单选题:
body元素用于背景颜的属性是( )。
选项:
A:background-color
B:alink
C:vlink
D:color
答案: 【background-color】
3、单选题:
为了标识一个HTML文件开始应该使用的HTML标记是( )。选项:
A:<html>
B:<a>
C:<body>
D:<table>
答案: 【<html>】
4、单选题:
在HTML中,单元格的标记是( )。
选项:
A:<span>
B:<tr>
C:<td>
D:<body>
答案: 【<td>】
5、单选题:
CSS 中的选择器不包括包括()
选项:
A:元素选择器
B:类选择器
C:ID选择器
D:超文本标记选择器
答案: 【超文本标记选择器】
6、单选题:
( )是网页与网页之间联系的纽带,也是网页的重要特。
选项:
A:导航条
B:框架
C:超链接