南开大学2021年9月《网络爬虫与信息提取》作业考核试题及答案参考
1. 如果通过爬虫抓取某的公开数据,分析以后发现这个公司业绩非常好。于是将数据或者分析结果出售给某基金公司,从而获得销售收入。这是合法的。(  )
A.正确
B.错误
参考答案:A
2. Python中(  )与元组由类似的数据读取方式。
A.字符串
B.列表
C.字典
D.集合
参考答案:AB
3. Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为(  )
A.空
B.空列表
C.空元组
D.不返回
参考答案:B
4. 下面Python代码输出为(  ): def default_para_without_trap(para=[], value=0): if not para:
下面Python代码输出为(  ): def default_para_without_trap(para=[], value=0): if not para: para = [] para.append(value) return para print('第一步:{}'.format(default_para_trap(value=100))) print('第二
步:{}'.format(default_para_trap(value=50)))
A.第一步:[100] 第二步:[100,50]
B.第一步:[100] 第二步:[50]
C.第一步:[100] 第二步:[]
D.第一步:[100] 第二步:[100]
参考答案:B
5. Redis若要进入交互环境,需要打开终端输入(  )
Redis若要进入交互环境,需要打开终端输入(  )
参考答案:A
6. RoboMongo是MongoDB的管理软件。(  )
T.对
F.错
参考答案:T
7. device.sleep(  )方法是使用UI Automatorr关闭屏幕的命令。(  )
A.正确
B.错误
参考答案:A
8. 所有的异步加载都会向后台发送请求。(  )
T.对
F.错
参考答案:F
9. cookies在http请求中是明文传输的。(  )
T.对
F.错
参考答案:T
10. requests中post请求方法的第二个参数可以为(  )
requests中post请求方法的第二个参数可以为(  )
A.字典
B.列表
C.json数据
D.字符串
参考答案:AC
11. Robo 3T与RoboMongo是完全不一样的软件。(  )
Robo 3T与RoboMongo是完全不一样的软件。(  )
A.正确
B.错误
参考答案:B
12. 使用异步加载技术的网站,被加载的内容可以在源代码中到。(  )
T.对
F.错
参考答案:F
13. PyMongo中逻辑查询表示不等于的符号是(  )
PyMongo中逻辑查询表示不等于的符号是(  )
A.$gt
B.$lt
C.$eq
D.$ne
参考答案:C
14. Charles和Chrome开发者工具相比,只是多了一个搜索功能。(  )
T.对
F.错
参考答案:F
15. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。(  )
在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。(  )
A.正确
B.错误
参考答案:B
16. Charles能截获HTTP和HTTPS的数据包,如果网站使用websocket就可以截获。(  )
A.正确
B.错误
参考答案:B
17. 当需要把Python里面的数据发送给网页时,应先将其转换成(  )
当需要把Python里面的数据发送给网页时,应先将其转换成(  )
A.Json字符串
B.GET
C.POST
D.Request
参考答案:A
18. 使用Charles,可以轻松截获手机App和小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。(  )
使用Charles,可以轻松截获手机App和小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。(  )
A.正确
B.错误
参考答案:A
19. 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个(  )。
A.列表
B.元组
C.字典
D.集合
参考答案:C
20. 用Xpathh获取第二个div标签应该是(  )
用Xpathh获取第二个div标签应该是(  )
A.dvi(1)
B.div(2)
C.div[1]
D.div[2]
参考答案:D
21. 以下哪个命令是利用URL语法在命令行下工作的文件传输工具(  )
以下哪个命令是利用URL语法在命令行下工作的文件传输工具(  )
A.curl
B.tar -zxvf
C.mkdir
D.cp
参考答案:A
22. Python操作CSV文件可通过(  )容器的方式操作单元格。
A.列表
B.元组
python正则表达式爬虫
C.字典
D.集合
参考答案:C
23. MongoDB 是一个基于分布式文件存储的数据库,速度远快过Redis。(  )
A.对
B.错
参考答案:B
24. 以下哪个命令是linux下解压缩命令?(  )
A.curl
B.tar-zxvf