南开大学2021年9月《网络爬虫与信息提取》作业考核试题及答案参考
1. 在使用多线程处理问题时,线程池设置越大越好。(  )
A.正确
B.错误
参考答案:B
2. 是一种规范,在法律范畴内。(  )
<是一种规范,在法律范畴内。(  )
A.正确
B.错误
参考答案:B
3. 要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样。(  )
要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样。(  )
A.正确
B.错误
参考答案:A
4. 参数headers=(  ),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。
A.HEADER
B.HEADERS
C.HEAD
D.BODY
参考答案:B
5. UI Automator Viewer与Python uiautomator可以同时使用。(  )
A.正确
B.错误
参考答案:B
6. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。(  )
在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。(  )
A.正确
B.错误
参考答案:B
7. Redis中往集合中读数据,使用关键字(  )
A.pop
B.spop
C.lpop
D.range
参考答案:B
8. BS4可以用来从(  )中提取数据
python正则表达式爬虫A.HTML
B.XML
C.数据库
D.JSON
参考答案:AB
9. mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本。(  )
A.正确
B.错误
参考答案:A
10. Redis若要进入交互环境,需要打开终端输入(  )。
参考答案:A
11. scrapy与selenium结合可以实现直接处理需要异步加载的页面。(  )
T.对
F.错
参考答案:T
12. 要使用tesseract来进行图像识别,需要安装两个第三方库(  )
要使用tesseract来进行图像识别,需要安装两个第三方库(  )
B.beautifulsoup
C.Pillow
D.pytesseract
参考答案:CD
13. 使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令(  )
A.scroll
B.scroll_up
C.scroll_forword
D.scroll_back
参考答案:A
14. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数
据。(  )
Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。(  )
A.正确
B.错误
参考答案:A
15. Python可以将列表或字典转换成Json字符串。(  )
T.对
F.错
参考答案:T
16. Cookies一般包含在请求头Headers中。(  )
T.对
F.错
参考答案:T
17. 要使用Python来操作UI Automator从而控制手机,需要安装一个第三方库(  )
A.uiautomator
B.automator
C.ui_automator
D.pyautomator
参考答案:A
18. 数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。(  )
数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击。(  )
A.正确
B.错误
参考答案:A
19. HTTP常用状态码表明服务器上没有请求的资源的是(  )
A.500
B.503
C.403
D.404
参考答案:D
20. Redis中的值可以支持(  )。
A.列表
B.哈希
C.集合
D.有序集合
参考答案:ABCD
21. Redis的列表是一个单向队列。(  )
T.对
F.错
参考答案:F
22. Python中退出循环应用关键字(  )。
A.break
参考答案:A
23. 以下哪些方法属于Python写CSV文件的方法?(  )
A.writeheaders
B.writeheader
C.writerrows
D.writerow
参考答案:ACD
24. 请问按哪个键可以打开Chrome自带的开发者工具(  ) 请问按哪个键可以打开Chrome自带的开发者工具(  )
A.F10
B.F1
C.F11
D.F12
参考答案:D