南开大学2021年9月《网络爬虫与信息提取》作业考核试题及答案参考
1. 以下哪些可以独立成为Python编译器(  )
以下哪些可以独立成为Python编译器(  )
A.Pycharm
B.IDLE
C.Eclipse
D.Visual Studio 2010
参考答案:AB
2. 一个可行的自动更换代理的爬虫系统,应该下列哪些功能?(  )
A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中
B.在发现某个请求已经被设置过代理后,什么也不做,直接返回
C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用
D.周期性验证数据库中的无效代理,及时将其删除
参考答案:ACD
3. Scrapy的工程名字不能使用scrapy,否则爬虫会无法运行。除此以外工程名不受限制。(  )
T.对
F.错
参考答案:F
4. UI Automator Viewer与Python uiautomator可以同时使用。(  )
A.正确
B.错误
参考答案:B
5. 某些网站在发起Ajax请求时会携带(  )字符串用于身份验证
某些网站在发起Ajax请求时会携带(  )字符串用于身份验证
A.Token
B.Cookie
C.ReqTime
D.sum
参考答案:A
6. 以下哪个命令是利用URL语法在命令行下工作的文件传输工具(  )
以下哪个命令是利用URL语法在命令行下工作的文件传输工具(  )
A.curl
B.tar -zxvf
C.mkdir
D.cp
参考答案:A
7. 通用网络爬虫通常采用串行工作方式。(  )
A.正确
B.错误
参考答案:B
8. Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。(  )
A.正确
B.错误
参考答案:A
9. 下列哪项不是HTTP的请求类型(  )
下列哪项不是HTTP的请求类型(  )
A.GET
B.POST
C.PUT
D.SET
参考答案:D
10. 爬虫的源代码通过公开不会对被爬虫网站造成影响。(  )
A.正确
B.错误
参考答案:B
11. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。(  )
T.对
F.错
参考答案:T
12. Redis的集合与Python的集合一样,没有顺序,值不重复。(  )
Redis的集合与Python的集合一样,没有顺序,值不重复。(  )
A.正确
B.错误
参考答案:A
13. 参数headers=(  ),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。
A.HEADER
B.HEADERS
C.HEAD
D.BODY
参考答案:B
14. 在Scrapy的目录下,哪个文件负责存放爬虫文件?(  )
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
参考答案:A
15. 当需要把Python里面的数据发送给网页时,应先将其转换成(  )
当需要把Python里面的数据发送给网页时,应先将其转换成(  )
A.Json字符串
B.GET
C.POST
D.Request
参考答案:A
16. Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为(  )
A.空
B.空列表
C.空元组
D.不返回
参考答案:B
17. 通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配。(  )
A.正确
B.错误
参考答案:B
18. MongoDB中可以将(  )数据结构插入集合中
A.列表
B.元组
C.字典
D.集合
参考答案:C
19. MongoDB在频繁读写方面优于Redis。(  )
MongoDB在频繁读写方面优于Redis。(  )
A.正确
B.错误
参考答案:B
20. 下面代码一共执行循环多少次(  ): for i in range(10): print(i ** i)python正则表达式判断
A.9
B.10
C.11
D.0
参考答案:B
21. 当爬虫创建好了之后,可以使用"scrapy(  )"命令运行爬虫。
A.startup
B.starwar
C.drawl
参考答案:D
22. 通常使用(  )工具来模拟浏览器进行爬虫请求
A.Selenium
B.Chrome
C.ChromeDriver
D.WebDriver
参考答案:A
23. mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本。(  )
A.正确
B.错误
参考答案:A
24. PyMongo删除操作有(  )
PyMongo删除操作有(  )
A.delete
B.delete_all
C.delete_one