网络数据爬取与处理知到章节测试答案智慧树2023年最新上海商学院
第一章测试
1.以下描述错误的是( )。

参考答案:
Anaconda只提供了Jupyter notebook编程环境

2.以下描述错误的是( C)。
以下哪一项不属于数据科学的基本任务( )。

参考答案:
存储数据

3.以下关于数据科学的说法中,正确的是( )。

参考答案:
计算工具的革新,数据量的持续增长推动了数据科学的发展。

4.智能健康手环的运用了以下哪一项数据采集技术( )。

参考答案:
传感器

5.下列关于大数据特点的说法中,错误的是( ).

参考答案:
数据价值密度高。
第二章测试
6.下列选项哪不是爬虫程序的常见类型( )。

参考答案:
深层式网络爬虫

python正则表达式爬虫7.以下关于实现网络爬虫程序的描述中,错误的是( )。

参考答案:
通过爬虫程序获取的数据文件均为HTML文件

8.通过浏览器访问网站服务器的过程,描述错误的是( )。

参考答案:
TCP协议规范了超文本标记语言的语法格式

9.下列不属于常用反爬虫手段的是( )。

参考答案:
人工筛查

10.以下关于爬虫程序的描述中,正确的是( )。

参考答案:
爬虫程序执行时应避免对服务器造成过载
第三章测试
11.以下关于re库的描述中,错误的是( )。

参考答案:
re库是Python的第三方库

12.‎正则表达式中能够匹前面的字符或子表达式1次或多次的符号是( )。

参考答案:
+

13.‎以下不能够匹配任意数字字符的正则表达式的是( )。

参考答案:
{0123456789}

14.执行以下程序输出的结果是( D)。
import re
s='ABC123abc456'
a=re.findall('[A-Za-z]{2}',s)
print( )

参考答案:
null

15.执行以下程序输出的结果是( B)。
import re
s='Bob:12+Alex:23+Emily:33'
a=re.findall('\+*(.+?)\+',s)
print( )

参考答案:
null
第四章测试
16.HTML 是整个网页的结构,相当于整个网站的框架。带“<”、“>”符号的都是属于 HTML 的标签,并且标签都是成对出现的。下列说法中,错误的是( )。

参考答案:
<img>..</img>表示该标签是标题