7313智慧树知到《大数据工具应用》章节测试答案答案5195

智慧树知到《大数据工具应用》章节测试答案,智慧树 知到 大数据工具应用的答案如下:
智慧树知到《大数据工具应用》章节测试答案
第一章

1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。

A:计算

B:访问

C:应用

D:分析

答案: 分析

2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。

A:Variety

B:Vainly

C:Vagary

D:Valley

答案: Variety

3、大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。

A:数据统计

B:数据计算

C:数据聚类

D:数据清洗

答案: 数据聚类

4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。

A:对

B:错

答案: 错

5、目前的大数据处理技术只能处理结构化数据。

A:对

B:错

答案: 错

第二章

1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )。

A:mdf

B:mdb

C:dbf

D:xls

答案: mdb

2、大多数日志文件的后缀名是( )。

A:txt

B:csv

C:xml

D:log

答案: log

3、本课程重点介绍的weka软件的专有文件格式是( )。

A:MongoDB

B:ARFF

C:value

D:key map

答案: ARFF

4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。

A:专业性

B:排他性

C:一致性

D:共享性

答案: 一致性

5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。

A:电话号码

B:关键词

C:网页地址

D:用户名

答案: 网页地址

6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。

A:otd

B:jpg

C:png

D:gif

答案: otd

7、Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。

A:对

B:错

答案: 对

8、Excel不能导入txt或csv格式的文件。

A:对

B:错

答案: 错

9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

A:对

B:错

答案: 错

10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。

A:对

B:错

答案: 对

第三章

1、使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成( )个簇。[1] [2] [3] [4] [5] [6]  下一页

答案解析