题目内容（请给出正确答案）

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，将Job中间输出结果可以保存在（）中，从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。

[填空]

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，将Job中间输出结果可以保存在（）中，从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。

查看答案

更多“Apache Spark是专为大规模数据处理而设…”相关的问题

第1题

下列关于spark中的RDD描述正确的有（）。

A、RDD（ResilientDistributedDataset）叫做弹性分布式数据集，是spark中最基本的数据抽象；

B、Resilient：表示弹性的；

C、Destributed：分布式，可以并行在集群计算；

D、Dataset：就是一个集合，用于存放数据的；

点击查看答案

第2题

大数据平台的计算组件主要有哪几个（）。

A、Storm

B、Spark

C、Mapreduce

D、Sqoop

点击查看答案

第3题

Spark容错性的方式有哪些（）。

A、数据检查点；

B、存储原始数据；

C、记录数据的更新；

D、自建数据版本；

点击查看答案

第4题

Hadoop的Mapreduce与spark都可以进行数据计算，而相比于Mapreduce，spark的速度更快并且提供的功能更加丰富。（）

正确

错误

点击查看答案

第5题

在Spark中，弹性分布式数据集的特点包括（）。

A、可分区

B、可序列化

C、可直接修改

D、可持久化

点击查看答案

第6题

基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力，如下属于分布式存储组件的有（）。

A、MR

B、Spark

C、HDFS

D、Hbase

点击查看答案

第7题

Spark基于内存计算，本身可以直接读写hadoop上任何格式数据，其应用程序在集群上以独立的进程集合的形式运行。（）

正确

错误

点击查看答案

第8题

游戏直播平台A使用了华为的全闪存存储来保障其业务,存储系统采用专为闪存设计的FlashLink技术。对于其中的ROW满分条大块顺序写,下列哪些说法是正确的是()。

A、大数据块被顺序写入SSD

B、1段大块顺序写充分利用SAS带宽减少垃圾回收

C、多个高散的数据块在控制器内存中被聚合成一个连续的大数据块

D、控制器感知SSD内数据布局

点击查看答案

第9题

避免大规模使用，比如参数、配置信息进缓存，基础信息热点数据进缓存（）

是

否

点击查看答案

第10题

65.5G的性能目标是高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接（）

是

否

点击查看答案

第11题

37.5G的性能目标是高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接（）

是

否

点击查看答案

搜题

如果结果不匹配，请联系老师获取答案