题目内容 (请给出正确答案)
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,将Job中间输出结果可以保存在()中,从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。
[填空]

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,将Job中间输出结果可以保存在()中,从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。

查看答案
更多“Apache Spark是专为大规模数据处理而设…”相关的问题
第1题
下列关于spark中的RDD描述正确的有()。

A、RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;

B、Resilient:表示弹性的;

C、Destributed:分布式,可以并行在集群计算;

D、Dataset:就是一个集合,用于存放数据的;

点击查看答案
第2题
大数据平台的计算组件主要有哪几个()。

A、Storm

B、Spark

C、Mapreduce

D、Sqoop

点击查看答案
第3题
Spark容错性的方式有哪些()。

A、数据检查点;

B、存储原始数据;

C、记录数据的更新;

D、自建数据版本;

点击查看答案
第4题
Hadoop的Mapreduce与spark都可以进行数据计算,而相比于Mapreduce,spark的速度更快并且提供的功能更加丰富。()

正确

错误

点击查看答案
第5题
在Spark中,弹性分布式数据集的特点包括()。

A、可分区

B、可序列化

C、可直接修改

D、可持久化

点击查看答案
第6题
基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有()。

A、MR

B、Spark

C、HDFS

D、Hbase

点击查看答案
第7题
Spark基于内存计算,本身可以直接读写hadoop上任何格式数据,其应用程序在集群上以独立的进程集合的形式运行。()

正确

错误

点击查看答案
第8题
游戏直播平台A使用了华为的全闪存存储来保障其业务,存储系统采用专为闪存设计的FlashLink技术。对于其中的ROW满分条大块顺序写,下列哪些说法是正确的是()。

A、大数据块被顺序写入SSD

B、1段大块顺序写充分利用SAS带宽减少垃圾回收

C、多个高散的数据块在控制器内存中被聚合成一个连续的大数据块

D、控制器感知SSD内数据布局

点击查看答案
第9题
避免大规模使用,比如参数、配置信息进缓存,基础信息热点数据进缓存()

点击查看答案
第10题
65.5G的性能目标是高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接()

点击查看答案
第11题
37.5G的性能目标是高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接()

点击查看答案
发送账号至手机
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改
搜题
如果结果不匹配,请 联系老师 获取答案
搜索
如果结果不匹配,请 联系老师 获取答案