题目内容（请给出正确答案）

Map Reduce中，不需要将这R个输出文件合并成一个文件，主要原因在于在实际应用中这些文件往往作为（）或者在处理多个分制文件的分布式应用中继续使用。

[填空]

Map Reduce中，不需要将这R个输出文件合并成一个文件，主要原因在于在实际应用中这些文件往往作为（）或者在处理多个分制文件的分布式应用中继续使用。

查看答案

更多“Map Reduce中，不需要将这R个输出文件合…”相关的问题

第1题

Map Reduce中运行程序副本程序的机器为（）。

A、Map服务器

B、Master服务器

C、Worker服务器

D、Reduce服务器

点击查看答案

第2题

Map Reduce中，当Reduce Worker接收到Master发来的数据存储位置信息后，通过远程调用从Map Worker所在主机的磁盘上读取（）输出的中间结果。

点击查看答案

第3题

关于Hadoop Map Reduce，以下描述中正确的是（）。

A、reduce（）函数的输入是value集

B、reduce（）函数将最终结果写到HDFS系统中

C、用户可以自己定义reduce（）函数

D、reduce（）函数的输入数据是经过map（）函数处理之后的数据

点击查看答案

第4题

Map Reduce中，被分派到map任务的Worker程序读取相关的输入分片，从输入分片中解析出（key，value）然后把（key，value）传递给用户自定义的（）。

点击查看答案

第5题

下面关于reduce函数功能描述正确的是（）。

A、合并value值，形成较小集合

B、采用迭代器将中间值提供给reduce函数

C、map（）函数处理后结果才会传输给reduce（）

D、内存中不会存储大量的value值

点击查看答案

第6题

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，将Job中间输出结果可以保存在（）中，从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。

点击查看答案

第7题

Shuffle横跨Map端和Reduce端，在Map端包括Spill过程，在Reduce端包括copy和sort过程。（）

正确

错误

点击查看答案

第8题

Spark组件包含哪两个算子（）。

A、Map；

B、Action；

C、Transformation；

D、Reduce；

点击查看答案

第9题

MapReduce计算框架的计算过程分为两个阶段—Map阶段和Reduce阶段，并分别以两个函数map（）和reduce（）进行抽象。（）

正确

错误

点击查看答案

第10题

相对于Hadoop Map Reduce，Spark有什么好处（）。

A、通用性；

B、易用性；

C、速度快；

D、容错性；

点击查看答案

第11题

biner（）函数：为了降低map（）函数与reduce（）函数之间的数据传递量，一般采用biner（）函数对map（）函数的输出结果进行合并处理。（）

正确

错误

点击查看答案

搜题

如果结果不匹配，请联系老师获取答案