题目内容（请给出正确答案）

[填空]

Map Reduce中，被分派到map任务的Worker程序读取相关的输入分片，从输入分片中解析出（key，value）然后把（key，value）传递给用户自定义的（）。

查看答案

更多“Map Reduce中，被分派到map任务的Wo…”相关的问题

第1题

Map Reduce中运行程序副本程序的机器为（）。

A、Map服务器

B、Master服务器

C、Worker服务器

D、Reduce服务器

点击查看答案

第2题

Map Reduce中，当Reduce Worker接收到Master发来的数据存储位置信息后，通过远程调用从Map Worker所在主机的磁盘上读取（）输出的中间结果。

点击查看答案

第3题

关于Hadoop Map Reduce，以下描述中正确的是（）。

A、reduce（）函数的输入是value集

B、reduce（）函数将最终结果写到HDFS系统中

C、用户可以自己定义reduce（）函数

D、reduce（）函数的输入数据是经过map（）函数处理之后的数据

点击查看答案

第4题

下面关于reduce函数功能描述正确的是（）。

A、合并value值，形成较小集合

B、采用迭代器将中间值提供给reduce函数

C、map（）函数处理后结果才会传输给reduce（）

D、内存中不会存储大量的value值

点击查看答案

第5题

Shuffle横跨Map端和Reduce端，在Map端包括Spill过程，在Reduce端包括copy和sort过程。（）

正确

错误

点击查看答案

第6题

Spark组件包含哪两个算子（）。

A、Map；

B、Action；

C、Transformation；

D、Reduce；

点击查看答案

第7题

MapReduce计算框架的计算过程分为两个阶段—Map阶段和Reduce阶段，并分别以两个函数map（）和reduce（）进行抽象。（）

正确

错误

点击查看答案

第8题

相对于Hadoop Map Reduce，Spark有什么好处（）。

A、通用性；

B、易用性；

C、速度快；

D、容错性；

点击查看答案

第9题

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，将Job中间输出结果可以保存在（）中，从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。

点击查看答案

第10题

biner（）函数：为了降低map（）函数与reduce（）函数之间的数据传递量，一般采用biner（）函数对map（）函数的输出结果进行合并处理。（）

正确

错误

点击查看答案

第11题

MapReduce对map（）函数的返回值处理后才传给reduce（）函数，其中涉及哪些操作（）。

A、合并

B、排序

C、分区

D、抽样

点击查看答案

搜题

如果结果不匹配，请联系老师获取答案