题目内容
(请给出正确答案)
[单选题]
MapReduce通常把输入文件按照()MB来划分
A.16
B.32
C.64
D.128
答案
查看答案
A.16
B.32
C.64
D.128
第1题
A.链接多个MapReduce作业时,序列文件是首选格式
B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义
C.想完全禁止输出,可以使用NullOutputFormat
D.每个reduce需将它的输出写入自己的文件中,输出无需分片
第2题
A.输入的文件尽量使用大文件
B.合理的分配map和reduce的任务的数量
C.压缩中间数据,减少1/0
D.在map之后先进行bine处理,减少1/0
第3题
A.将这个字典与源代码一起进行打包,直接执行即可
B.每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问
C.将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包
D.将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现