下列关于MapReduce说法不正确的是()。
A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用
第1题
A.SparkSQL依赖Hive的元数据
B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduce
C.SparkSQL不可以使用Hive的自定义函数
D.SparkSQL兼容绝大部分Hive的语法和函数
第2题
A.如果一个机架出问题,不会影响数据读写和正确性
B.写入数据的时候多个副本会写到不同机架的DataNode中
C.MapReduce会根据机架的拓扑获取离自己比较近的数据块
D.数据块的第一个副本会优先考虑存储在客户端所在节点
第3题
A.YARN以流式数据访问模式来存储超大文件,可以实现一次写入、多次读写
B.Pig支持随机读和几十毫秒级别的查询
C.HBase的主要功能是离线计算
D.MapReduce功能实现了将单个任务打碎,并将碎片任务(Map)发送到多个节点上,之后再将分别计算的结果进行聚合、汇总
第5题
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
第6题
A.Pig的主要目的是弥补MapReduce编程的复杂性
B.Pig的核心是一种数据分析语言
C.Pig程序的结构适合于串行处理
D.Pig主要包含PigLatin和Pig执行环境两部分
第7题
A.分为Map和Reduce两个阶段
B.Map阶段由一系列Map任务组成
C.Reduce阶段由一系列Reduce任务组成
D.Map阶段与Reduce阶段没有任何依赖关系
第8题
A.Partitioner负责控制map输出结果key的分割
B.Reporter用于MapReduce应用程序报告进度
C.OutputCollector收集Mapper或Reducer输出数据
D.Reduce的数目不可以是0
第9题
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
第10题
A.云计算的主要特点是非常昂贵。
B.大数据是多源、异构、动态的复杂数据,即具有4V特征的数据
C.大数据是数据科学的研究对象之一
D.MapReduce是采用云计算这种新的计算模式研发出的具体工具软件(或算法)