在Spark中,假设Lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是X:Lines.filter().groupByKey()Y:Lines.groupByKey().filter()
A.X比Y的性能更高
B.X比Y的性能更低
C.X比Y的性能一样
D.无法确定X和Y的性能差异
X比Y的性能更高
A.X比Y的性能更高
B.X比Y的性能更低
C.X比Y的性能一样
D.无法确定X和Y的性能差异
X比Y的性能更高
第2题
A.dgvData.DataSource=ds;dgvData.DataMember=ds.Tables["table1"];
B.dgvData.DataMember=ds;
C.dgvData.DataSource=newDataView(ds.Tables["table1"]);
D.dgvData.DataSource=ds.Tables["table1"];dgvData.DataMember=ds;
第3题
A.ALI 是 ARDS 在正式学术文献中的新提法
B.ALI 是 ARDS 的严重阶段
C.ARDS 是 ALI 的严重阶段
D.AR DS 的概念中已经包括了ALI
E.两者是一个概念
第5题
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
第6题
A.RDD是一个只读的,课分区的分布式数据集
B.RDD是Spark对基础数据的抽象
C.RDD具有血统机制(Lineage)
D.RDD默认存储在磁盘
第7题
A、 0.952
B、 0.867
C、 0.98
D、 0.794
第10题
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生