问题:etl处理完成的数据可以存在以下哪些组件中()A、hdfsB、hiveC、hbaseD、mapreduce
查看答案
问题:在scala中所有类型的基类是()A、ObjectB、AnyRefC、AnyValD、Any
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter
问题:只有主构造函数才可以写参数
问题:数组的下标从1开始
问题:zookeeper数据模型是带有默认权限的
问题:spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑
问题:以下哪些不是rdd的特性()A、心跳机制B、task的分发C、task的回收D、task执行情况的监测
问题:下面有关方法与函数的定义差别错误的是?()A、方法是以def开头,函数的标志为=>B、Scala方法是类的一部分,而函数是一个对象可以赋值给一个变量C、Scala中使用val语句可以定义函数,def语句定义方法D、方法与函数可以互相转化,没有本质的区别。
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置
问题:maven项目打包的方式有哪几种()A、jar包B、war包C、pom包D、xml包
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL
问题:spark中的图计算框架是()A、spark coreB、spark streamingC、mlbaseD、Grophx
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD
问题:checkpoint算子是action类算子,不会延迟加载
问题:元组和Map集合没有区别
问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)
问题:关于spark中cache算子与persist算子关系叙述正确的是()A、_useDiskB、_useMemoryC、_useOffHeapD、_useDes
问题:以下属于flume的组件的是:()A、sourceB、ChannelC、GridFSD、Sink