问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)
查看答案
问题:spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL
问题:spark任务执行中的driver作用包括和worker建立相应连接
问题:只有主构造函数才可以写参数
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false
问题:spark本身能够读取到hdfs中的数据
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter
问题:以下选项属于spark的运行模式的是()A、本地(local模式)B、stanalone模式C、yarn模式D、mesos模式
问题:zookeeper数据模型是带有默认权限的
问题:类是对象的抽象,而对象是类的具体实例
问题:hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为maptask和reducetask,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
问题:kafka是中的partition是最小的存储单元
问题:在scala中,AnyRef是String类的父类
问题:spark中的图计算框架是()A、spark coreB、spark streamingC、mlbaseD、Grophx
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置
问题:zookeeper节点的特性()A、可以存储数据B、不可以存储数据C、可以计算数据D、可以协调数据
问题:yarn组件中的resourceManager的作用是()A、存储数据B、为nodemanager的管理进行调度C、数据接口D、以上都不是
问题:DataFrame更像传统数据库的二维表格,除了数据以外,还记录数据的结构信息,即()A、schemaB、表结构C、RowD、DataSet