RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

题目

RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

可以用()、数据关系和基本操作集定义一个完整的抽象数据类型。

A.数据元素
B.数据对象
C.原子类型
D.存储结构

答案:B
解析:
抽象数据类型可用(数据对象,数据关系,基本操作集)三元组来表示。

第2题:

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性


正确答案:正确

第3题:

下面描述不正确的是

A.数据元素是数据的基本单位

B.数据元素可由一个或多个数据项组成,数据项是有独立含义的数据最小单位

C.数据的逻辑结构是数据间关系的描述,它抽象地反映数据元素间的存储关系

D.数据的存储结构是逻辑结构在计算机存储器中的实现


正确答案:C
解析:数据的逻辑结构是数据间关系的描述,它抽象地反映数据元素间的逻辑关系。

第4题:

spark中的弹性分布式数据集相当于java中的()概念

  • A、类
  • B、接口
  • C、方法
  • D、内部类

正确答案:A

第5题:

spark中的rdd是一个()数据集

  • A、弹性分布式
  • B、弹性计算
  • C、运送数据
  • D、心跳

正确答案:A

第6题:

下列与数据元素有关的叙述中,哪一个是不正确的?( )

A.数据元素是数据的基本单位,即数据集合中的个体
B.数据元素是由独立含义的数据最小单位
C.数据元素又称为节点
D.数据元素又称为记录

答案:B
解析:
数据元素是数据的基本单位,即数据集合中的个体。有些情况下也把数据元素称为节点、记录、表目等。一个数据元素可由一个或多个数据项组成,数据项是由独立含义的数据最小单位。

第7题:

spark中弹性分布式数据集指的是哪个()

  • A、RDD
  • B、Driver
  • C、Master
  • D、Map

正确答案:A

第8题:

数据库是长期存储在计算机内、有组织的、可共享的( )。

A.文件集

B.数据集合

C.命令集合

D.程序集合


正确答案:B
B[解析]数据库是长期存储在计算机内、有组织的、可共享的数据集合。

第9题:

spark中以下哪些特性是rdd的特性()

  • A、计算移动
  • B、数据不移动
  • C、数据移动
  • D、计算不移动

正确答案:A,C,D

第10题:

创建rdd可以有如下几种?()

  • A、由外部存储系统的数据集创建,包括本地的文件系统
  • B、由一个已经存在的Scala集合创建
  • C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、Hbase
  • D、以上说法都不对

正确答案:A,B,C

更多相关问题