RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
第1题:
第2题:
Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性
第3题:
下面描述不正确的是
A.数据元素是数据的基本单位
B.数据元素可由一个或多个数据项组成,数据项是有独立含义的数据最小单位
C.数据的逻辑结构是数据间关系的描述,它抽象地反映数据元素间的存储关系
D.数据的存储结构是逻辑结构在计算机存储器中的实现
第4题:
spark中的弹性分布式数据集相当于java中的()概念
第5题:
spark中的rdd是一个()数据集
第6题:
第7题:
spark中弹性分布式数据集指的是哪个()
第8题:
数据库是长期存储在计算机内、有组织的、可共享的( )。
A.文件集
B.数据集合
C.命令集合
D.程序集合
第9题:
spark中以下哪些特性是rdd的特性()
第10题:
创建rdd可以有如下几种?()