大数据的四种主要计算模式（大数据主要有几种计算模式） - 原点资讯

本文转载自 众课帮 公众号

1、第三次信息化浪潮的标志是：
A、个人电脑的普及
B、互联网的普及
C、云计算、大数据、物联网技术的普及
D、虚拟现实技术的普及
答案：云计算、大数据、物联网技术的普及

2、就数据的量级而言，1PB数据是多少TB？
A、512
B、1024
C、1000
D、2048
答案：1024

3、以下关于云计算、大数据和物联网之间的关系，论述错误的是：
A、云计算侧重于数据分析
B、云计算、大数据和物联网三者紧密相关，相辅相成
C、物联网可以借助于云计算实现海量数据的存储
D、物联网可以借助于大数据实现海量数据的分析
答案：云计算侧重于数据分析

4、以下哪个不是大数据时代新兴的技术：
A、Hadoop
B、Spark
C、HBase
D、MySQL
答案：MySQL

5、每种大数据产品都有特定的应用场景，以下哪个产品是用于批处理的：
A、MapReduce
B、Pregel
C、Dremel
D、Storm
答案：MapReduce

6、每种大数据产品都有特定的应用场景，以下哪个产品是用于流计算的：
A、GraphX
B、S4
C、Hive
D、Impala
答案：S4

7、每种大数据产品都有特定的应用场景，以下哪个产品是用于图计算的：
A、Cassandra
B、Flume
C、Storm
D、Pregel
答案：Pregel

8、每种大数据产品都有特定的应用场景，以下哪个产品是用于查询分析计算的：
A、MapReduce
B、hdfs
C、Dremel
D、S4
答案：Dremel

9、数据产生方式大致经历了三个阶段，包括：
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
D、移动互联网数据阶段
答案：运营式系统阶段

10、大数据发展的三个阶段是：
A、萌芽期
B、低谷期
C、成熟期
D、大规模应用期
答案：萌芽期

11、大数据的4V特性包括：
A、数据量大
B、数据新颖
C、数据类型繁多
D、处理速度快
E、价值密度低
答案：处理速度快#数据类型繁多#数据量大#价值密度低

12、图领奖获得者、著名数据库专家Jim Gray博士认为，人类自古以来在科学研究上先后经历了四种范式，具体包括：
A、猜想科学
B、实验科学
C、理论科学
D、计算科学
E、数据密集型科学
答案：理论科学

13、大数据带来思维方式的三个转变是：
A、精确而非全面
B、全样而非抽样
C、效率而非精确
D、相关而非因果
答案：效率而非精确

14、大数据的四种主要计算模式包括：
A、批处理计算
B、流计算
C、框计算
D、图计算
E、查询分析计算
答案：批处理计算;
流计算;
图计算;
查询分析计算

15、云计算的典型服务模式包括三种：
A、PaaS
B、IaaS
C、SaaS
D、MaaS
答案：PaaS;
SaaS;
IaaS

1、启动hadoop所有进程的命令是
A、start-dfs.sh
B、start-hadoop.sh
C、start-all.sh
D、start-HDFS.sh
答案：start-all.sh

2、以下对Hadoop的说法错误的是
A、Hadoop的核心是HDFS和MapReduce
B、Hadoop是基于Java语言开发的，只支持Java语言编程
C、Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
D、Hadoop MapReduce是针对谷歌MapReduce的开源实现，通常用于大规模数据集的并行计算
答案：Hadoop是基于Java语言开发的，只支持Java语言编程

3、以下哪个不是hadoop的特性
A、高容错性
B、高可靠性
C、成本高
D、支持多种编程语言
答案：成本高

4、以下名词解释不正确的是
A、HDFS：分布式文件系统，是Hadoop项目的两大核心之一，是谷歌GFS的开源实现
B、HBase：提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现
C、Hive：一个基于Hadoop的数据仓库工具，用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D、Zookeeper：针对谷歌Chubby的一个开源实现，是高效可靠的协同工作系统
答案：HBase：提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现

5、以下哪些组件是Hadoop的生态系统的组件
A、MapReduce
B、HDFS
C、Oracle
D、HBase
答案：MapReduce;
HDFS;
HBase

6、以下哪个命令可以用来操作HDFS文件
A、hadoop fs
B、hdfs dfs
C、hadoop dfs
D、hdfs fs
答案：hdfs fs

1、HDFS的命名空间不包含
A、目录
B、文件
C、块
D、字节
答案：字节

2、对HDFS通信协议的理解错误的是
A、HDFS通信协议都是构建在IoT协议基础之上的
B、名称节点和数据节点之间则使用数据节点协议进行交互
C、客户端与数据节点的交互是通过RPC（Remote Procedure Call）来实现的
D、客户端通过一个可配置的端口向名称节点主动发起TCP连接，并使用客户端协议与名称节点进行交互
答案：HDFS通信协议都是构建在IoT协议基础之上的

3、采用多副本冗余存储的优势不包含
A、加快数据传输速度
B、节约存储空间
C、容易检查数据错误
D、保证数据可靠性
答案：节约存储空间

4、假设已经配置好环境变量，启动Hadoop和关闭Hadoop的命令分别是
A、start-hdfs.sh，stop-hdfs.sh
B、start-dfs.sh，stop-dfs.sh
C、start-dfs.sh，stop-hdfs.sh
D、start-hdfs.sh，stop-dfs.sh
答案：start-dfs.sh，stop-dfs.sh

5、分布式文件系统HDFS采用了主从结构模型，由计算机集群中的多个节点构成的，这些节点分为两类，一类存储元数据叫，另一类存储具体数据叫
A、名称节点，数据节点
B、数据节点，名称节点
C、名称节点，主节点
D、从节点，主节点
答案：名称节点，数据节点

6、下面关于分布式文件系统HDFS的描述正确的是：
A、分布式文件系统HDFS是一种关系型数据库
B、分布式文件系统HDFS是Google Bigtable的一种开源实现
C、分布式文件系统HDFS是谷歌分布式文件系统GFS（Google File System）的一种开源实现
D、分布式文件系统HDFS比较适合存储大量零碎的小文件
答案：分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现

7、以下对名称节点理解正确的是
A、名称节点通常用来保存元数据
B、名称节点的数据保存在内存中
C、名称节点作为中心服务器，负责管理文件系统的命名空间及客户端对文件的访问
D、名称节点用来负责具体用户数据的存储
答案：名称节点的数据保存在内存中

8、以下对数据节点理解正确的是
A、数据节点用来存储具体的文件内容
B、数据节点的数据保存在磁盘中
C、数据节点在名称节点的统一调度下进行数据块的创建、删除和等操作
D、数据节点通常只有一个
答案：数据节点在名称节点的统一调度下进行数据块的创建、删除和等操作

9、HDFS只设置唯一一个名称节点带来的局限性包括
A、性能的瓶颈
B、命名空间的限制
C、隔离问题
D、集群的可用性
答案：命名空间的限制;
隔离问题;
性能瓶颈;
集群的可用性