hadoop面试题及答案,hadoop面试常见问题及答案

首页 > 生活 > 作者:YD1662024-06-01 20:32:48

基于 Hadoop 的数据中心架构

hadoop面试题及答案,hadoop面试常见问题及答案(5)

4、运行Hadoop集群需要哪些守护进程?

DataNode,NameNode,TaskTracker和JobTracker都是运行Hadoop集群需要的守护进程。

5、Hadoop支持哪些操作系统部署?

Hadoop的主要操作系统是Linux。 但是,通过使用一些额外的软件,也可以在Windows平台上部署,但这种方式不被推荐。

6、Hadoop常见输入格式是什么?

三种广泛使用的输入格式是:

·文本输入:Hadoop中的默认输入格式。

·Key值:用于纯文本文件

·序列:用于依次读取文件

7、RDBMS和Hadoop的主要区别是什么?

RDBMS用于事务性系统存储和处理数据,而Hadoop可以用来存储大量数据。

8、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的URL?

hadoop面试题及答案,hadoop面试常见问题及答案(6)

hadoop面试题及答案,hadoop面试常见问题及答案(7)

9、如何在生产环境中部署Hadoop的不同组件?

需要在主节点上部署jobtracker和namenode,然后在多个从节点上部署datanode。

10、添加新datanode后,作为Hadoop管理员需要做什么?

需要启动平衡器才能在所有节点之间重新平均分配数据,以便Hadoop集群自动查找新的datanode。要优化集群性能,应该重新启动平衡器以在数据节点之间重新分配数据。

11、namenode的重要性是什么?

namenonde的作用在Hadoop中非常重要。它是Hadoop的大脑,主要负责管理系统上的分配块,还为客户提出请求时的数据提供特定地址。

12、判断:Block Size是不可以修改的。(错误)

分析:

hadoop面试题及答案,hadoop面试常见问题及答案(8)

上一页123下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.