瓯江教务(深入解析大数据Hadoop中的HDFS)
瓯江教务:大数据需要学习的框架有很多,而Hadoop作为大数据开发的核心模块,就需要多加了解。HDFS是基于Java的分布式文件系统,对于理解Hadoop分布式文件系统很有帮助,今天我们就一起来深入解析大数据Hadoop中的HDFS。

一、什么是HDFS?
HDFS负责数据文件的存储,为整个Hadoop生态圈提供了基础的存储服务。提供了一个低成本、高性能、高容错、高可靠的分布式文件系统。
HDFS是一个主/从(Master/Slave)体系架构,由于分布式存储的性质,集群拥有两类节点NameNode和DataNode。NameNode(名字节点):系统中通常只有一个,中心服务器的角色,管理存储和检索多个DataNode的实际数据所需的所有元数据。
二、HDFS的特点
1、低成本:搭建HDFS主要是通过横向扩展机器数量而非花高价钱购进昂贵的服务器。
2、高性能:处理大型任务上集群处理效率,多台机器分块并行处理要比单台机器串行处理要快很多
3、高容错:数据自动保存多个副本。它通过增加副本的形式,提高容错性。数据自动保存多个副本,副本丢失后,自动恢复。
4、高可靠:HDFS解决了单点问题,HDFS集群中心节点是非常重要的,如果中心节点宕机整个集群将无法使用,所以中心节点NameNode会有主要节点(Primary)和备份节点(Stand By)。如果Primary出现问题Stand By可以自动接替Primary工作。
三、HDFS如何存储数据?
HDFS 采用Master/Slave的架构来存储数据,这种架构主要由四个部分组成,分别为HDFS Client(客户端)、NameNode(主管、管理者)、DataNode(slave)和Secondary NameNode。可以看看下面这张图:
以上就是关于HDFS的部份解析了,希望对大家能有多帮助。HDFS作为Hadoop主要的核心,在数据存储方面为我们提供了保证,是非常优秀的分布式文件系统。如果想了解更多详情,请点击成都加米谷大数据官网吧!
随机文章
SEO教程站长导航
搜素引擎算法
关键词排名优化
网站内容优化
SEO教程
友情链接交换
搜素引擎算法
百度搜索“网赚联盟”即可找到本站,微信搜索“小小课堂网”关注小小课堂网公众号。网赚联盟( wangzhuan.org.cn )欢迎用户投稿,发布者:用户投稿,文章版权归作者所有,投稿文章不代表网赚联盟立场,中二少年发布为网赚联盟原创文章,转载请注明出处:https://wangzhuan.org.cn/29741.html

微信扫一扫
支付宝扫一扫