Hadoop源码阅读(一):NameNode启动

2023-09-12 17:17:41

说明:
1.Hadoop版本:3.1.3
2.阅读工具:IDEA 2023.1.2
3.源码获取:Index of /dist/hadoop/core/hadoop-3.1.3 (apache.org)
4.工程导入:下载源码之后得到 hadoop-3.1.3-src.tar.gz 压缩包,在当前目录打开PowerShell,使用tar -zxvf指令解压即可,然后使用IDEA打开hadoop-3.1.3-src文件夹,要注意配置好Maven或Gradle仓库,否则jar包导入会比较慢
5.参考课程:尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放_哔哩哔哩_bilibili

首先ctrl+n,全局搜索namenode,打开namenode.java文件

然后找到main函数:

可以看到,try中通过createNameNode方法创建namenode对象:

进入createNameNode方法,可以看到一个switch case语句:

也就是根据不同的启动选项来初始化NameNode

找到default选项,返回了一个NameNode对象:

接下来进入NameNode类中,可以看到try语句中的initialize方法,对namenode进行初始化:

1.启动9870端口服务(startHttpServer)

进入初始化方法,可以看到首先启动了HTTP服务:startHttpServer方法

进入startHttpServer方法,实例化了NameNodeHttpServer对象,其中的参数分别为:

conf:配置信息;this:namenode对象;getHttpServerBindAddress方法:获取HTTP服务的端口号;

接下来进入getHttpServerBindAddress方法,可以看到通过getHttpServerAddress方法获取端口号

进入getHttpServerAddress方法:

进入getHttpAddress方法:

这里的DFS_NAMENODE_HTTP_ADDRESS_DEFAULT即是默认的端口号,通过不断的查找可以看到其值默认为9870:

重新回到startHttpServer方法内部:

绑定端口号完成之后HTTP服务启动:

进入start方法:

可以看到启动的是HttpServer2服务,这个服务是Hadoop官方封装的HttpServer服务,用于和JDK自带的HttpServer区分开

HttpServer 是 JDK 1.6 以后内置的一个轻量级 HTTP 服务器(在 rt.jar 包中的 com.sun.net.httpserver 包下)

接下来通过builder来实例化httpserver对象

然后在启动之前需要执行setupServlets方法:

用处是绑定多个servlet,即hadoop服务web UI不同页面的路径;

之后即可启动httpserver:

至此NameNode的9870端口服务已经启动了

2.加载镜像文件和编辑日志(loadNamesystem)

回到initialize方法,可以看到启动HttpServer之后,通过loadNamesystem加载镜像文件

从磁盘中加载镜像文件:

创建镜像文件,指定镜像文件和编辑日志的路径:

3.初始化RPC服务端(createRpcServer)

initialize方法中:

进入createRpcServer方法,可以看到创建了一个NameNodeRpcServer的实例化对象:

进入NameNodeRpcServer:通过new RPC.Builder创初始化RPC服务端

4.NameNode启动资源检查(startCommonServices)

initialize方法中:

进入startCommonServices:(FSNamesystem.java)

  • 找到NameNodeResourceChecker:(NameNodeResourceChecker.java)

该方法对于NameNode需要使用的资源进行检查:

该值即为默认的元数据存储空间(dfs.namenode.resource.du.reserved 默认值 1024 * 1024 * 100 =100m)

  • 找到checkAvailableResources方法:(FNNamesystem.java)

进入checkAvailableResources方法,查看是否有足够的存储空间,如果资源不够则返回false:

进入hasAvailableDiskSpace方法:(NameNodeResourceChecker.java)

进入areResourcesAvailable方法:(NameNodeResourcePolicy.java)

进入CheckableNameNodeResource

可以看到其是一个接口,ctrl+h查看其实现类:

进入CheckedVolume,找到其中isResourceAvailable方法的实现:

其中duReserved的值在NameNodeResourceChecker中进行了赋值,默认是100M

5.NameNode对心跳超时判断(startCommonServices)

进入startCommonServices方法中,找到blockManager.activate方法(启动块服务)

进入activate方法,找到datanodeManager.activate(conf)方法

再进入activate方法,找到heartbeatManager.activate()方法(DatanodeManager.java)

进入activate方法,可以看到该方法启动了一个线程

因此搜索run()方法,定位到其中的heartbeatCheck方法

进入heartbeatCheck方法,定位到isDatanodeDead方法,该方法用于判断DataNode节点是否挂断:

进入isDatanodeDead方法,可以看到该方法中的判断逻辑:

查看heartbeatExpireInterval的值,如下:

转而查看heartbeatRecheckIntervalheartbeatIntervalSeconds的值:

  • heartbeatRecheckInterval

默认值为5min

  • heartbeatIntervalSeconds

由此可见,DataNode超时时间的判定默认为10分钟 + 30秒

6.安全模式(startCommonServices)

进入startCommonServices方法:

进入getCompleteBlocksTotal方法:

返回startCommonServices方法,进入blockManager.activate方法:

进入bmSafeMode.activate方法,

  • 进入setBlockTotal方法:

阈值的计算逻辑:正常块的总数(total) * replQueueThreshold

replQueueThreshold的值如下:

👇

👇

  • 进入areThresholdsMet方法

可以看到判断逻辑是:return blockSafe >= blockThreshold && datanodeNum >= datanodeThreshold;

其中blockSafe为已经正常注册的块数

blockThreshold为块的最小阈值

datanodeNum为当前可用dn数量

datanodeThreshold为最小可用dn数量

由此可见,只有满足以上判断条件,才会触发离开安全模式的逻辑

更多推荐

电力系统直流潮流分析【N-1】(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。⛳️座右铭:行百里者,半于九十。📋📋📋本文目录如下:🎁🎁🎁目录💥1概述📚2运行结果🎉3参考文献🌈4Matlab代码及文档讲解💥1概述该程序接受一个感受矩阵B=[NxN]和注入功

从零开始:使用Python创建GUI驱动的简易国际象棋游戏

第一部分:国际象棋的基础1.介绍国际象棋,一个古老而又充满策略的游戏,历经数世纪的发展,至今仍然广受喜爱。那么,如何使用Python来创建一个简单的国际象棋游戏,并给它加上一个图形界面(GUI)呢?这篇文章将指导您一步步完成这一目标。2.定义棋盘和棋子首先,我们需要定义国际象棋的棋盘和棋子。棋盘是一个8x8的方格,通常

【备考网络工程师】如何备考2023年网络工程师之错题集篇(1)

文章目录写在前面涉及知识点一、自我认知(做一套真题)二、错题整理总结写在前面上半年试了一下软考的水,没想到居然过了,当然当时考的是初级-网络管理员,但是我觉得应该追求再高一些,正好比王勃说的穷且益坚,不坠青云之志。所以我得时刻保持自己学习的状态,为遇见明天更好的自己而加油,因此我也趁备战之初记录下来,有一起备考的赶紧加

巨人互动|Facebook海外户&Facebook有什么功能

Facebook是一款国际化的用于聊天的软件,Facebook一般情况下用户可以在其共享照片、发布评论以及在网络上发布新闻或者其他有趣内容的链接,观看短视频或者实时聊天等。那么Facebook也拥有广泛的功能和特点。巨人互动|Google海外户&Google内容定位介绍(◀想要了解更多可点击查看)巨人互动|Google

安全保护策略:iOS应用程序代码保护的关键步骤和技巧

​转载:怎么保护苹果手机移动应用程序iosipa文件中的代码?目录转载:怎么保护苹果手机移动应用程序iosipa文件中的代码?代码混淆步骤1.选择要混淆保护的ipa文件2.选择要混淆的类名称3.选择要混淆保护的函数,方法4.配置签名证书5.混淆和测试运行​编辑在当今移动应用市场竞争激烈的环境中,代码保护功能对于iOS应

异地访问Oracle数据库的解决方案:利用内网穿透实现PL/SQL远程连接的建议与步骤

文章目录前言1.数据库搭建2.内网穿透2.1安装cpolar内网穿透2.2创建隧道映射3.公网远程访问4.配置固定TCP端口地址4.1保留一个固定的公网TCP端口地址4.2配置固定公网TCP端口地址4.3测试使用固定TCP端口地址远程Oracle​小月糖糖主页在强者的眼中,没有最好,只有更好。移动开发领域优质创作者,阿

深入实现 MyBatis 底层机制的任务阶段3 - 封装 SqlSession 到执行器

😀前言在前面的几个任务阶段中,我们已经深入研究了如何自己实现MyBatis底层机制的关键组件,包括配置文件的读取、数据库连接的建立、执行器的编写以及SQL查询操作的实现。这些步骤为我们构建自定义MyBatis底层框架奠定了坚实的基础。.在本文中,我们将继续前进,进入任务阶段3,这一阶段的关键任务是将SqlSessio

GaussDB之SQL Audit,面向应用开发的SQL审核工具

前言我们先从一个SQL语句说起(以某传统单机数据库为例)。也许这就是我们业务代码中潜藏的一个SQL语句,对于一个普通开发者来说,这个语句编写工整,逻辑清晰,没有什么问题,可以直接推到代码仓中交付上线。但是一个有经验的开发者或数据库管理员可能会发现这个SQL存在诸多的优化点:两张表的id字段是否有索引?like语句不符合

提升开发效率的低代码思路

目录一、低代码如何快速开发?1.可视化开发2.预构建的组件和模板3.集成的开发和测试工具4.跨平台兼容性5.可伸缩性和可扩展性二、前后端分离的开发框架技术架构部署方式应用入口三、小结低代码开发工具正在日益变得强大,它正不断弥合着前后端开发之间的差距。对于后端来说,基于低代码平台开发应用时,完全不用担心前端的打包、部署等

如何申请办理400电话?

导语:随着企业的发展和市场竞争的加剧,越来越多的企业开始意识到拥有一个400电话的重要性。本文将介绍如何申请办理400电话,帮助企业提升客户服务质量和品牌形象。一、了解400电话的概念和优势400电话是一种企业客服电话号码,以400开头,可以通过固定电话和手机拨打。相比于普通电话号码,400电话具有以下优势:全国范围内

【C++】构造函数初始化列表 ③ ( 构造函数 的 初始化列表 中 为 const 成员变量初始化 )

文章目录一、构造函数的初始化列表中为const成员变量初始化1、初始化const常量成员2、错误代码示例-没有初始化常量成员3、正确代码示例-在初始化列表中初始化常量成员4、完整代码示例构造函数初始化列表总结:初始化列表可以为类的成员变量提供初始值;初始化列表可以调用类的成员变量类型的构造函数进行成员变量初始化操作;初

热文推荐