【大数据】HDFS 的常用命令

2023-09-20 23:15:38

1.操作命令

操作命令是以 hdfs dfs 开头的命令。通过这些命令,用户可以完成 HDFS 文件的 复制删除查找 等操作,Shell 命令的一般格式如下。

hdfs dfs [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfs 是子命令,表示执行文件系统操作;通用选项由 HDFS 文件操作命令和操作参数组成。

1.1 创建文件夹

hdfs dfs -mkdir [-p] <文件路径>
  • [-p]:表示如果父目录不存在,先创建父目录。

例如,新建文件夹 /202012721/202012721/dir1。命令如下:

hdfs dfs -mkdir /202012721
hdfs dfs -mkdir -p /202012721/dir1

结果如下:

在这里插入图片描述

1.2 列出指定的文件和目录

hdfs dfs -ls [-d][-h][-R] <文件路径>
  • [-d]:返回 path
  • [-h]hhuman-readble,表示按照人性化的单位显示文件大小,比如文件显示为 10 MB,而不会显示 10240 KB。
  • [-R]:级联显示 paths 下的文件。

例如,列出根目录下的文件或目录。命令如下:

hdfs dfs -ls /

结果如下:

在这里插入图片描述

1.3 新建文件

hdfs dfs -touchz <存放路径>

例如,在主目录 /202012721/input 下创建大小为 0 0 0 的空文件 file。命令如下:

hdfs dfs -touchz /202012721/input.txt
hdfs dfs -ls /202012721

结果如下:

在这里插入图片描述

1.4 上传文件

hdfs dfs -put [-f] [-p] <本地路径> <HDFS上的路径>

或者

hdfs dfs -copyFromLocal [-f] [-p] [-l] <本地路径> <HDFS上的路径>

在这里我们只演示第一个命令。例如,在本地创建一个文件 data.txt 并传到 HDFS 的 /202012721 目录下命令如下:

hdfs dfs -put data.txt /202012721/data.txt

结果如下:

在这里插入图片描述

1.5 将本地文件移动到 HDFS

hdfs dfs -moveFromLocal <本地文件路径> <HDFS路径> 

hdfs dfs -copyFromLocal 命令不同的是,此命令将文件复制到 HDFS 后,本地的文件会被删除。

例如,我们把本地文件 data2.txt 移动到 HDFS 的 /202012721 命令如下:

hdfs dfs -moveFromLocal data2.txt /202012721 

结果如下:

在这里插入图片描述

1.6 下载文件

hdfs dfs -get [-p] <HDFS路径> <本地文件路径>

或者

hdfs dfs -copyToLocal [-p] [-ignoreCrc] [-crc] <HDFS路径> <本地文件路径>

例如,将 HDFS 中的 /202012721/data.txt 文件下载并保存为本地的 ~/local_data.txt

hdfs dfs -get /202012721/data.txt ~/local_data.txt

/202012721/data2.txt 文件下载到本地目录:

hdfs dfs -copyToLocal /202012721/data2.txt ~

1.7 查看文件

hdfs dfs -cat [-ignoreCrc] <文件路径>
  • [-ignoreCrc]:忽略循环检验失败的文件。
hdfs dfs -text [-ignoreCrc] <文件路径>
  • text 不仅可以查看文本文件,还可以查看压缩文件和 Avro 序列化的文件。
hdfs dfs -tail [-f] <文件路径>
  • [-f]:动态更新显示数据。
  • tail 查看的是最后 1 KB 的文件(Linux 上的 tail 默认查看最后 10 10 10 行记录)。

例如,查看 /202012721/data.txt。命令如下:

hdfs dfs -cat /202012721/data.txt

结果如下:

在这里插入图片描述

1.8 追写文件

hdfs dfs -appendToFile <本地路径> <目标路径>

该命令将 localsrc 指向的本地文件内容写入目标文件 dst。例如,在本地根目录下新建 data3.txt 文件,内容为 hadoop,追加到文件 /202012721/data.txt 中。命令如下:

hdfs dfs -appendToFile data3.txt /202012721/data.txt
hdfs dfs -cat /202012721/data.txt

结果如下:

在这里插入图片描述

1.9 删除目录或者文件

hdfs dfs -rm [-f] [-r] <文件路径>
  • [-f]:如果要删除的文件不存在,不显示错误信息。
  • [-r/R]:级联删除目录下所有的文件和子目录文件。

例如,删除 HDFS 中的 /202012721/data2.txt 文件。命令如下:

hdfs dfs -rm /202012721/data2.txt

结果如下:

在这里插入图片描述

1.10 显示占用的磁盘空间大小

按字节显示指定目录所占空间大小。

hdfs dfs -du [-s] [-h] <文件路径>
  • [-s]:显示指定目录下文件总的大小。
  • [-h]hhuman-readble,表示按照人性化的单位显示文件大小,比如文件显示为 10 MB,而不会显示 10240 KB。

例如,显示 HDFS 根目录中 202012721 文件夹下所有文件的大小。命令如下:

hdfs dfs -du /202012721

结果如下:

在这里插入图片描述

1.11 HDFS 中的文件复制

hdfs dfs -cp [-f] [-p | -p[topax]] <原路径> <目标路径>
  • [-f]:如果目标文件存在,将强行覆盖。
  • [-p]:将保存文件的属性。

例如,将 HDFS 中的 /202012721/data.txt 复制为 /202012721/data_copy.txt。命令如下:

hdfs dfs -cp /202012721/data.txt /202012721/data_copy.txt

结果如下:

在这里插入图片描述

1.12 HDFS 中的文件移动

hdfs dfs -mv <原路径> <目标路径>

例如,将 HDFS 中的 /202012721/data_copy.txt 移动(也可理解为改名)为 /202012721/data2.txt。命令如下:

hdfs dfs -mv /202012721/data_copy.txt /202012721/data2.txt

结果如下:

在这里插入图片描述

2.管理命令

管理命令是以 hdfs dfsadmin 开头的命令。通过这些命令,用户可以管理 HDFS。管理命令的一般格式如下:

hdfs dfsadmin [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfsadmin 是子命令,表示执行文件系统管理的操作;通用选项由 HDFS 管理命令和参数组成。

2.1 报告文件系统的基本信息和统计信息

hdfs dfsadmin -report

结果如下:

在这里插入图片描述

2.2 查看拓扑

hdfs dfsadmin -printTopology

结果如下:

在这里插入图片描述

3.其他命令

我们把操作命令 hdfs dfs、管理命令 hdfs dfsadmin 之外的命令称为其他命令。输入 hdfs 查看。

更多推荐

APP产品经理岗位的具体内容(合集)

APP产品经理岗位的具体内容11、负责项目产品团队的管理工作,对项目产品团队考核目标负责;2、全面负责“工务园”所有产品,全方位负责其生命周期管理;3、按照产品管理相关的计划和规范,对产品版本的更新及发布负责,完善产品的各种技术文档;4、深刻理解业务需求并转化为系统需求,撰写产品需求文档和需求规格说明书;编写帮助文档、

GLTF编辑器如何快速重置模型原点

1、什么是模型原点?模型原点是三维建模中的概念,它是指在一个虚拟三维空间中确定的参考点。模型原点通常位于模型的几何中心或基本组件的中心位置。如图所示:可以看到模型的原点在模型的几何中心2、模型原点的作用知道了什么是模型原点,那么模型原点有那些作用呢?以下是模型原点的作用点:位置确定:模型原点可以帮助确定模型在三维空间中

PWA及小程序在系统生态方面的支持对比

PWA代表“渐进式网络应用”(ProgressiveWebApplication)。它是一种结合了网页和移动应用程序功能的技术概念。PWA旨在提供类似于原生应用程序的用户体验,包括离线访问、推送通知、后台同步等功能,同时又具有网页的优势,如跨平台、无需下载安装等。PWA这个概念在行业内发展的挺快,基于Chromium的

产品经理-战略-战略的含义和层级

引言22年老板在听我做部门人员数量汇报时,当场就给我们部门员工做能力标签,过了几天就输出了一个公司所有技术岗位的能力标签。其中有一项是战略思维,该项满分是5分,我们部门同事绝大部分人都只有2分,我自己也就3分。当时不仅缺乏战略思维,而且连战略思维的概念也很模糊,更不用说怎么提高了,并且内心也想我们测试的岗位缺乏战略思维

pytorch迁移学习训练图像分类

pytorch迁移学习训练图像分类一、环境配置二、迁移学习关键代码三、完整代码四、结果对比代码和图片等资源均来源于哔哩哔哩up主:同济子豪兄讲解视频:Pytorch迁移学习训练自己的图像分类模型一、环境配置1,安装所需的包pipinstallnumpypandasmatplotlibseabornplotlyreque

[Linux 基础] linux基础指令(2)head,tail,Cal,find,grep,zip/unzip,tar,bc,uname

文章目录1、head指令2、tail指令引申:如何拿到中间行内容方案一:方案二:方案三:补充指令:(1)wc-l文件名(2)uniq文件名(3)sort文件名3、时间相关的指令4、Cal指令5、find指令:(灰常重要)-name补充:which、ctrl+r6、grep指令7、zip/unzip指令8、tar指令(重

摄像头工程师说 Camera - 数据格式 YUV 详解(2)

Camera数据格式YUV详解概述上一个小节我们聊到Camera项目项目中常用的几种图像颜色的表示方法,并重点讲述了常用的RAW、RGB、RGBA格式。YUV格式伴随着视频行业的快速发展,衍生出非常复杂YUV格式定义,比如YUV444、YUV422、YUV420、YUV420、YUV420SP、YUV422P等等格式。

【考研数学】线性代数第五章 —— 特征值和特征向量(3,矩阵对角化理论)

文章目录引言三、矩阵对角化理论3.1一般矩阵的相似对角化3.2实对称矩阵的相似对角化3.2.1实对称矩阵相似对角化定理3.2.2实对称矩阵相似对角化过程写在最后引言承接前文,我们来看看矩阵的对角化理论。我们前面提到对角化是在矩阵相似那里,若存在可逆矩阵PPP,使得P−1AP=ΛP^{-1}AP=\LambdaP−1AP

2023年华数杯数学建模A题隔热材料的结构优化控制研究解题全过程文档及程序

2023年华数杯全国大学生数学建模A题隔热材料的结构优化控制研究原题再现:新型隔热材料A具有优良的隔热特性,在航天、军工、石化、建筑、交通等高科技领域中有着广泛的应用。目前,由单根隔热材料A纤维编织成的织物,其热导率可以直接测出;但是单根隔热材料A纤维的热导率(本题实验环境下可假定其为定值),因其直径过小,长径比(长度

Java8实战-总结32

Java8实战-总结32重构、测试和调试为改善可读性和灵活性重构代码从命令式的数据处理切换到Stream增加代码的灵活性重构、测试和调试为改善可读性和灵活性重构代码从命令式的数据处理切换到Stream建议将所有使用迭代器这种数据处理模式处理集合的代码都转换成StreamAPI的方式。StreamAPI能更清晰地表达数据

Java面试

一、redis1、缓存-缓存穿透缓存穿透就是查询一个数据库不存在的数据,这样就会缓存不命中导致一直查询数据库解决方案:1、设置空值2、布隆过滤器布隆过滤器误判解决:1、redis分布式锁2、给布隆过滤器设置误判率2、缓存击穿缓存击穿的意思是对于设置了过期时间的key,缓存在某个时间点过期的时候,恰好这时间点对这个Key

热文推荐