hdfs小文件的处理,hdfs的文件写入步骤

首页 > 实用技巧 > 作者：YD1662023-11-28 11:25:24

解压har文件

# 按顺序解压存档（串行） hdfs dfs -cp har:///outputdir/user.har /outputdir/newdir # 查看 hdfs dfs -ls /outputdir/newdir # 要并行解压存档，请使用DistCp，会提交MR任务进行并行解压 hadoop distcp har:///outputdir/user.har /outputdir/newdir2 # 查看 hdfs dfs -ls /outputdir/newdir2

hdfs小文件的处理,hdfs的文件写入步骤(9)

【温馨提示】眼尖的小伙伴，可以已经发现了一个问题，就是cp串行解压，会在解压的目录下保留har文件。

Archive注意事项：

Hadoop archives是特殊的档案格式, 扩展名是*.har；
创建archives本质是运行一个Map/Reduce任务，所以应该在Hadoop集群运行创建档案的命令；
创建archive文件要消耗和原文件一样多的硬盘空间；
archive文件不支持压缩；
archive文件一旦创建就无法改变，要修改的话，需要创建新的archive文件；
当创建archive时，源文件不会被更改或删除；

2）合并本地的小文件，上传到 HDFS（appendToFile ）

在本地准备2个小文件：

cat >user1.txt<<EOF 1,tom,male,16 2,jerry,male,10 EOF cat >user2.txt<<EOF 101,jack,male,19 102,rose,female,18 EOF

合并方式：

hdfs dfs -appendToFile user1.txt user2.txt /test/upload/merged_user.txt # 查看 hdfs dfs -cat /test/upload/merged_user.txt

hdfs小文件的处理,hdfs的文件写入步骤(10)

web HDFS： http://local-168-182-110:9870/explorer.html#/

hdfs小文件的处理,hdfs的文件写入步骤(11)

3）合并 HDFS 的小文件，下载到本地（getmerge）

# 先上传小文件到 HDFS： hdfs dfs -put user1.txt user2.txt /test/upload # 下载，同时合并： hdfs dfs -getmerge /test/upload/user*.txt ./merged_user.txt

hdfs小文件的处理,hdfs的文件写入步骤(12)

上一页 1 234 下一页

栏目热文

hdfs 文件分割不完整（hdfs小文件处理方法）
阅读全文>>2023-11-28 11:51:52
hdfs小文件合并的方式（hdfs小文件处理方法）
阅读全文>>2023-11-28 11:31:04
vfs合并失败处理方法（vfs global登录显示错误）
阅读全文>>2023-11-28 11:37:20
顾一心为什么没演第二季（顾一心为什么换演员）
阅读全文>>2023-11-28 11:24:00
一起同过窗2顾一心为什么没参演了（一起同过窗第三季顾一心回国了吗）
阅读全文>>2023-11-28 11:17:22
vfs文件不存在（vfs文件是什么求答案）
阅读全文>>2023-11-28 11:19:23
过大的vfs文件会导致无法使用吗（vfs文件删除影响软件使用吗）
阅读全文>>2023-11-28 11:22:37
hdfs如何在文件中添加内容（hdfs创建文件并写入内容）
阅读全文>>2023-11-28 11:27:18
vfs文件（vfs文件怎么打开）
阅读全文>>2023-11-28 11:48:44
hdfs 文件合并（hdfs小文件处理方法）
阅读全文>>2023-11-28 11:18:45

文档排行

本站推荐

初一至初三古诗大全（初一到初三所有的古诗词免费）
阅读全文>>2024-05-21 02:59:06
怎样蒸鸡好吃视频（蒸乌鸡的做法大全家常）
阅读全文>>2022-11-06 09:16:02
水培绿萝烂根怎么回事（水培绿萝烂根的补救方法）
阅读全文>>2024-10-13 23:01:27
洪湖赤卫队刘闯原型（洪湖赤卫队刘闯是哪里人）
阅读全文>>2023-06-20 06:44:44
之子于归宜其室家归的意思（七子之母不安其室的意思）
阅读全文>>2023-10-28 06:21:13
凯迪拉克xt5优缺点（凯迪拉克xt5详细缺点）
阅读全文>>2022-11-09 06:43:53

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.