Hadoop回收站及fs.trash参数详解
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,前言:Linux系统里,个人觉得最大的不方便之一就是没有回收站的概念。rm -rf很容易造成极大的损失。而在Hadoop或者说HDFS里面,有trash(回收站)的概念,可以使得数据被误删以后,还可以
千家信息网最后更新 2025年12月02日Hadoop回收站及fs.trash参数详解
前言:
- Linux系统里,个人觉得最大的不方便之一就是没有回收站的概念。rm -rf很容易造成极大的损失。而在Hadoop或者说HDFS里面,有trash(回收站)的概念,可以使得数据被误删以后,还可以找回来。
- Hadoop里的trash选项默认是关闭的,所以如果要生效,需要提前将trash选项打开,修改conf里的core-site.xml即可,下面我们测试下开启前后的区别:
1.不启用trash
[hadoop@hadoop000 ~]$ hdfs dfs -put test.log /[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:49 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user# 删除test.log 注意提示[hadoop@hadoop000 ~]$ hdfs dfs -rm -r /test.logDeleted /test.log# 重新查看 发现test.log被删除[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 2 itemsdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user2.启用trash
[hadoop@hadoop000 hadoop]$ pwd/opt/software/hadoop-2.8.1/etc/hadoop# 增加fs.trash参数配置 开启trash(进程不需重启)[hadoop@hadoop000 hadoop]$ vi core-site.xml fs.trash.interval 1440 fs.trash.checkpoint.interval 1440 # fs.trash.interval是在指在这个回收周期之内,文件实际上是被移动到trash的这个目录下面,而不是马上把数据删除掉。等到回收周期真正到了以后,hdfs才会将数据真正删除。默认的单位是分钟,1440分钟=60*24,刚好是一天;fs.trash.checkpoint.interval则是指垃圾回收的检查间隔,应该是小于或者等于fs.trash.interval。# 参考官方文档:http://hadoop.apache.org/docs/r2.8.4/hadoop-project-dist/hadoop-common/core-default.xml [hadoop@hadoop000 ~]$ hdfs dfs -put test.log /[hadoop@hadoop000 ~]$ hdfs dfs -ls / Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user# 删除test.log 注意提示的不同[hadoop@hadoop000 ~]$ hdfs dfs -rm -r /test.log 18/05/23 16:54:55 INFO fs.TrashPolicyDefault: Moved: 'hdfs://192.168.6.217:9000/test.log' to trash at: hdfs://192.168.6.217:9000/user/hadoop/.Trash/Current/test.log# 发现删除的文件在回收站里[hadoop@hadoop000 ~]$ hdfs dfs -ls /user/hadoop/.Trash/CurrentFound 1 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /user/hadoop/.Trash/Current/test.log# 恢复误删除的文件[hadoop@hadoop000 ~]$ hdfs dfs -mv /user/hadoop/.Trash/Current/test.log /test.log[hadoop@hadoop000 ~]$ hdfs dfs -ls /Found 3 items-rw-r--r-- 1 hadoop supergroup 34 2018-05-23 16:54 /test.logdrwx------ - hadoop supergroup 0 2018-05-19 15:48 /tmpdrwxr-xr-x - hadoop supergroup 0 2018-05-19 15:48 /user
回收站
数据
文件
周期
概念
提示
参数
不同
最大
个人
前言
单位
垃圾
官方
实际
实际上
就是
损失
文档
是在
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全法宣传单内容
哪个是数据库的字符集
qq网络安全中心电话
腾讯游戏服务器连接异常怎么办
计算机网络技术专业实践性
速特服务器
网络安全 名词解释
数据库慕课单元答案中南大学
有线电视机房用的什么服务器
轻量应用服务器怎么做游戏服务器
杭州临安茂讯网络技术工作室
数据库之间接口
抖音特效什么软件开发
吃鸡与服务器连接失败什么意思
网络安全工程师怎么入门
短视频软件开发公司简介
徐州网络技术开发供应
花生壳邮件服务器
数据库怎么取消保护
jade软件cod数据库
网络安全警惕哪些
数据库将R分解成3NF
海康威视服务器电源适配器
汽车网络安全风险来源
百信服务器单价
河南景行网络技术
服务器安全组为什么刷新不到
创造与魔法和平服的服务器在哪里
抖音云端数据库在哪里
深圳智保网络技术有限公司