hdfs数据误删分析与恢复

发布时间:2020-06-23 11:10:35 作者:zouqingyun
来源:网络 阅读:5129

一、相关参数:

1、core-site.xml  文件修改以下配置项:

<property>
     <name>fs.trash.interval</name>
     <value>2880</value>
     <description>HDFS垃圾箱设置,可以恢复误删除,配置的值为分钟数,0为禁用</description>
</property>




2、hdfs-default.xml 文件注意以下配置项:

<property>          
      <name>dfs.ha.log-roll.period</name>
      <value>120</value>
      <description>EditLog 日志滚动频率,单位为秒,默认是两分钟</description>
</property>



二、分析过程

1、找到editlog日志所在目录

查看hdfs-site.xml文件,找到fs.namenode.name.dir配置项的值,如:file:/home/hadoop-2.6.0-cdh6.5.0/dfs/name

/home/hadoop-2.6.0-cdh6.5.0/dfs/name目录下的current文件里,就是editlog文件,如下图

hdfs数据误删分析与恢复

hdfs数据误删分析与恢复

2、使用命令查看edits_inprogress文件

 #hdfs oev -i edits_inprogress_0000000000000000023 -o edits_inprogress_0000000000000000023.xml

其中 -i 是输入文件名,-o是需要把解析的文件输出到该文件中

解析完成后,查看edits_inprogress_0000000000000000023.xml文件即可

3、打开文件分析

找到被删除的文件或文件夹,在edits_inprogress_0000000000000000023.xml文件中搜索相关项,如下所示:

<RECORD>
    <OPCODE>OP_RENAME_OLD</OPCODE>
    <DATA>
      <TXID>15</TXID>
      <LENGTH>0</LENGTH>
      <SRC>/dat</SRC>
      <DST>/user/root/.Trash/Current/dat</DST>
      <TIMESTAMP>1454315297010</TIMESTAMP>
      <RPC_CLIENTID>6832d4f9-4fa6-4dbb-89aa-ffaa26109078</RPC_CLIENTID>
      <RPC_CALLID>6</RPC_CALLID>
    </DATA>
  </RECORD>

可以看出,HDFS中 /dat 文件是在  1454315297  时间点被移入回收站的

4、恢复文件

执行以下命令:

 
#fs -mv   /user/root/.Trash/Current/dat    /dat


进行恢复


推荐阅读:
  1. MongoDB误删表恢复
  2. SQLServer无需Restore恢复误删表(二):恢复表数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

linux hadoop hdfs

上一篇:JS实现二叉树、动态规划和回溯法

下一篇:Cisco Catalyst 交换机一直处于rommon模式无法启动IOS问题的解决

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》