raid5两块硬盘掉线,里面是数据库如何恢复数据

发布时间:2020-07-04 15:58:03 作者:宋国建
来源:网络 阅读:2074

【raid数据恢复故障描述】

华为S5300存储,存储中以供有16块FC硬盘,整个存储空间由450GB FC的硬盘组成一个RAID5磁盘阵列(包含一块热备盘)。该存储中的RAID5阵列3号硬盘由于未知原因离线,热备盘上线并进行数据同步,同步完成到50%左右时8号盘由于未知原因离线,同步失败,raid阵列瘫痪,上层的lun失效,急需对该存储中的raid阵列进行数据恢复。

【raid数据恢复过程一:检测raid阵列所有磁盘】

首先对该raid中所有磁盘(包括正常磁盘和掉线磁盘)进行物理检测以确定离线盘有无物理故障,检测结果为3号盘存在物理故障,其他所有包括8号盘均无物理故障。

【raid数据恢复过程二:备份raid阵列所有磁盘】

物理检测结束后使用dd命令或数据恢复工具将所有磁盘都镜像成文件备份(这么做的目的是为了在镜像中进行数据恢复操作,保护用户源数据)。

【raid数据恢复过程三:分析该阵列raid结构】

工程师对该raid阵列中的所有磁盘进行分析,找出热备盘(热备盘理论上与其他数据盘有明显区别,可以直接区分)由于raid是条带化的,所有阵列中的数据均按照一定规律进行存储,所以工程师分析raid中的数据库页在每一个物理磁盘中的分布情况计算出raid组的磁盘顺序、数据走向、条带大小等基本信息。

【raid数据恢复过程四:找出raid阵列中被同步的坏盘】

根据分析得出的RAID信息,尝试通过RAID虚拟程序将原始的RAID组虚拟出来。但由于整个RAID组中掉线两块盘并且有一块硬盘数据被同步损坏。仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是被同步掉损坏的硬盘,通过RAID校验程序对这个条带做校验,因此可以明确被同步损坏盘了。

【raid数据恢复过程四:分析raid阵列lun信息】

分析lun信息首先虚拟出raid阵列状态,分析lun在阵列中的分配状态,分析lun分配的数据块,然后根据数据MAP并导出LUN的数据。

【文件系统数据恢复过程:解析EXT3文件系统】

由于是使用热备盘虚拟的RAID结构,EXT3文件系统无法正常挂载,所以只能提取oracle数据库文件,利用自主开发的文件系统解析程序对其进行文件系统的解析,导出oracle数据库文件,并把数据库文件移交给数据库工程师进行校验和验证

【数据库修复过程一:检测数据文件完整性】

使用Oracle数据库文件检测工具检测每个数据库文件是否完整,发现有错误。再使用Oracle数据库检测工具(检验更严格),发现有部分数据库文件和日志文件错误, system 和 sysaux表空间各存在100多坏块;3个控制文件都存在坏块许多坏块,控制文件全部损坏;eschoolspace表空间的3个文件的坏块更多,达到1000个;undotbs02丢失;数据库工程师对此类文件进行修复,
图一:
raid5两块硬盘掉线,里面是数据库如何恢复数据
图二:
raid5两块硬盘掉线,里面是数据库如何恢复数据

【数据库修复过程一:修复数据库】

我们创建了控制文件,创建undo表空间,启动数据库到mount。system数据文件坏块使得数据库不能open。各种隐含参数也不能绕过system的坏块;搭建数据库环境。使用dmp文件还原数据库。使用3月9号之后的导入,都报错,大约只能导入10G左右的数据。
图三:
raid5两块硬盘掉线,里面是数据库如何恢复数据

【数据验证:数据恢复成功】

由用户方配合,启动Oracle数据库,在本地虚拟机安装OA客户端。通过OA客户端对数据记录进行验证,并且用户安排不同部门人员进行远程验证。验证通过,数据恢复成功

推荐阅读:
  1. 服务器1块硬盘掉线后重建raid5并同步数据
  2. 两组raid5两块盘掉线数据恢复成功案例-有方案

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

数据库 存储 raid

上一篇:PHP加速插件-opcache参数详解

下一篇:XCode编译运行出错解决思路,以及再次推荐AppCode

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》