hadoop异构存储怎么实现

发布时间：2021-12-09 15:53:28 作者：iii
来源：亿速云阅读：213

这篇文章主要讲解了“hadoop异构存储怎么实现”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“hadoop异构存储怎么实现”吧！

1. 什么是hadoop的异构存储

Hadoop在2.6.0版本中引入了一个新特性——异构存储。异构存储关键在于异构2个字，异构存储可以根据各个存储介质读写特性的不同发挥各自的优势，比如最普通的Disk磁盘；而对于热数据而言，可以采用SSD的方式进行存储，这样就能保证高效的读性能，在速率上甚至能做到十倍于或百倍于普通磁盘读写的速度。

2. 目前hadoop支持的存储类型如下：

* RAM_DISK存储在内存

* SSD 存储在固态硬盘
* DISK(default) 存储在普通磁盘（默认）
* ARCHIVE

按照RAM_DISK->SSD->DISK->ARCHIVE的顺序，存取速度由快到慢，单bit存储成本由高到低。

2.1 命令的使用

0. hdfs storagepolicies -listPolicies（查看支持的存储策略）

1.hadoop fs -mkdir /data/ssddata（创建目录）

2.hdfs storagepolicies -setStoragePolicy -path /data/ssddata –policy One_SSD

（将目录设置为一份存在ssd上面，其他的副本存在普通的磁盘上面，以后存储在该文件夹下面的文件的块副本都会存一份在ssd上面）

3.hdfs storagepolicies -getStoragePolicy -path /data/ssddata(查看该目录的存储策略，结果如下图)

4.取消设置的存储策略，创建文件的时候默认为unspecified，那么该命令可以将其修改为默认值

hdfs storagepolicies -unsetStoragePolicy -path /data/normal/ip2.txt

hdfs mover [-p <files/dirs> | -f <local file name>],

3. 索引

在数据检索中，给数据添加索引是一个重要环节，传统中关系型数据库大多通过建索引来达到快速检索的效果，OLTP数据库大多是B或者B+树索引。想必大家都知道lucene,它的索引是倒排索引（该概念不再这里叙述），不同的分词使它的全文检索功能很强大。诸如大家熟知的Elasticsearch也是在以lucene做索引引擎。但遗憾的是ES并不支持异构存储，且ES在面临单个分片数据量超大时也会存在瓶颈问题。

感谢各位的阅读，以上就是“hadoop异构存储怎么实现”的内容了，经过本文的学习后，相信大家对hadoop异构存储怎么实现这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是亿速云，小编将为大家推送更多相关知识点的文章，欢迎关注！

hadoop异构存储怎么实现

相关阅读