hadoop异构存储怎么实现

发布时间:2021-12-09 15:53:28 作者:iii
来源:亿速云 阅读:167

这篇文章主要讲解了“hadoop异构存储怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hadoop异构存储怎么实现”吧!

1.       什么是hadoop的异构存储

Hadoop在2.6.0版本中引入了一个新特性——异构存储。异构存储关键在于异构2个字,异构存储可以根据各个存储介质读写特性的不同发挥各自的优势,比如最普通的Disk磁盘;而对于热数据而言,可以采用SSD的方式进行存储,这样就能保证高效的读性能,在速率上甚至能做到十倍于或百倍于普通磁盘读写的速度。

2.       目前hadoop支持的存储类型如下:

* RAM_DISK存储在内存

* SSD  存储在固态硬盘
* DISK(default)  存储在普通磁盘(默认)
* ARCHIVE

按照RAM_DISK->SSD->DISK->ARCHIVE的顺序,存取速度由快到慢,单bit存储成本由高到低。

2.1 命令的使用

0. hdfs storagepolicies  -listPolicies(查看支持的存储策略)

1.hadoop fs -mkdir /data/ssddata(创建目录)

2.hdfs storagepolicies -setStoragePolicy -path /data/ssddata –policy One_SSD

(将目录设置为一份存在ssd上面,其他的副本存在普通的磁盘上面,以后存储在该文件夹下面的文件的块副本都会存一份在ssd上面)

3.hdfs storagepolicies -getStoragePolicy -path /data/ssddata(查看该目录的存储策略,结果如下图)

hadoop异构存储怎么实现

4.取消设置的存储策略,创建文件的时候默认为unspecified,那么该命令可以将其修改为默认值

hdfs storagepolicies -unsetStoragePolicy -path /data/normal/ip2.txt

hdfs mover [-p <files/dirs> | -f <local file name>],

3.       索引

在数据检索中,给数据添加索引是一个重要环节,传统中关系型数据库大多通过建索引来达到快速检索的效果,OLTP数据库大多是B或者B+树索引。想必大家都知道lucene,它的索引是倒排索引(该概念不再这里叙述),不同的分词使它的全文检索功能很强大。诸如大家熟知的Elasticsearch也是在以lucene做索引引擎。但遗憾的是ES并不支持异构存储,且ES在面临单个分片数据量超大时也会存在瓶颈问题。

感谢各位的阅读,以上就是“hadoop异构存储怎么实现”的内容了,经过本文的学习后,相信大家对hadoop异构存储怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

推荐阅读:
  1. Redis异构集群数据实时迁移
  2. Hadoop数据存储—Hbase

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

hadoop

上一篇:Hive和Imapla查询decimal类型结果不同的异常该怎么解决

下一篇:如何解决重启Hadoop集群时no namenode to stop的异常

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》