hadoop MapReduce HDFS应用场景有哪些

发布时间:2021-12-09 09:24:14 作者:小新
来源:亿速云 阅读:167

这篇文章将为大家详细讲解有关hadoop MapReduce HDFS应用场景有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

Hadoop从存储上来说,是类似于冗余磁盘阵列(RAID)的存储方式,将数据分散存储并提供以提供吞吐量,它的存储系统就是HDFS(Hadoop Distuibute Fils System);从计算上来说,它通过MapReduce模型,将大数据的计算分发到多台计算机上完成,再将结果合并,减少计算的时间。

Hadoop适合于:

1、超大数据的计算;

2、一次写入、多次读取的模式;

3、可以跑在普通的硬件上。

Hadoop不适合:

1、低延迟的数据访问,它是为高数据吞吐量应用优化的;

若要处理一些用户要求时间比较短的低延迟应用请求,HDFS不适合。它是为了处理大型数据集分析任务的,主要是为达到高的数据吞吐量而设计的。这就可能要求以高延迟作为代价【以时间来换取空间】。目前补充的方案是:使用HBase,通过上层数据管理项目来尽可能弥补这个不足。

2、大量的小文件

Hadoop客户端需要和namenode进行交互,而namenode中存放的是datanode的文件属性,且都是在内存中,如果小文件过多,namenode是存放不了的;

3、多用户写入,任意修改文件。

Hadoop适合于一次计算,多次读取的场景,如搜索引擎,只支持随机读取不支持随机写入,如Hadoop和Lucene的集成就不能够直接集成,因为Lucene支持随机写入。

关于“hadoop MapReduce HDFS应用场景有哪些”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

推荐阅读:
  1. Hadoop 入门
  2. Hadoop 部署之 Hadoop (三)

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

hadoop mapreduce hdfs

上一篇:scala的for循环如何使用

下一篇:如何用Scala将指定格式的数据写入到文件

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》