spark 初体验

发布时间:2020-07-01 09:25:14 作者:原生zzy
来源:网络 阅读:365

spark 初体验

一、spark的产生背景

(1)MapReduce的发展:

  1. MRv1的缺点:

      2. MRv2的缺点:

 

(2)Spark的优势:

(3)spark生态:

spark 初体验

Spark 生态圈以 SparkCore 为核心从 HDFS、Amazon S3 或者 HBase 等持久层读取数据,以 MESOS、YARN 和自身携带的 Standalone 为资源管理器调度 Job 完成 Spark 应用程序的计算。

 

(4)spark特点:

    spark 初体验

  spark 初体验

spark 初体验

          (5)spark的应用场景:

① Yahoo 将 Spark 用在 Audience Expansion 中的应用,进行点击预测和即席查询

② 淘宝技术团队使用了 Spark 来解决多次迭代的机器学习算法高计算复杂度的算法等。 应用于内容推荐社区发现

③ 腾讯大数据精准推荐借助 Spark 快速迭代的优势,实现了在“数据实时采集算法实时训练系统实时预测”的全流程实时并行高维算法,最终成功应用于广点通 PCTR 投放 系统上。

优酷土豆将 Spark 应用于视频推荐(图计算)、广告业务,主要实现机器学习图计算等 迭代计算。

推荐阅读:
  1. Python之于大数据的意义和作用
  2. 有哪三个大数据的来源

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

大数据 spark spar

上一篇:php中静态调用和实例化调用的区别是什么

下一篇:使用better-scroll实现左右联动的方法

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》