如何使用Scala实现worldcount功能

发布时间:2021-12-09 09:21:57 作者:iii
来源:亿速云 阅读:168

这篇文章主要讲解了“如何使用Scala实现worldcount功能”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用Scala实现worldcount功能”吧!

新建ScalaWorldCount对象:

package com.ruozedata.day4

object ScalaWorldCount {

  def main(args: Array[String]): Unit = {

    val lines = List("hello ruoze hello jepson","hello ruoze hello jepson hello china")

    /**第一种方法

      * flatMap=map+flatten  lines.flatMap 将数据压扁

      *  flatMap(_.split(" "))   拿到每一个元素(字符串),按照空格切割

      *  map((_,1))  将单词出现一次和1放在一起(放入元组)

      *  groupBy(_._1) 第一个_ 表示List中的每一个元组,取元组中的某一个元素用._n,即按照元组中的某一元素分组,返回是一个map

      *  map(t=>(t._1,t._2.size)) 第一个_ 拿到一个对偶元组,取元组中的第一个元组。_._2.size即是取对偶元组第二个的个数。

      *

      */

    val wc = lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).map(t=>(t._1,t._2.size)).toList // .sortBy(_._2).reverse

    for(j <-  0 until wc.length) println(wc(j)+"\t")

    /** 第二种方法

      * foldLeft(0)(_+_._2)第一个_表示初始值或者上一次累加的结果 中第二个_ ,表示拿到的每一个元组,第三个元组的中第n个值

      */

    val wc = lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.foldLeft(0)(_+_._2))

    for(i <- wc) println(i+"\t")

  }

}

运行结果:

(china,1)

(ruoze,2)

(jepson,2)

(hello,5)

Process finished with exit code 0

感谢各位的阅读,以上就是“如何使用Scala实现worldcount功能”的内容了,经过本文的学习后,相信大家对如何使用Scala实现worldcount功能这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

推荐阅读:
  1. SpringBoot如何使用Scala进行开发的实现
  2. Scala for循环怎么使用

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

scala

上一篇:zookeeper分布式锁服务的原理分析

下一篇:hbase中行锁与多版本并发控制的示例分析

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》