win7下使用Idea远程连接spark执行spark pi,我自己的实验

发布时间:2020-05-18 21:35:38 作者:moviebat
来源:网络 阅读:2541

win7下使用Idea远程连接spark执行spark pi,我自己的实验


win7地址为192.168.0.2,ubuntu为虚拟机,地址为192.168.0.3

远程连接spark


源代码语言为:

package main.scala.sogou
/**
  * Created by danger on 2016/9/16.
  */
import org.apache.spark.SparkContext._
import org.apache.spark.{SparkConf,SparkContext}

object RemoteDebug {
  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("Spark Pi").setMaster("spark://192.168.0.3:7077")
      .setJars(List("D:\\scalasrc\\out\\artifacts\\scalasrc.jar"))
    val spark = new SparkContext(conf)
    val slices = if (args.length > 0) args(0).toInt else 2
    val n = 100000 * slices
    val count = spark.parallelize(1 to n, slices).map { i =>
      val x = Math.random * 2 - 1
      val y = Math.random * 2 - 1
      if (x * x + y * y < 1) 1 else 0
    }.reduce(_ + _)
    println("Pi is roughly " + 4.0 * count / n)
    spark.stop()
  }
}

你需要修改的地方就是spark://192.168.0.3:7077
还有就是setJars的地址:D:\\scalasrc\\out\\artifacts\\scalasrc.jar

另外我没有Import spark的Math包

所以random用的是Math.random

在run的edit configuration界面中,配置参数

七十主要是mainclass哈

main.scala.sogou.RemoteDebug


单机run 


远程的服务器一阵狂赚,消停后,出现了


Process finished with exit code 0

呵呵,成功了


但结果呢?


网上找,原来在这里


16/09/16 09:40:57 INFO DAGScheduler: ResultStage 0 (reduce at RemoteDebug.scala:19) finished in 75.751 s

16/09/16 09:40:57 INFO TaskSchedulerImpl: Removed TaskSet 0.0, whose tasks have all completed, from pool 

16/09/16 09:40:57 INFO DAGScheduler: Job 0 finished: reduce at RemoteDebug.scala:19, took 76.071948 s

Pi is roughly 3.1385

16/09/16 09:40:57 INFO SparkUI: Stopped Spark web UI at http://192.168.0.2:4040

16/09/16 09:40:57 INFO DAGScheduler: Stopping DAGScheduler

16/09/16 09:40:57 INFO SparkDeploySchedulerBackend: Shutting down all executors

16/09/16 09:40:57 INFO SparkDeploySchedulerBackend: Asking each executor to shut down

16/09/16 09:40:57 INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!

16/09/16 09:40:57 INFO MemoryStore: MemoryStore cleared


太帅了,成功了,参考http://blog.csdn.net/javastart/article/details/43372977

推荐阅读:
  1. spark(一):spark概览及逻辑执行图
  2. Apache Spark 2.3 运行在Kubernete实战

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

idea spark sparkpi

上一篇:css中样式的优先级简单总结

下一篇:多层科目任意组合汇总报表的性能优化 (上)

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》