MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
Spark介绍 按照官方的定义,Spark 是一个通用,快速,适用于大规模数据的处理引擎。 通用性:我们可以使用Spark SQL来执行常规分析, S...
[TOC] 一、spark调优概论 1.1 什么是spark调优 spark的计算本质是分布式计算,程序的性能受集群中的任何因素的影响,如:C...
1. Spark SQL是什么?处理结构化数据的一个spark的模块它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用2. ...
1. Spark StreamingSpark Streaming是一个基于Spark Core之上的实时计算框架,可以从很多数据源消费数据并对数据进...