spark的基础知识点整理

发布时间:2021-08-31 18:43:02 作者:chen
来源:亿速云 阅读:220

这篇文章主要介绍“spark的基础知识点整理”,在日常操作中,相信很多人在spark的基础知识点整理问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”spark的基础知识点整理”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

一 .基础整理

  1. 服务器本身不存储数据,数据本身放在HDFS中的,服务器只做功能的进行查,删改等功能

  2. Hive hbase mysql 区别

    {% asset_img 各种数据库之间的差别比较.png 这是一个新的博客的图片的说明 %}
  3. 服务器本身不存储数据,数据本身放在HDFS中的,服务器只做功能的进行查,删改等功能

  4. Hbase特性
    spark的基础知识点整理

  5. 16010  对外访问端口

  6. HBASE是一个数据库——可以提供数据的实时随机读写

  7. Hbase:

  8. hbase存储机制:面向列存储,table是按row排序。

  9. Hbase的表没有固定的字段定义

  10. 特征:

  11. 访问hbase table中的行,只有三种方式:

二 .集群搭建(完全分布式)

  1. 主机安装

  2. JDK 安装

  3. hadoop安装

  4. 环境变量

  5. 验证:hbase version

  6. [hbase/conf/hbase-env.sh]

    export JAVA_HOME=/soft/jdk
    export HBASE_MANAGES_ZK=false
  7. [hbse-site.xml]

      <!-- 使用完全分布式 -->
       <property>
           <name>hbase.cluster.distributed</name>
           <value>true</value>
       </property>
       <!-- 指定hbase数据在hdfs上的存放路径 -->
       <property>
           <name>hbase.rootdir</name>
           <value>hdfs://s201:8020/hbase</value>
       </property>
       <!-- 配置zk地址 -->
       <property>
           <name>hbase.zookeeper.quorum</name>
           <value>s201:2181,s202:2181,s203:2181</value>
       </property>
       <!-- zk的本地目录 -->
       <property>
           <name>hbase.zookeeper.property.dataDir</name>
           <value>/home/centos/zookeeper</value>
       </property>

三.使用知识点

  1. hbase shell 基本操作

  2. 通过编程API访问Hbase

//创建conf对象
                Configuration conf = HBaseConfiguration.create();
                //通过连接工厂创建连接对象
                Connection conn = ConnectionFactory.createConnection(conf);
                //通过连接查询tableName对象
                TableName tname = TableName.valueOf("ns1:t1");
                //获得table
                Table table = conn.getTable(tname);
                //通过bytes工具类创建字节数组(将字符串)
                byte[] rowid = Bytes.toBytes("row3");
                Get get = new Get(Bytes.toBytes("row3"));
                Result r = table.get(get);
                byte[] idvalue = r.getValue(Bytes.toBytes("f1"),Bytes.toBytes("id"));
                System.out.println(Bytes.toInt(idvalue));
  1. Row Key

  2. 列族

  3. 写前日志

  4. 存放位置

     -  相同列族的数据存放在一个文件中
     -  [表数据的存储目录结构构成]
     -  hdfs://s201:8020/hbase/data/${名字空间}/${表名}/${区域名称}/${列族名称}/${文件名}
     -  [WAL目录结构构成]
     -  hdfs://s201:8020/hbase/WALs/${区域服务器名称,主机名,端口号,时间戳}/
    1. client端交互过程

  5. Zookeeper 起的作用

  6. Master职责

  7. Region Server职责

四.整体架构
spark的基础知识点整理

到此,关于“spark的基础知识点整理”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

推荐阅读:
  1. php 基础整理
  2. Spark基础

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

spark

上一篇:Java接口的继承与抽象类介绍

下一篇:Java文件和Java包结构的概念

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》