本篇内容主要讲解“运营数据库的可访问性有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“运营数据库的可访问性有哪些”吧!
Cloudera
操作数据库(
OpDB
)
是横向扩展的数据库管理系统(DBMS),旨在将其线性扩展至PB级数据。像所有DBMS一样,横向扩展是通过切片实现的。支持两种不同的切片策略:
• 自动切片
• 预定义切片
无论采用哪种方法,都有一些API可以基于散列、值的范围以及两者的组合来启用切片。 启用自动切片后,表将在整个集群中动态分布,并且当切片大小超过可配置的限制时,表会自动拆分并在集群中的服务器之间移动。
一个表段在中间键处被分为两部分,从而创建了两个大致相等的一半,并且这两个一半可以由不同的服务器提供服务。无论与OpDB一起使用的网络(WAN或本地)如何,都将应用自动切片。可以将群集设置为跨越WAN,在这种情况下,切片和数据移动将在WAN上进行,而数据丢失为零。可以将系统配置为了解哪个节点位于哪个数据中心,这可以为切片提供额外的弹性,因为切片的副本可以分布在多个数据中心中。可以基于策略,通常以租户特定的方式将碎片限制为群集中节点的特定子集。这样就可以实施基于地理的策略。然后,可以在群集之间复制表并通过策略进行设置,以确保将表及其关联切片的复制限制在所需的地理位置。
Cloudera的OpDB为数据主权提供本地支持。如果群集跨越多个国家/地区,则可以将区域服务器组与HDFS Rack隔离配置一起用于锚定特定国家/地区中的数据。Cloudera提供了针对不同类型的用例进行了优化的三个查询引擎,包括操作和分析用例以及NoSQL接口,以在各种操作和数据仓库工作负载中实现优化的性能。这样就可以跨多个切片执行查询和数据联接。
Cloudera的OpDB提供了本机OLTP SQL引擎,该引擎支持查询多个数据和对象模型,包括查询和跨它们的联接。我们的两个OLAP查询引擎可用于映射驻留在我们的OpDB(或其他位置)中的外部表,并可在它们之间进行查询或联接,以进行典型的数据仓库分析。Cloudera提供了多种工具来实现与数据仓库和联合查询处理的集成。
• 由Flink、Spark、Hive和MapReduce提供批量导出到数据仓库的功能
• Nifi提供将导出流传输到数据仓库
• Phoenix、Impala和Hive提供了我们OpDB中的现场数据查询
• Hive提供了跨我们的OpDB、数据仓库解决方案和第三方数据仓库解决方案的联合查询处理
Cloudera的OpDB包含许多Hadoop工具,并与大多数Hadoop生态系统集成。
我们的OpDB提供NoSQL和SQL接口。该接口没有任何限制,并且在Hadoop社区中得到很好的支持。MiNiFi可以在边缘的便携式设备上使用,并提供与OpDB的数据连接。
除了直接API访问我们的数据存储和工具外,Cloudera还提供了通过SQL引擎提供的JDBC和ODBC驱动程序。到此,相信大家对“运营数据库的可访问性有哪些”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!