使用Apache Doris有什么好处

发布时间：2022-01-04 15:56:47 作者：柒染
来源：亿速云阅读：889

本篇文章为大家展示了使用Apache Doris有什么好处，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

Doris是Apache的孵化项目，作为MPP架构的关系型分析数据库，其性能表现卓越。此外Doris高度兼容MySQL协议，支持在线表结构变更且不依赖任何外部存储；扩展能力强，单集群可水平扩展至200台以上；多副本数据、元数据高可用，同时支持 Kafka流式导入，未来希望吸引更多外部贡献者加入做出有效改进。

Doris作为Apache的孵化项目，有很多体量比较大的企业在使用，例如搜狐、一点资讯、美团、小米、京东等。 Doris产品在百度的最初研发大概在十年之前，当前内部偏数据仓库的业务基本都运行在其上，作为MPP架构的关系型分析数据库，起初在设计时主要追求便捷与问题解决，支持PB级别。由于传统数据仓库主要是商业智能的方向，并没有对高并发、高可用做很多优化，而是集中在多维分析与报表查询等功能，而Doris可以确保7×24小时服务，通过滚动升级不中断线上服务，Doris在2017年在Github上开源，并于2018年进入Apache孵化器。

具体说到Doris的特色，性能卓越是不可忽视的一方面。了解一种数据库的卓越性能，我们需要看其场景，离开场景泛泛谈数据库性能，是不科学的。 Doris每个单后端可以做到在高并发情况下做到每秒钟8000+次的查询性能，100台节点的集群基本可以达到几万到十几万QPS的性能，这个性能基本可以满足类似百度统计这种，支撑全网几十万网站与APP的查询要求。此外，Doris高度兼容MySQL协议，支持在线表结构变更；只设FE、BE两个进程，方便部署，其中FE 负责元数据存储、查询解析和规划，BE 负责数据存储、执行查询算子。

基于此，我们都知道类似Kylin这类系统在线变更极其不便，仅仅是增加删除列可能都需要重新做表，影响在线服务，并且依赖很多Hadoop组件，使得部署使用非常复杂。但Doris高度集成并没有过多依赖外部存储，快速安装并可做到主节点高可用，就算是切换也可做到无感知并操作简单。此外，Doris扩展性强，架构优雅，其单集群可水平扩展至200台以上，支持Kafka流式导入集群，通过ODBC、JDBC链接前端可视化工具或开发应用等，表现出高可用、多副本等优势特性，Doris作为大企业开源的软件，是在实践中千锤百炼累计出来的，对解决实际问题的效果很好。

在京东，他们主要采用Doris来解决京东广告平台的报表查询，需要满足每日千万级查询、每日百亿级增量、毫秒级查询延迟以及每日百亿报表查询/多维分析/日志分析等数据指标。 Doris在618大促期间表现突出。此外在美团数据仓库迁移的过程中，原本是基于Apache Kylin的数据建模，由于 Kylin的Cube预构建会造成较多的数据重复，保持数据时效性还需要每天需要对大量历史数据进行重计算；但现在主要基于Doris进行数据建模，按天同步维度表和事实表，ad-hoc query查询即可。

Doris下一步的主要研发规划，包括存储和计算分离。我们发现目前有很多的历史数据存在于存储节点之上，未来希望可以存储在云上的对象存储中，将Doris改进为云原生数据库。毕竟在云上部署弹性的计算资源，一旦计算与存储分离，成本也会相应得到降低；引入新的存储格式，提升存储效率，包括索引、新的实时更新存储引擎等，以便提升效率；此外还会在查询优化方面下功夫，例如研发新的查询优化框架，支持CBO。

上述内容就是使用Apache Doris有什么好处，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注亿速云行业资讯频道。

使用Apache Doris有什么好处

相关阅读