Postgresql与Elasticsearch数据同步提高

发布时间：2020-06-11 16:39:58 作者：郭柏雅
来源：网络阅读：1731

一般来说，影响数据库最大的性能问题有两个，一个是对数据库的读写操作，一个是数据库中的数据太大导致操作慢，对于前者我们可以适当借助缓存来减少一部分读操作，而针对一些复杂的报表分析和搜索可以交给hadoop和elasticsearch,对于写并发大，读也并发大，我们可以考虑分库分表，主从读写分离或者两者结合等方式来提高并发性和时效性，例如PG大并发写，大数据查看可以用elasticsearch与PG数据同步来读，可以启到很好的效果。
ElasticSearch做为搜索服务器，在性能上确实优势突出，是当前流行的企业级搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。主要用于实时搜索和分析引擎,，支持对结构化数据和非结构数据处理检索。
例如，我们使用的数据库时Postgres数据库，主从配置，从库主要用于数据分析检索为主，如果使用postgres进行多表多维度全量方式检索分析用户行为等挖掘有价值的数据，这样性能上无法及时满足客户时时性要求，因此我们可以使用Elasticsearch数据库代替PG从库做为挖掘分析数据库，使用过程中发现两者表与数据的兼容性都还不错，而且展现数据的性能确实快，
如下图是同一张表数据在postgres数据库中对应的表，在Elasticsearch数据库中对应，说明数据是兼容的。
Postgresql与Elasticsearch数据同步提高

而在postgres数据库中针对visit_plan_qz 表3073920笔数据进行全量查询，耗时大于5分钟都无法正常展现出来，
Postgresql与Elasticsearch数据同步提高

如果使用Elasticsearch进程全量查询仅使用0.0005秒就可以展现出数据，当然Elasticsearch会自动对该表划分为5个分片来展现数据。

Postgresql与Elasticsearch数据同步提高
工作原理:
PG关系数据库 ⇒ 数据库 ⇒ 表 ⇒ 行 ⇒ 列(Columns)
Elasticsearch ⇒ 索引(Index) ⇒ 类型(type) ⇒ 文档(Docments) ⇒ 字段(Fields)
可以看出Elasticsearch性能上的优势在索引，它提供强大的索引能力，Elasticsearch 是通过 Lucene 的倒排索引技术实现比关系型数据库更快的过滤
Elasticsearch的索引思路:将磁盘里的东西尽量搬进内存，减少磁盘随机读取次数(同时也利用磁盘顺序读特性)，结合各种算法，用及其苛刻的态度使用内存。

Postgresql与Elasticsearch数据同步提高

相关阅读