如何进行ClickHouse性能提升中的SQL使用

发布时间:2022-01-06 16:17:19 作者:柒染
来源:亿速云 阅读:153

今天就跟大家聊聊有关如何进行ClickHouse性能提升中的SQL使用,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

1. 不要用select *

反例:


select * from app.user_model

正例:


select login_id,name,sex from app.user_model
理由:    只查询需要的字段可以减少磁盘io和网络io,提升查询性能

2.不要在大结果集上构造虚拟列

反例:


select id ,pv, uv , pv/uv rate from app.scene_model

正例:


select id ,pv, uv from app.scene_model
理由:    虚拟列非常消耗资源浪费性能,拿到pv uv后在前端显示时构造比率。

3. 不要在唯一列或大基数列上进行分组或去重操作

反例:


select id, count(1) cn from app.user_model group by id

正例:


select id  from app.user_model
理由:    基数太大会消耗过多的io和内存。

4. 根据需要查询指定范围的数据 (where)

反例:


select login_id,name,sex from app.user_model

正例:


select login_id,name,sex from app.user_model where create_time>'2020-03-30'
理由:    减少磁盘io和网络io,提升查询性能

5. 关联查询时小表在后(大表 join 小表)

反例:


select login_id,name,sex,a.scene_name from app.scene_model a join app.user_model b on a.create_user=b.id

正例:


select login_id,name,sex,a.scene_name from app.user_model  a join app.scene_model  b on a.id=b.create_user
理由:

    无论是Left Join 、Right Join还是Inner Join永远都是拿着右表中的每一条记录到左表中查找该记录是否存在。

6. 使用 uniqCombined 替代 distinct

反例:


SELECT count( DISTINCT create_user ) from  app.scene_model

正例:


SELECT uniqCombined( create_user ) from  app.scene_model
理由:    uniqCombined对去重进行了优化,通过近似去重提升十倍查询性能

7. 通过使用 limit 限制返回数据条数

反例:


select id,scene_name,code,pv from app.scene_model order by pv desc

正例:


select id,scene_name,code,pv from app.scene_model order by pv desc limit 100
理由:

    使用limit返回指定的结果集数量,不会进行向下扫描,大大提升了查询效率。

8. 尽量不去使用字符串类型

反例:

CREATE TABLE scene_model(    id String,    scene_name String,    pv String,    create_time String)ENGINE = <Engine>...

正例:

CREATE TABLE scene_model(    id String,    scene_name String,    pv Int32,    create_time Date)ENGINE = <Engine>...
理由:    时间类型最终会转换成数值类型进行处理,数值类型在执行效率和存储上远好过字符串。

9. 指定查询分区获取必要的数据

假设分区字段是day
反例:


select type,count(1) from app.user_model group by type

正例:


select type,count(1) from app.user_model where day ='2020-03-30' group by type
理由:    通过指定分区字段会减少底层数据库扫描的文件数量,提升查询性能

10.分组前过滤不必要的字段

反例:


select type,count(1) from app.user_model group by type

正例:


select type,count(1) from app.user_model where type ='1' or  type ='2' group by type
理由:    通过限制分组前结果集数量,查询性能一般能提示数十倍,甚至上百倍

看完上述内容,你们对如何进行ClickHouse性能提升中的SQL使用有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。

推荐阅读:
  1. 怎么进行ORACLE SQL PROFILE使用
  2. SQL中怎么使用convert函数进行日期查询

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

clickhouse sql

上一篇:能替代Excel的工具FineReport怎么用

下一篇:如何用PS制作创意撕裂效果

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》