上篇丨数据融合平台DataPipeline的应用场景

发布时间:2020-03-17 12:57:58 作者:DataPipeline
来源:网络 阅读:188

上篇丨数据融合平台DataPipeline的应用场景

在过去的一年里DataPipeline经历了几次产品迭代。就最新的2.6版本而言,你知道都有哪些使用场景吗?接下来将分为上下篇为大家一 一解读,希望这些场景中能出现你关心的那一款。

场景一:应对生产数据结构的频繁变更场景

  1. 场景说明

在同步生产数据时,因为业务关系,源端经常会有删除表,增减字段情况。希望在该情况下任务可以继续同步。并且当源端增减字段时,目的地可以根据设置选择是否同源端一起增减字段。

  1. 场景适用说明

源/目的地:关系型数据库

读取模式:不限制

  1. 操作步骤

上篇丨数据融合平台DataPipeline的应用场景

场景二:数据任务结束后调用Jenkins任务

  1. 场景说明

数据任务同步结束,立即启动已定义的Jenkins任务。保证执行的顺序性,以及依赖性。

  1. 场景适用说明

源/目的地:传统性数据库(其它需要脚本)

读取模式:批量全量或增量识别字段

  1. 操作步骤

详细操作细节请与DataPipeline人员沟通

上篇丨数据融合平台DataPipeline的应用场景

场景三:生产数据同步给测试使用

  1. 场景说明

MySQL->MySQL实时同步,在同步时,可能测试组想要对任务中的几张表目的地进行测试,在测试过程中,目的地会有INSERT/UPDATE/DELETE操作。希望在测试前,能以自动化方式执行脚本暂停某几张表的同步。测试结束后以自动化方式执行脚本重新同步这几张表,并且目的地数据需要与线上数据保持一致(即测试所产生的脏数据需要被全部清理掉)。

  1. 场景适用说明

源/目的地:关系型数据库目的地

读取模式:不限制(全量/增量识别字段模式可能需要开启【每次定时执行批量同步前,允许清除目标表数据】功能)

  1. 操作步骤

场景四:Hive->GP列存储同步速率提高方案

  1. 场景说明

Hive->GP,如果GP目的地表为手动创建的列存储表,那么在DataPipeline上同步时速率会非常慢。这是因为GP列存储本身存在的限制。而目的地若为DataPipeline创建的行表,再通过脚本将行表转换为列表,则效率提高几十倍。

  1. 场景适用说明

源/目的地:Hive源/GP目的地

读取模式:增量/全量

  1. 操作步骤

场景五:对数据进行加密脱敏处理场景

  1. 场景说明

因为涉及用户隐私或其它安全原因,需要对数据部分字段进行脱敏或加密处理。通过DataPipeline的高级清洗功能可以完全满足此类场景。

  1. 场景适用说明

源/目的地:不限制

读取模式:不限制

  1. 操作步骤

注意事项:所写的jar包需要分别上传webservice、sink、manager所在容器的服务器的/root/datapipeline/code_engine_lib(一般默认)目录。

场景六:通过错误队列,明确上下游数据问题责任及原因

  1. 场景说明

作为数据部门,需要接收上游数据,并根据下游部门需求将数据传输给对应部门。因此当存在脏数据或者数据问题时,有时很难定位问题原因,划分责任。

并且大多时候都是将脏数据直接丢弃,上游无法追踪脏数据产生的原因。通过DP的高级清洗功能可自定义将不符合的数据放入错误队列中。

  1. 场景适用说明

源/目的地:不限制

读取模式:不限制

  1. 操作步骤

高级清洗代码可联系DataPipeline提供模板

场景七:更便捷地支持目的地手动增加字段

  1. 场景说明

由Oracle->SQLServer,想在目的地手动添加一列TIMESTAMP类型,自动赋予默认值,记录数据INSERT时间。

  1. 场景适用说明

源/目的地:关系型数据库目的地

读取模式:不限制

  1. 操作步骤

上篇丨数据融合平台DataPipeline的应用场景

本篇将集中介绍以上7种场景,如果你在工作中遇到了同样的问题,欢迎与我们交流。

推荐阅读:
  1. 最新2.7版本丨DataPipeline数据融合产品最新版本
  2. DataPipeline数据融合重磅功能丨一对多实时分发、批

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

数据融合、数据集成、数据同步、etl dat

上一篇:Unix字符串截取

下一篇:kvm 异常处理收集

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》