怎样持续定义SaaS 模式云数据仓库 +Serverless

发布时间:2021-12-30 10:35:44 作者:柒染
来源:亿速云 阅读:137

怎样持续定义SaaS 模式云数据仓库 +Serverless,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

一、Serverless简介

下图是MaxCompute的Serverless架构,主要包括数据接入服务、多计算环境、储存服务和管理几个模块。

怎样持续定义SaaS 模式云数据仓库 +Serverless

其中各个模块的主要特点如下:

(1)Serverless的数据接入服务

(2)Serverless的多计算环境

(3)Serverless的存储服务

(4)Serverless的管理

上面是对Serverless架构的一个简述,本文的重点是如何利用MaxCompute的Serverless计算资源来满足数据仓库的需求。

下图所示的是MaxCompute计算资源与管理与使用的逻辑模型。对于MaxCompute中的Project,实际上对应的是一个逻辑的数据仓库的隔离单元,我们可以根据不同的管理目标创建不同的Project,比如我们可以分别创建面向测试的Project和面向开发的Project,两个项目之间有独立的数据和权限管理体系,并不互通,达到管理的隔离作用。当然,只有这样的隔离空间还不足够,因为我们的计算任务需要绑定计算资源,我们可以将Project与付费方式绑定,根据需求,对不同的Project设置不同的计费方式,使得不同的隔离空间使用不同的计算资源。

怎样持续定义SaaS 模式云数据仓库 +Serverless

在上述的体系之下,MaxCompute有着一些独特的特点,首先就是有一个多租户环境,我们在开通了MaxCompute可以根据不同的管理需求创建多个隔离的数据仓库空间,对于企业来说,可以购买多组逻辑上的计算资源,这种多计算资源、多隔离环境,可以更好地满足不同的场景需要。
如下图所示,理想中的Serverless资源模型要求我们很好的规划资源的利用方式才能够完美的适配我们的实际需求(图中黑线)。

怎样持续定义SaaS 模式云数据仓库 +Serverless

但是,实际上我们的客户有不同的资源需求,有着众多的差异化需求场景,其场景主要有:

从各种场景中我们可以发现,大数据计算对计算资源的需求方式并不是一个完完全全的纯Serverless的按需分配的需求,而是不同的阶段有不同的需求,且不同类型的需求有不同的要求,其对计算资源的需求特点主要包括如下:

(1)业务敏捷性需求

(2)周期性峰谷差异明显

(3)稳定的业务,关注关键任务的按SLA产出

(4)资源治理:算例需求由快速变化转变为稳定可预期

总得来说,现实中我们的算力需求最求的目标就是在满足现实中的差异化需求的前提下,还能够达到成本最小化的目标。

二、Serverless助力业务敏捷

那么,MaxCompute的Serverless如何满足上述的场景和需求呢?如果是一个业务快速发展、快速变化的企业,我们建议使用MaxCompute的Serverless按需使用的计算资源。从管理上来讲的话,我们可以建立不同的Project去做一些隔离的划分,比如说建立一套开发测试环境,一套生产环境。对于有些分析师来讲,他们往往随机地需要对一些明细数据做大量的探索,或做机器学习分析,往往有一些突发的算力需求,且这个算力需求的规模可能非常大,这个时候往往这些作业要和其他的环境隔离,因为他们是低频的,但是却需要对海量数据做分析。

我们还可以按照组织划分,比如很多企业的组织比较大,可以按照部门来进行划分,使得每个部门有一个隔离的环境,各个部门作为一个独立的组织,他们需要相对独立的数据和计算资源,我们可以使用Serverless按需分配的这种模式。有了这种模式之后,企业无需进行容量规划,在初期的时候可以使用按量付费的方式,通过这种超大的资源池来满足各个部门的资源需求,避免资源的争抢。

总的来说,利用Serverless在各种作业情况下Serverless都能够很好的满足需求:在单作业的情况下,无论是规模大小,Serverless都可以很好的满足不同规模的作业资源需求;在多并发的情况下,Serverless也能够满足多作业需求,避免出现资源的争抢情况出现;在某些我们希望能够控制作业费用的情况下,MaxCompute也可以提供费用预估+费用控制的方式来阻断高额作业。通过上述的方式,MaxCompute+Serverless可以大大提升业务敏捷性,加速价值实现。

怎样持续定义SaaS 模式云数据仓库 +Serverless

另外,有一些企业结合自身日常的管理环境,更希望有一个相对稳定的资源池,因为其本身有一定的资源规划和资源治理的能力,这种情况下,我们购买一定固定规格大小的资源,然后按照职能或者按照组织划分隔离环境,利用MaxCompute提供的配额组管理能力将资源切分成多个资源组,在财务可预测的前提下,满足不同业务、不同组织的需求。这种模式的关键技术特点有:

怎样持续定义SaaS 模式云数据仓库 +Serverless

第三种场景是关于成本与业务敏捷性的融合。举个例子,数据平台的管理者可能经常面临多种作业:一类是日常作业,通常把这里作业放在一个固定大小的资源中,成本可控、可预期;另外一类是一些关键作业,我们愿意花费一定的代价把它加速完成去满足业务需求,对于这类作业我们希望能够拿到一些额外的算力;还有一类作业是面向数据科学家的探索型作业,我们希望这类作业对我们的生产作业不要产生干扰,同时数据科学家又能利用强大的算力快速地完成业务假设和设想,我们可以将这类作业放在按需的资源池中;在复杂的企业中可能还会有创新类的业务,他们需要一个新的数据开发环境和应用创新的环境,我们可以新建一个数据仓库的隔离环境,按需分配资源,帮助他们快速的去验证业务假设。

产品侧我们主要提供了两种能力给用户:

怎样持续定义SaaS 模式云数据仓库 +Serverless

上面的三种场景都是在日常运营中的真实场景,还有一个场景就是客户在使用了按量付费一段时间之后,业务稳定下来了,希望将项目放在固定的、预付费的资源池上。这时候就会遇到一个问题:如何进行资源的需求评估呢?毕竟之前按量付费的时候是不需要进行资源需求预估的。MaxCompute提供了容量规划来解决这个问题,其原理是利用MaxCompute提供的元数据服务(information schema)根据历史的算力消耗情况来预估项目的整体算力需求,其关键信息有:

根据上面的信息我们就可以根据一定的规则来预测业务的算力需求,进行容量规划,关于这部分的详细内容大家可以到阿里云社区查找相应的文章进行了解。

上文主要分享了如何利用Serverless服务来更好的进行资源管理,低成本地满足不同业务的资源需求。总的来说:

(1)按量付费的模式适合业务快速发展及变化阶段,配合MaxCompute的cost control管理手段,既能满足业务的算力需求,又能有效的控制成本。
(2)对于预付费的资源,我们可以通过quota管理,切分多个计算资源,做相应的负载隔离、分时管理,利用dw+mc基线作业优先级保障关键作业SLA。
(3)对于预付费固定资源和弹性按量付费组合的方式,我们可以根据作业级别选择不同的计算资源:对于突发作业,使用按量付费补充突发算力需求;对于周期性作业中的尖峰需求,也通过按量付费满足,从而达到资源的有效利用,且降低成本。
(4)我们可以利用元数据来进行算力需求评估,进行容量规划,从而在按量付费和预付费方式之间进行转换,还可以利用元数据来进行资源消耗分析,进行资源的优化,降低资源高消耗的作业,做相应的资源治理。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。

推荐阅读:
  1. Serverless Kubernetes入门:对kubernetes做减法
  2. Knative Serverless 之道:如何 0 运维、低成本实现应用托管?

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

serverless saas

上一篇:怎么在SAP的ABAP编程环境里消费API的ABAP

下一篇:怎么使用API的方式消费SAP的订单服务

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》