如何针对性破解Linux自动化运维落地的18个关键问题

发布时间:2021-11-01 09:49:43 作者:柒染
来源:亿速云 阅读:159

如何针对性破解Linux自动化运维落地的18个关键问题,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

不久前,我做过一个关于企业自动化运维落地经验及工具对比的分享和介绍,其中很多场景是我根据实践经验对一线互联网公司和传统行业的做法进行的对比阐述:如何将自动化运维形成一个整体?如何从方法论的角度去理解自动化运维、去建设自动化运维?

通过整理运维爱好者们提出的一系列自动化运维落地的具体问题及讨论结果。

一、自动化运维平台风险

问题1:自动化运维风险如何控制?

问题2:自动化运维平台的安全和权限如何控制?

个人认为应该注意以下几个方面:

二、自动化运维平台规划

问题1:自动化运维的建设应该如何规划?

这个问题没有固定的答案,分几步需要结合具体情况,最终的目的是要实现所有的端到端的交付。一般来说大体可以分为以下几个阶段:

问题2:自动化运维建设中,标准化的规范如何制定?

标准化需要结合公司的具体情况,一般而言有以下几个方面需要进行标准化(供参考):

问题3:在实际的运维环境中,我们该如何制定一套完整的自动化运维管理方案,用来支撑自动化运维工作?

制定自动化运维方案,需要考虑以下几个方面:

问题4:自动化运维的建设,需要分几阶段进行?应如何做规划?

这个问题没有固定的答案,分几步需要结合具体情况,最终的目的是要实现所有端到端的交付。一般来说大体可以分为以下几个阶段:

三、CMDB数据采集问题

问题1:CMDB建设过程中,如何实现自动发现?

CMDB的自动发现一般基于以下几种方式:

自动化发现一般是通过以上几种方式的组合来实现自动发现的目的。

问题2:自动化运维的建设中如何选择CMDB自动收集数据?

这个问题有点大了,具体到数据收集这个点上而言,CMDB的数据要想收集全面,需要从两个方面去考虑:一是CMDB采集工具自身的自动化采集能力,二是有些数据需要通过流程的方式来督促人工录入,例如业务系统名称、业务系统运维负责人、开发负责人、测试负责人这些信息自动采集工具是采集不到的,需要人工维护。

如果需要建设CMDB系统,有三种思路:

问题3:如何同时保证CMDB数据的实时性与一致性?

四、运维工具选型

问题1:自动化运维工具选择时,应该对哪些因素进行考量?

在选择自动化运维工具时笔者认为应该从以下几个方面考量:

问题2:自动化运维建设中的运维工具的规划和集成问题?

目前而言,大多数公司的确会存在这样的问题。在我看来问题之所以会存在,最主要原因是在前期缺乏一个宏观的整体规划,各个组织各自为政,没有统筹管理。

那么对于已经存在的现状要如何处理呢?在我看来要做以下几件事:

问题3:自动化运维产品如何选择?

自动化运维涉及的面非常广,一般大家谈到的包括资源的自助服务、监控、调度任务、应用发布等。那么在选择产品的时候需要考虑以下几点:

五、其他

问题1:AIOps和自动化运维是什么关系?

AIOps是自动化运维的一部分,是这几年随着AI火爆后开始出现的领域,自动化涉及运维操作的方方面面,AIOps仅仅是将AI技术应用到现有的Ops平台上,一般同时都会结合大数据技术一起使用。

问题2:是否可以结合当前的一些先进技术,如云计算、大数据等,使得自动化运维更加高效、智能?

结合云计算能力,可以快速扩容自动化运维平台的服务能力;结合大数据和人工智能技术,可以使自动化运维平台提供更强大的功能,就是现在很多人开始关注的AIOps。

风险需要人工来审核,比如基于大数据和人工智能技术对某种行为进行自动操作,那么在刚开始使用这个技术的时候需要人工进行double  check,并且对划定优先级和重要性级别。对于一个低优先级和低重要级的可以自动处理。

问题3:在运维的关注点上,传统企业与互联网企业有哪些不同?

传统行业与互联网在运维环节的不同在以下几个方面:

问题4:自动化运维平台如何能更好的贴近业务?及时发现业务的已经发生的风险和将要发生的风险?

自动化运维要更好的贴近业务首先需要收集业务的自动化运维需求,通过平台来满足业务的自动化运维需求,这是***步要做的工作。

其次需要对业务系统进行监控,在此基础上,需要和业务沟通风险指标,将风险指标进行量化,并配置到自动化运维平台的监控系统中,利用平台的监控能力进行724小时监控,当出现指标达到报警阈值的时候,就通过短信、微信、邮件等方式进行告警。

***,对于风险指标的配置可以通过大数据分析和AI的结合来逐步完善,形成一个适合每个业务系统的正向反馈链。

问题5:传统的IT运维与自动化运维有什么差别?

之所以会出现半自动化的运维,其实就是因为这些解决的都是点上的问题,都是把每个点的人工操作变成了脚本化或者平台化的自动动作,是离散的,本质上还是点而不是线,更不是面。真正的自动化运维是要达到端到端的自动化交付,是从开发到测试到运维全链路的自动化,去除人工操作。

举一个例子,创建一个Redis中间件,半自动化的做法是:

自动化的做法是:提交创建Redis需求,自动化平台做好所有的事情,然后调用邮件接口,通知申请者。

问题6:自动化运维自主研发的边界如何界定?既可以做到自主可控,又可以全面发挥和提升员工的能力?

自主可控有两种思路,一种是完全自研;另一种是基于一个采购的自动化运维平台进行二次开发。

对于***种情况,需要公司人员具备一定的开发能力,优势在于可以并充分结合本地需求,缺点是对人员要求比较高并且平台成型较慢;

对于第二种情况,需要采购一个平台技术栈实现与本公司开发或者运维人员匹配的平台,并且要求平台方开放源代码或者提供丰富的二次开发接口,优势是可以快速满足至少80%左右的需求,劣势是需要理解已有的代码,灵活性不够。

以上关于企业自动化运维落地的18个问题的解答,希望对各位朋友有所帮助~

关于如何针对性破解Linux自动化运维落地的18个关键问题问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

推荐阅读:
  1. Linux root 密码破解
  2. SACC2018:深度培训课程破解千万级项目落地方案

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

linux

上一篇:MySQL InnoDB有哪些相关的参数设置

下一篇:怎么使用gps校时母钟

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》