云计算基础知识有哪些 如何排查Linux系统故障

发布时间:2020-07-31 01:53:20 作者:千锋郑州
来源:网络 阅读:323

  云计算基础知识有哪些?如何排查Linux系统故障?和Linux打交道、在服务器上分析系统性能是每个Linux运维工程师或云计算开发人员的工作日常,而性能优化被看做是软件系统中最有挑战的工作之一,让工作人员很是头疼。下面就为大家分享云计算学习中快速排查线上Linux系统故障的方法。

  Linux性能优化是个系统工程,除了要学习那些基础知识点之外,还有2点比较重要:1)掌握性能优化的思路和方法,尝试大量Linux性能工具;2)从学习到输出,即不断实践、从实践中总结经验。只有理论知识与实践相结合,你才能把观察到的性能问题跟系统原理关联起来。

云计算基础知识有哪些 如何排查Linux系统故障


  线上Linux系统故障的原因通常包括以下几个方面:

  一、CPU使用率过高

  一个应用占用CPU很高,除了确实是计算密集型应用之外,通常原因都是出现了死循环。排查技巧如下:

  1)通过top命令定位占用CPU高的进程。比如进程PID41843占用CPU过高,明显存在问题,定位到了进程id。当然如果你想只观察进程PID41843的CPU和内存以及负载情况,可以使用命令:top -p 41843

  2)通过top命令定位问题进程中每个线程占用CPU情况。使用命令:top -p 41843 -H

  3)通过jstack 命令定位问题代码。比如发现线程PID41892占用的CPU过高,就将这个PID转换成16进制,其中PID41892转化成16进制为a3a4。使用如下命令命令定位问题代码:jstack 41892 | grep a3a4

  二、内存占用过高

  在Java开发中,常见的异常及解决方法如下:

  java.lang.OutOfMemoryError: PermGen space

  异常出现原因:应用中有很多CLASS的话,就很可能出现PermGen space错误。WEB或者APP用了大量的第三方jar, 其大小超过了jvm默认的大小(4M)就会产生此错误信息。

  解决方法:调整PermSize、MaxPermSize的大小;减少jar重复使用,重复占用内存。

  java.lang.OutOfMemoryError: Java heap space

  异常出现原因:在JVM中,如果98%的时间是用于GC且可用的Heap size 不足2%的时候将抛出此异常信息。提示:Heap Size 最大不要超过可用物理内存的80%,一般的要将-Xms和-Xmx选项设置为相同,而-Xmn为1/4的-Xmx值。

  异常原因排查步骤:

  1)通过jstat命令查询gc情况。通过top命令定位到内存占用过高的进程PID后,排查该进程的GC情况,命令:jstat -gccause 41843 2000

  2)通过jmap命令查询进程实体类内存占用情况。如果步骤1中发现,gc非常频繁,则可以使用jmap命令查询进程实体类内存占用情况。命令:jmap -histo:live 41843 | head -n 100

  3)通过jmap命令查询进程堆的使用情况。如果以上没有查出问题,可以看看进程中,新生代、老年代、永久代的使用情况。命令:jmap -heap 41843

  如果发现频繁的gc是因为新生代、老年代、永久代分配的大小有问题,则可以通过修改设置解决。

  永久代解决方法:调整PermSize、MaxPermSize的大小;减少jar重复使用,重复占用内存。

  新生代、老年代解决方法:调整Xms -Xmx -Xmn的大小。

  人在一定程度上是感性动物,好的学习氛围会在一定程度上督促你学习进步。俗话说“选择大于努力,坚持大于聪明”正是如此。


推荐阅读:
  1. 云计算常见面试题有哪些
  2. 云计算必学哪些基础知识 怎么解析Linux知识点

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

云计算基础 inux nux

上一篇:swift手工搭建

下一篇:Spring 系列,第 3 部分: 进入 Spring MVC

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》