默认监控key与中文释义

发布时间:2020-07-27 15:12:09 作者:laihuadongcto
来源:网络 阅读:853

告警键值   -----------------------------------------------------中文释义--------------------------------------------------------------------------------------故障持续时间

AlertmanagerConfigInconsistentAlertManager群集xxxx的实例配置不同步。5m
AlertmanagerDownAlertManager已从普罗米修斯目标发现中消失。15m
AlertmanagerFailedReload重新加载AlertManager的配置失败10m
AlertmanagerMembersInconsistentAlertManager未找到群集的所有其他成员。5m
CPUThrottlingHighcpu节流高,使用低CPU限制,就算高峰期,整个集群还是有很多空闲资源15m
etcdGRPCRequestsSlowETCD GRPC请求缓慢10m
etcdHighCommitDurationsETCD提交时间过长10m
etcdHighFsyncDurationsETCD同步时间过长10m
etcdHighNumberOfFailedGRPCRequestsETCD失败的GRPC请求数太多10m
etcdHighNumberOfFailedHTTPRequestsETCD失败的HTTP请求数太多10m
etcdHighNumberOfFailedProposalsETCD失败的计划数量很多15m
etcdHighNumberOfLeaderChangesETCD Leader 变更次数多15m
etcdHTTPRequestsSlowETCD HTTP请求速度慢10m
etcdInsufficientMembersETCD成员不足3m
etcdMemberCommunicationSlowETCD成员通信缓慢10m
etcdNoLeaderETCD没有Leader1m
KubeAPIDownKubeAPI 宕掉或不存在15m
KubeAPIErrorsHighAPI服务器正在为请求的 值 返回错误。10m
KubeAPILatencyHighAPI服务器每秒钟延迟超过99%10m
KubeClientCertificateExpiration用于向APIServer进行身份验证的客户端证书将在7天内过期。5m
KubeClientErrors连接客户端API 错误15m
KubeControllerManagerDownKubeControllerManager 宕掉15m
KubeCPUOvercommit该集群cpu超出资源限额5m
KubeCronJobRunningCronJob 运行超过1小时1h
KubeDaemonSetMisScheduledDaemonSet调度错误,没有跑到正确的机器上10m
KubeDaemonSetNotScheduledDaemonSet 位设置运行在哪,也就是分配错误10m
KubeDaemonSetRolloutStuckDaemonSet 启动或滚动时卡住?15m
KubeDeploymentGenerationMismatchDeployment 生成部署不匹配,部署失败15m
KubeDeploymentReplicasMismatchDeployment 与预期的副本数不匹配的时间已超过一小时。1h
KubeJobCompletionJob 超过一小时才完成1h
KubeJobFailedJob 失败1h
KubeletDownKubelet宕掉了15m
KubeletTooManyPodspods数量太多,超过极限的110%15m
KubeMemOvercommit集群内存资源使用过度,无法再容忍故障节点漂移5m
KubeNodeNotReadynode故障超过1小时1h
KubePersistentVolumeErrors持久卷Volume 异常5m
KubePersistentVolumeFullInFourDays根据最近的采样,某Volume 讲在4天内填满5m
KubePersistentVolumeUsageCritical该持久卷使用权限不足,只能在xxx空间内使用1m
KubePodCrashLooping该pod CrashLoopBackOff 状态重启超过5分钟1h
KubePodNotReadypod处于未就绪状态超过一小时。1h
KubeQuotaExceededKube 使用超出配额15m
KubeSchedulerDownKubeScheduler 宕掉15m
KubeStatefulSetGenerationMismatchStatefulSet 错误,但尚未回滚15m
KubeStatefulSetReplicasMismatchstatefulset 副本集不匹配,超过15分钟15m
KubeStatefulSetUpdateNotRolledOutstatefulset 更新尚未结束(更新超时)15m
KubeStateMetricsDownKubeStateMetrics 宕掉15m
KubeVersionMismatchkube版本不匹配1h
NodeDiskRunningFullnode磁盘空间超过85%10m
NodeExporterDownNodeExporter 宕机15m
PrometheusConfigReloadFailedPrometheus重载配置失败10m
PrometheusDownPrometheus 宕机15m
PrometheusErrorSendingAlerts从Prometheus 向AlertManager 发送警报时出错10m
PrometheusNotConnectedToAlertmanagersPrometheus 不能连接AlertManager10m
PrometheusNotificationQueueRunningFullPrometheus的警报通知队列已满10m
PrometheusNotIngestingSamples信息存储opentsdb 异常10m
PrometheusOperatorDownPrometheusOperator 宕机15m
PrometheusOperatorNodeLookupErrorsPrometheusOperator 节点错误10m
PrometheusOperatorReconcileErrorsPrometheusOperator 有错误日志10m
PrometheusTargetScrapesDuplicate由于时间戳重复但值不同,拒绝了很多采集数据10m
PrometheusTSDBCompactionsFailing压缩实例块出现问题超过4个小时12h
PrometheusTSDBReloadsFailing磁盘重新加载数据块时出现问题超过4个小时12h
PrometheusTSDBWALCorruptionsTSDB 的wal 预写日志已损坏4h
TargetDown整体labels.job量下降了10%?10m


推荐阅读:
  1. 不同类型云服务器的释义
  2. redis如何监控失效的key

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

k8s

上一篇:SparkStreaming消费kafka数据

下一篇:Hadoop1.x版本升级Hadoop2.x

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》