7你必须监控的库伯内特斯顶级健康指标

7你必须监控的库伯内特斯顶级健康指标

时间:2021-3-12 作者:admin

Kubernetes是当今集装箱管理和自动化最流行的选择之一。高效的Kubernetes设置每天都会生成无数的新指标,这使得监视集群的健康状况非常具有挑战性。您可能会发现自己仔细研究了几个不同的度量标准,而不完全确定哪些是最有洞察力的,哪些是最值得关注的。

尽管这似乎是一项艰巨的任务,但您可以通过了解这些度量中的哪一个为您的Kubernetes集群的健康提供正确的见解来实现运行。尽管有一些可观察的平台可以帮助您监视Kubernetes集群的正确度量标准,但是确切地知道要观察哪些指标将有助于您满足监视需求。在本文中,我们将向您介绍几个库伯奈特斯健康指标,这些指标都是我们列出的最重要的指标。

1.碰撞环

崩溃循环是你最不想被发现的。在崩溃循环期间,您的应用程序在吊舱开始时崩溃,并在循环中不断崩溃和重新启动。多个原因可能导致崩溃循环,因此很难确定根本原因。在崩溃循环发生时发出警报可以帮助您快速缩小原因列表,并采取紧急措施保持应用程序的活动。

2.集群状态度量

另一个需要注意的关键指标是集群状态。您应该能够跟踪集群中所有节点的聚合资源使用情况,包括所需的荚、节点状态、当前的荚、不可用的荚和可用的荚。监视集群状态并评估结果度量可以让您了解集群的总体健康状况。您还将随时了解节点和吊舱的问题。根据状态度量,您可以决定是否需要调查更大的问题或扩展集群。

使用此度量,还可以计算节点正在使用的资源数量。您还将看到您有多少节点,其中有多少节点仍然可用,这反过来使您能够准确地知道您要支付的是什么,以及是否需要调整所使用节点的数量和大小。

3.磁盘和内存压力

磁盘压力是一种度量,它根据您在配置中设置的使用阈值来指示节点是太快地利用磁盘空间还是过多地利用磁盘空间。监视此度量使您能够确定何时需要添加其他磁盘空间。它还可能表明您的应用程序没有按照设计的方式工作,并且使用的磁盘空间比所需的要多。

内存压力是表示节点正在使用的内存量的度量。监视此度量有助于防止节点耗尽内存,并指示具有过多分配内存资源的节点,这些资源不必要地增加了基础设施的开销。较高的内存压力也可以判断您的应用程序是否正在泄漏内存。

4.网络不可用

你会立刻想知道你的网络有什么问题。毕竟,您的节点和应用程序需要网络连接才能工作。当问题妨碍您的节点的网络连接时,此度量将让您知道。这些问题可能是由于网络配置不当或硬件存在物理连接问题造成的。

5.CPU利用

了解节点使用多少CPU周期对于确保节点明智地使用分配的CPU资源至关重要。如果应用程序或节点耗尽了所有分配的处理资源,则必须增加CPU分配或向集群添加其他节点。如果您的节点或应用程序使用的CPU周期比您所支付的要少,则必须重新评估CPU分配,并在必要时降级。监视CPU利用率可以帮助您更好地掌握此类场景,并更有效地运行部署。

6.工作失败

库伯奈特斯·乔布斯是一位控制器,确保吊舱在一定时间内执行,并在达到预定目标后立即退休。有时作业不能成功完成–要么是由于节点重新启动,要么是进入崩溃循环,甚至是资源耗尽。不管是哪种情况,你都想在工作失败发生时尽快了解它们。

作业失败并不一定意味着您的应用程序不可访问–但是忽略作业失败可能会导致部署中更重要的问题。密切监测工作失败有助于及时恢复和今后避免这些问题。

7.DaemonSets

DaemonSets确保您的Kubernetes集群中的所有节点都运行一个您喜欢的特定荚的副本。当您希望在所有现有节点和添加到集群中的任何新节点上运行监视服务荚时,DaemonSet特别有用。

监视DaemonSet可以帮助您了解集群的健康状况。理想情况下,集群中观察到的DaemonSet数量应该与所需的DaemonSet数量相匹配。如果您注意到这些数字不相同,那么至少有一个DaemonSet可能失败了。

监测Kubernetes健康计量

保持在所有Kubernetes健康指标之上,对于确保早期发现、预防和及时诊断可能导致集群崩溃的问题至关重要。用正确的监控策略武装自己,了解Kubernetes要关注的健康指标,以及正确的监控工具集是确保生产环境始终处于启动和运行状态的最佳方法。

如果你想需要小程序开发,可以点以下链接进行询问

福州小程序开发

版权所有:https://www.eraycloud.com 转载请注明出处