|
|
|
@ -1,4 +1,4 @@
|
|
|
|
|
### 基于Zabbix 6.0监控系统实现智能运维
|
|
|
|
|
### 基于Zabbix 6.0监控系统实现智能运维演示系统
|
|
|
|
|
|
|
|
|
|
该项目采用Zabbix 6.0对主机和服务器进行监控,并根据监控数据设置触发器,从而实现异常检测并设立多种报警方式,包括QQ邮箱报警、企业微信报警和钉钉报警等多种方式。从监控,到异常检测告警,针对压缩后告警进行根因分析,并结合知识图谱(开源模型)指导行动和修复故障。
|
|
|
|
|
|
|
|
|
@ -10,7 +10,7 @@
|
|
|
|
|
4. **多个条件组合触发器:** 触发器基于多个监控项的组合条件。例如,当CPU使用率超过90%并且内存使用率超过80%时触发警报。
|
|
|
|
|
5. **持续监控触发器:** 触发器通常有一个延迟时间,只有在一定时间范围内满足条件才会触发警报,以避免误报。
|
|
|
|
|
|
|
|
|
|
处理异常时,项目先基于异常进行根因分析:
|
|
|
|
|
处理异常时,项目根据大量故障及其对应原因的带标签数据,运用知识图谱强大的逻推理能力,实现对异常原因的分析,并进一步生成告警信息,辅助运维人员对系统实时不间断调控。
|
|
|
|
|
|
|
|
|
|
#### Zabbix介绍
|
|
|
|
|
|
|
|
|
@ -46,8 +46,37 @@ Zabbix 由几个主要的功能组件组成,分别是:
|
|
|
|
|
* **功能:** Zabbix Server具有更强大的功能,包括警报、报表、可视化等。Proxy主要负责数据收集和转发。
|
|
|
|
|
* **扩展性:** Zabbix Proxy允许在大规模和分布式环境中进行扩展,通过将任务分发到多个Proxy来提高性能。Zabbix Server则是监控系统的核心,不同的Proxy可以协同工作以支持更大规模的监控。
|
|
|
|
|
|
|
|
|
|
#### 演示系统简介
|
|
|
|
|
|
|
|
|
|
以监控nginx服务的终止和重启并向**企业微信**提出告警为例
|
|
|
|
|
|
|
|
|
|
1. 下图可以看到nginx服务终止,并在运维人员恢复后重启的过程:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\389217b5f67882e0b8336f6c918aeae.png" alt="389217b5f67882e0b8336f6c918aeae" style="zoom:60%;" />
|
|
|
|
|
|
|
|
|
|
2. 下图可以看到企业微信收到了nginx服务终止的告警以及运维人员恢复后的提示:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\ef11ab30a38e2e87a0b4339b7973b19.jpg" alt="ef11ab30a38e2e87a0b4339b7973b19" style="zoom:25%;" />
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\5bd607b5d264b541d87273de20e6d8d.jpg" alt="5bd607b5d264b541d87273de20e6d8d" style="zoom:25%;" />
|
|
|
|
|
|
|
|
|
|
检测的CPU使用率如下,超过10%会告警。受篇幅原因不展示告警信息:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\2da4919f3336047f11e1859c6e16eee.png" alt="2da4919f3336047f11e1859c6e16eee" style="zoom:60%;" />
|
|
|
|
|
|
|
|
|
|
检测的网络带宽速率如下,超过400bps会告警。受篇幅原因不展示告警信息:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\498738aad1c27901565ded0ec35837e.png" alt="498738aad1c27901565ded0ec35837e" style="zoom:60%;" />
|
|
|
|
|
|
|
|
|
|
检测的内存使用率如下,超过50%会告警。受篇幅原因不展示告警信息:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\755cdb0399dfe0457104a560b3ac92f.png" alt="755cdb0399dfe0457104a560b3ac92f" style="zoom:60%;" />
|
|
|
|
|
|
|
|
|
|
检测的硬盘使用率如下,超过50%会告警。受篇幅原因不展示告警信息:
|
|
|
|
|
|
|
|
|
|
<img src="C:\Users\hxy\AppData\Local\Temp\WeChat Files\dde6505aafb4c8db5575f54a50dc77e.png" alt="dde6505aafb4c8db5575f54a50dc77e" style="zoom:60%;" />
|
|
|
|
|
|
|
|
|
|
#### 在小组实验过程中,有很多有意思的现象:
|
|
|
|
|
|
|
|
|
|
1. Zabbix Server与Zabbix Agent在不同网段,在Server端连接时,会因为网络波动,造成时而连接时而连接不了的情况,容易形成波动较大数据。
|
|
|
|
|
2. VMware虚拟机网段与主机网段不一致,但可以通过主机IP地址进行不同地址Zabbix Server与Zabbix Agent进行通信。
|
|
|
|
|
3.
|
|
|
|
|