抑制告警风暴是AIops非常实用的功能。
“报警风暴”是指在较短的时间内系统产生大量的报警信息,这些信息有的是由某些共同因素触发,彼此之间有一定的联系。规模较大的IT应用系统庞大而复杂,设备数量数以千计,任何微小的IT问题都有可能引发一场“报警风暴”。
由同一事故原因引发的大量报警信息对运行人员的工作产生了很大的影响,导致了运行人员对大量的报警信息的处理,这需要花费更多的时间来对其进行检查和处理,极大地降低了运维效率,严重的是会让真正重要的告警信息淹没其中,由于不能第一时间发现根本问题,耽误了故障处理时间。
其中,AIops采用算法模型结合固定规则,将告警消息进行告警压缩和告警合并,以保证核心告警内容(即不压缩核心告警内容)的前提下合并告警信息。
LinkSLA智能运维管家统一运维管理平台,通过对网络设备管理、服务器管理、存储设备管理、业务应用管理、无线管理、日志分析、办公设备/联网设备、动环系统等本地和异地网络的实时监控、自动巡检,精准采集、分析故障信息,判断重要数据性能指标,实现大规模数据中心的集中统一管理。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。