Grafana 告警总览和告警通知
告警可以在系统出现问题后立即识别问题。通过快速识别系统中的意外更改,可以最大限度地减少对服务的中断。
告警通常分为两部分,
- 告警规则:告警规则是由 Grafana 定期评估的一个或多个条件定义的规则。
- 通知渠道:当告警规则的条件被满足时,Grafana 会通知为该报警配置的通知渠道。
Grafana 的告警规则只能在 Graph Panel 里进行配置,不支持其他的 Panel 类型。
告警执行
告警规则在 Grafana 的后端执行,目前(v7.2)只支持一部分的数据源, 包括 Graphite, Prometheus, InfluxDB, Elasticsearch, Google Cloud Monitoring, Cloudwatch, Azure Monitor, MySQL, PostgreSQL, MSSQL, OpenTSDB, Oracle, and Azure Data Explorer.
暂时不支持 Zabbix 、CMS Grafana Service 等数据源。
告警引擎的指标
告警引擎发布一些关于自身的内部指标。你可以阅读更多关于Grafana如何发布内部指标的信息。
Description | Type | Metric name |
---|---|---|
Total number of alerts | counter | alerting.active_alerts |
Alert execution result | counter | alerting.result |
Notifications sent counter | counter | alerting.notifications_sent |
Alert execution timer | timer | alerting.execution_time |
支持的通知组件列表
Name | Type | Supports images | Support alert rule tags |
---|---|---|---|
DingDing | dingding | yes, external only | no |
Discord | discord | yes | no |
yes | no | ||
Google Hangouts Chat | googlechat | yes, external only | no |
Hipchat | hipchat | yes, external only | no |
Kafka | kafka | yes, external only | no |
Line | line | yes, external only | no |
Microsoft Teams | teams | yes, external only | no |
OpsGenie | opsgenie | yes, external only | yes |
Pagerduty | pagerduty | yes, external only | yes |
Prometheus Alertmanager | prometheus-alertmanager | yes, external only | yes |
Pushover | pushover | yes | no |
Sensu | sensu | yes, external only | no |
Slack | slack | yes | no |
Telegram | telegram | yes | no |
Threema | threema | yes, external only | no |
VictorOps | victorops | yes, external only | no |
Webhook | webhook | yes, external only | yes |
Zenduty | webhook | yes, external only | yes |