Grafana 告警总览和告警通知

告警可以在系统出现问题后立即识别问题。通过快速识别系统中的意外更改,可以最大限度地减少对服务的中断。

告警通常分为两部分,

  • 告警规则:告警规则是由 Grafana 定期评估的一个或多个条件定义的规则。
  • 通知渠道:当告警规则的条件被满足时,Grafana 会通知为该报警配置的通知渠道。

Grafana 的告警规则只能在 Graph Panel 里进行配置,不支持其他的 Panel 类型。

告警执行

告警规则在 Grafana 的后端执行,目前(v7.2)只支持一部分的数据源, 包括 Graphite, Prometheus, InfluxDB, Elasticsearch, Google Cloud Monitoring, Cloudwatch, Azure Monitor, MySQL, PostgreSQL, MSSQL, OpenTSDB, Oracle, and Azure Data Explorer.

暂时不支持 Zabbix 、CMS Grafana Service 等数据源。

告警引擎的指标

告警引擎发布一些关于自身的内部指标。你可以阅读更多关于Grafana如何发布内部指标的信息。

Description Type Metric name
Total number of alerts counter alerting.active_alerts
Alert execution result counter alerting.result
Notifications sent counter counter alerting.notifications_sent
Alert execution timer timer alerting.execution_time

支持的通知组件列表

Name Type Supports images Support alert rule tags
DingDing dingding yes, external only no
Discord discord yes no
Email email yes no
Google Hangouts Chat googlechat yes, external only no
Hipchat hipchat yes, external only no
Kafka kafka yes, external only no
Line line yes, external only no
Microsoft Teams teams yes, external only no
OpsGenie opsgenie yes, external only yes
Pagerduty pagerduty yes, external only yes
Prometheus Alertmanager prometheus-alertmanager yes, external only yes
Pushover pushover yes no
Sensu sensu yes, external only no
Slack slack yes no
Telegram telegram yes no
Threema threema yes, external only no
VictorOps victorops yes, external only no
Webhook webhook yes, external only yes
Zenduty webhook yes, external only yes

results matching ""

    No results matching ""