Đề cương khóa học

Giới thiệu về Cảnh báo Nâng cao

  • Nguyên tắc chính của cảnh báo trong hệ thống IT
  • Tổng quan về Prometheus Alertmanager
  • Khả năng cảnh báo trong Grafana

Tạo Quy tắc Cảnh báo Nâng cao

  • Xác định quy tắc cảnh báo trong Prometheus
  • Sử dụng nhãn và chú thích cho các cảnh báo
  • Chiến lược nhóm và im lặng

Tích hợp Alertmanager với Hệ thống Bên ngoài

  • Cấu hình webhooks cho tích hợp bên ngoài
  • Tích hợp với các công cụ như Slack, PagerDuty và hệ thống email
  • Tùy chỉnh mẫu Alertmanager

Tự động hóa Phản ứng đối với Cảnh báo

  • Triển khai các quy trình giải quyết tự động
  • Tích hợp với công cụ điều phối (ví dụ: Ansible, Kubernetes)
  • Sử dụng script cho giải quyết vấn đề tự động

Trực quan hóa Cảnh báo trong Grafana

  • Thiết lập các bảng cảnh báo trong Grafana
  • Tùy chỉnh thông báo và ngưỡng cảnh báo
  • Cách tốt nhất để giám sát trạng thái cảnh báo

Quản lý Cảnh báo Số lượng Lớn

  • Xử lý hiệu quả các cơn bão cảnh báo
  • Tối ưu hóa hiệu suất Prometheus cho cảnh báo
  • Cân nhắc về khả năng mở rộng cho Alertmanager

Mở rộng và Kỹ thuật Nâng cao

  • Thiết lập cảnh báo phân tán với Prometheus và Alertmanager
  • Tích hợp với các giải pháp cảnh báo dựa trên đám mây
  • Khám phá các tính năng mới trong hệ sinh thái Grafana và Prometheus

Tóm tắt và Bước tiếp theo

Yêu cầu

  • Kinh nghiệm cơ bản với Grafana và Prometheus
  • Hiểu biết về các khái niệm giám sát IT
  • Quen thuộc với scripting hoặc lập trình cho tự động hóa

Đối tượng

  • Kỹ sư DevOps
  • Kỹ sư độ tin cậy trang web (SREs)
 14 Giờ

Số người tham gia


Giá cho mỗi học viên

Đánh giá (2)

Các khóa học sắp tới

Các danh mục liên quan