Đề cương khóa học

Giới thiệu về AIOps

  • AIOps là gì và tại sao nó quan trọng
  • Kiểm soát truyền thống so với khả năng quan sát được thúc đẩy bởi AIOps
  • Cấu trúc và thành phần chính của AIOps

Thu thập và Chuẩn hóa Dữ liệu Hoạt động

  • Các loại dữ liệu quan sát: chỉ số, nhật ký và đường dẫn
  • Nhập dữ liệu từ nhiều nguồn (máy chủ, container, đám mây)
  • Sử dụng các đại lý và xuất khẩu (Prometheus, Beats, Fluentd)

Correlation và Phát hiện Abnormality

  • Correlation chuỗi thời gian và phương pháp thống kê
  • Sử dụng mô hình học máy để phát hiện abnormality
  • Phát hiện sự cố trong hệ thống phân tán

Thông Báo và Giảm Noise

  • Thiết kế quy tắc thông báo thông minh và ngưỡng
  • Ứng dụng, loại bỏ trùng lặp và nhóm thông báo
  • Tích hợp với Alertmanager, Slack, PagerDuty hoặc Opsgenie

Phân tích Nguyên Nhân Căn Bản và Biểu đồ

  • Sử dụng bảng điều khiển để biểu đồ chỉ số và phát hiện xu hướng
  • Khám phá sự kiện và thời gian biểu cho phân tích nguyên nhân căn bản (RCA)
  • Trace vấn đề qua các lớp bằng công cụ trace phân tán

Tự động hóa và Giải quyết Sự cố

  • Khởi chạy script tự động hoặc quy trình làm việc từ sự cố
  • Tích hợp với hệ thống ITSM (ServiceNow, Jira)
  • Trường hợp sử dụng: tự chữa lành, mở rộng và định tuyến lưu lượng

Hệ thống Mở Nguồn và Thương mại của AIOps

  • Tổng quan về công cụ: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Tiêu chí đánh giá để lựa chọn một nền tảng AIOps
  • Demo và thực hành với một stack đã chọn

Tóm tắt và Bước Tiếp theo

Yêu cầu

  • Hiểu biết về hoạt động IT và các khái niệm theo dõi hệ thống
  • Kinh nghiệm sử dụng công cụ hoặc bảng điều khiển theo dõi
  • Hiểu biết về định dạng cơ bản của nhật ký và số liệu

Đối tượng tham gia

  • Đội ngũ vận hành chịu trách nhiệm về hạ tầng và ứng dụng
  • Kỹ sư bảo đảm tính sẵn sàng (SREs)
  • Đội ngũ theo dõi và quan sát IT
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan