Đề cương khóa học

Giới thiệu về AIOps

  • AIOps là gì và tại sao nó quan trọng
  • Kiểm soát truyền thống so với khả năng quan sát được thúc đẩy bởi AIOps
  • Cấu trúc và thành phần chính của AIOps

Thu thập và Chuẩn hóa Dữ liệu Hoạt động

  • Các loại dữ liệu quan sát: chỉ số, nhật ký và đường dẫn
  • Nhập dữ liệu từ nhiều nguồn (máy chủ, container, đám mây)
  • Sử dụng các đại lý và xuất khẩu (Prometheus, Beats, Fluentd)

Correlation và Phát hiện Abnormality

  • Correlation chuỗi thời gian và phương pháp thống kê
  • Sử dụng mô hình học máy để phát hiện abnormality
  • Phát hiện sự cố trong hệ thống phân tán

Thông Báo và Giảm Noise

  • Thiết kế quy tắc thông báo thông minh và ngưỡng
  • Ứng dụng, loại bỏ trùng lặp và nhóm thông báo
  • Tích hợp với Alertmanager, Slack, PagerDuty hoặc Opsgenie

Phân tích Nguyên Nhân Căn Bản và Biểu đồ

  • Sử dụng bảng điều khiển để biểu đồ chỉ số và phát hiện xu hướng
  • Khám phá sự kiện và thời gian biểu cho phân tích nguyên nhân căn bản (RCA)
  • Trace vấn đề qua các lớp bằng công cụ trace phân tán

Tự động hóa và Giải quyết Sự cố

  • Khởi chạy script tự động hoặc quy trình làm việc từ sự cố
  • Tích hợp với hệ thống ITSM (ServiceNow, Jira)
  • Trường hợp sử dụng: tự chữa lành, mở rộng và định tuyến lưu lượng

Hệ thống Mở Nguồn và Thương mại của AIOps

  • Tổng quan về công cụ: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Tiêu chí đánh giá để lựa chọn một nền tảng AIOps
  • Demo và thực hành với một stack đã chọn

Tóm tắt và Bước Tiếp theo

Requirements

  • Hiểu biết về hoạt động IT và các khái niệm theo dõi hệ thống
  • Kinh nghiệm sử dụng công cụ hoặc bảng điều khiển theo dõi
  • Hiểu biết về định dạng cơ bản của nhật ký và số liệu

Đối tượng tham gia

  • Đội ngũ vận hành chịu trách nhiệm về hạ tầng và ứng dụng
  • Kỹ sư bảo đảm tính sẵn sàng (SREs)
  • Đội ngũ theo dõi và quan sát IT
 14 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories