Đề cương khóa học

Giới thiệu về AIOps với Công cụ Mở Nguồn

  • Tổng quan về các khái niệm và lợi ích của AIOps
  • Prometheus và Grafana trong ngăn xếp theo dõi khả năng quan sát (observability stack)
  • Vị trí của học máy (ML) trong AIOps: phân tích dự đoán vs phản ứng

Cài đặt và Thiết lập Prometheus và Grafana

  • Cài đặt và cấu hình Prometheus để thu thập dữ liệu chuỗi thời gian
  • Tạo bảng điều khiển trong Grafana sử dụng chỉ số thời gian thực
  • Khám phá các xuất khẩu, đổi nhãn (relabeling), và phát hiện dịch vụ

Xử lý Dữ liệu cho ML

  • Lấy và chuyển đổi dữ liệu Prometheus
  • Sắp xếp tập dữ liệu cho việc phát hiện dị thường và dự báo
  • Sử dụng các phép biến đổi của Grafana hoặc chuỗipipeline của Python

Áp dụng Machine Learning để Phát Hiện Dị Thường

  • Các mô hình học máy cơ bản cho phát hiện ngoại lệ (ví dụ: Isolation Forest, One-Class SVM)
  • Huấn luyện và đánh giá các mô hình trên dữ liệu chuỗi thời gian
  • Vẽ biểu đồ các dị thường trong bảng điều khiển Grafana

Metric Forecasting với ML

  • Xây dựng các mô hình dự báo đơn giản (ARIMA, Prophet, giới thiệu LSTM)
  • Dự đoán tải hệ thống hoặc sử dụng tài nguyên
  • Sử dụng dự đoán cho cảnh báo sớm và quyết định mở rộng quy mô

Trực Quan Hóa ML với Cảnh Báo và Tự Động hóa

  • Xác định các quy tắc cảnh báo dựa trên đầu ra của học máy hoặc ngưỡng
  • Sử dụng Alertmanager và định tuyến thông báo
  • Kích hoạt kịch bản hoặc công việc tự động hóa khi phát hiện dị thường

Phát Triển và Áp Dụng AIOps

  • Tích hợp các công cụ theo dõi khả năng quan sát bên ngoài (ví dụ: ELK stack, Moogsoft, Dynatrace)
  • Xây dựng và thực thi mô hình học máy trong luồng theo dõi khả năng quan sát
  • Các nguyên tắc tốt nhất cho việc triển khai AIOps quy mô lớn

Tóm tắt và Bước Tiếp Theo

Requirements

  • Có hiểu biết về các khái niệm theo dõi hệ thống và khả năng quan sát
  • Kinh nghiệm sử dụng Grafana hoặc Prometheus
  • Quen thuộc với Python và các nguyên lý cơ bản của học máy

Đối tượng

  • Công trình sư khả năng quan sát
  • Đội ngũ cơ sở hạ tầng và DevOps
  • Kỹ sư kiến trúc nền tảng theo dõi và kỹ sư bảo đảm độ tin cậy trang web (SREs)
 14 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories