Cảm ơn bạn đã gửi yêu cầu! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Cảm ơn bạn đã gửi đặt chỗ! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Đề cương khóa học
Giới thiệu về AIOps với Công cụ Mở Nguồn
- Tổng quan về các khái niệm và lợi ích của AIOps
- Prometheus và Grafana trong bộ栈溢出错误,我会尝试用更简洁的方式继续翻译剩余内容。
Thiết lập Prometheus và Grafana
- Cài đặt và cấu hình Prometheus cho việc thu thập dữ liệu chuỗi thời gian
- Tạo bảng điều khiển trong Grafana sử dụng các chỉ số thời gian thực
- Khám phá người xuất bản, đổi nhãn và phát hiện dịch vụ
Xử lý Dữ liệu cho ML
- Trích xuất và biến đổi các đo lường Prometheus
- Chuẩn bị dữ liệu cho việc phát hiện lỗi bất thường và dự đoán
- Sử dụng chuyển đổi của Grafana hoặc luồng Python
Áp dụng Machine Learning để Phát hiện Lỗi Bất thường
- Các mô hình ML cơ bản cho việc phát hiện ngoại lệ (ví dụ: Isolation Forest, One-Class SVM)
- Huấn luyện và đánh giá các mô hình trên dữ liệu chuỗi thời gian
- Hiển thị ngoại lệ trong bảng điều khiển của Grafana
Forecasting Đo lường với ML
- Tạo các mô hình dự đoán đơn giản (ARIMA, Prophet, giới thiệu LSTM)
- Dự đoán tải hệ thống hoặc sử dụng tài nguyên
- Sử dụng dự đoán để báo động sớm và quyết định mở rộng
Hoàn thiện ML với Báo động và Tự động hóa
- Xác định quy tắc báo động dựa trên đầu ra của ML hoặc ngưỡng
- Sử dụng Alertmanager và định tuyến thông báo
- Gây ra các kịch bản hoặc luồng công việc tự động hóa khi phát hiện lỗi bất thường
Mở rộng và Hoạt động AIOps
- Hoàn thiện các công cụ quan sát bên ngoài (ví dụ: bộ đệm ELK, Moogsoft, Dynatrace)
- Chuyển đổi mô hình ML vào luồng quan sát
- Các nguyên tắc tốt nhất để hoạt động AIOps ở quy mô lớn
Tóm tắt và Bước tiếp theo
Yêu cầu
- Hiểu biết về các khái niệm giám sát hệ thống và khả năng quan sát (observability)
- Kinh nghiệm sử dụng Grafana hoặc Prometheus
- Thạo Python và nguyên tắc cơ bản của học máy
Đối tượng tham gia
- Kỹ sư khả năng quan sát (observability engineers)
- Đội ngũ hạ tầng và DevOps
- Kiến trúc sư nền tảng giám sát và kỹ sư đảm bảo độ tin cậy hệ thống (SREs)
14 Giờ học