Cảm ơn bạn đã gửi yêu cầu! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Cảm ơn bạn đã gửi đặt chỗ! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Đề cương khóa học
Giới thiệu về AIOps Dự đoán
- Tổng quan về phân tích dự đoán trong hoạt động IT
- Nguồn dữ liệu cho việc dự đoán (nhật ký, chỉ số, sự kiện)
- Các khái niệm chính về dự báo chuỗi thời gian và các mẫu bất thường
Thiết kế Mô hình Dự đoán Sự cố
- Nhãn hóa sự cố lịch sử và hành vi hệ thống
- Chọn và huấn luyện mô hình (ví dụ: LSTM, Random Forest, AutoML)
- Đánh giá hiệu suất mô hình và xử lý false-positive
Thu thập Dữ liệu và Kỹ thuật Đặc trưng
- Thu nhận và căn chỉnh dữ liệu nhật ký và chỉ số cho đầu vào mô hình
- Trích xuất đặc trưng từ dữ liệu có cấu trúc và không có cấu trúc
- Xử lý nhiễu và dữ liệu thiếu trong các ống dẫn hoạt động
Tự động Hóa Phân tích Gốc Rễ (RCA)
- Liên kết đồ thị của dịch vụ và hạ tầng
- Sử dụng ML để suy ra nguyên nhân gốc rễ có khả năng từ chuỗi sự kiện
- Trực quan hóa RCA với bảng điều khiển có nhận thức về kiến trúc
Khắc phục Sự cố và Tự động Hóa Quy trình
- Tích hợp với các nền tảng tự động hóa (ví dụ: Ansible, Rundeck)
- Kích hoạt rollback, restart, hoặc điều hướng lưu lượng
- Kiểm toán và ghi chép các can thiệp tự động
Mở rộng Ống dẫn AIOps Thông minh
- MLOps cho khả năng quan sát: tái huấn luyện và quản lý phiên bản mô hình
- Chạy dự đoán theo thời gian thực trên các nút phân tán
- Thực hành tốt nhất để triển khai AIOps trong môi trường sản xuất
Trường hợp và Ứng dụng Thực tế
- Phân tích dữ liệu sự cố thực tế bằng các mô hình AIOps dự đoán
- Triển khai các ống dẫn RCA với dữ liệu tổng hợp và dữ liệu sản xuất
- Đánh giá các trường hợp sử dụng trong ngành: sự cố đám mây, bất ổn microservices, suy giảm mạng
Tóm tắt và Bước Kế tiếp
Yêu cầu
- Kinh nghiệm với các hệ thống giám sát như Prometheus hoặc ELK
- Kiến thức làm việc về Python và học máy cơ bản
- Thành thạo quy trình quản lý sự cố
Đối Tượng
- Kỹ sư tin cậy trang web cấp cao (SREs)
- Kiến trúc sư tự động hóa IT
- Người đứng đầu nền tảng DevOps và khả năng quan sát
14 Giờ học