Đề cương khóa học
Giải Thích Máy Học
- Các loại máy học – máy học có giám sát vs không giám sát
- Từ học thống kê đến máy học
- Quy trình khai thác dữ liệu: hiểu biết về kinh doanh, chuẩn bị dữ liệu, mô hình hóa, triển khai
- Chọn thuật toán phù hợp cho nhiệm vụ
- Phân loại quá mức và cân bằng sai lệch-biến đổi
Tổng Quát về Python và Thư viện Máy Học
- Tại sao sử dụng ngôn ngữ lập trình cho máy học
- Lựa chọn giữa R và Python
- Khóa học nhanh về Python và Jupyter Notebooks
- Thư viện Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Kiểm Tra và Đánh Giá Thuật Toán Máy Học
- Tổng quát hóa, phân loại quá mức và xác thực mô hình
- Các chiến lược đánh giá: phân chia dữ liệu, kiểm tra chéo, bootstrapping
- Đánh giá cho hồi quy: ME, MSE, RMSE, MAPE
- Đánh giá cho phân loại: độ chính xác, ma trận nhầm lẫn, lớp không cân bằng
- Hiển thị hiệu suất mô hình: đường cong lợi nhuận, đường cong ROC, đường cong nâng cao
- Lựa chọn mô hình và tìm kiếm lưới để điều chỉnh
Chuẩn Bị Dữ Liệu
- Nhập và lưu trữ dữ liệu trong Python
- Phân tích khám phá và thống kê tổng hợp
- Xử lý giá trị thiếu và ngoại lệ
- Tiêu chuẩn hóa, chuẩn hóa và chuyển đổi
- Mã hóa lại dữ liệu định tính và xử lý dữ liệu với pandas
Thuật Toán Phân Loại
- Phân loại nhị phân vs phân loại đa lớp
- Hồi quy lôgic và hàm phân biệt
- Naïve Bayes, k-nearest neighbors
- Cây quyết định: CART, Random Forests, Bagging, Boosting, XGBoost
- Máy hỗ trợ vectơ và nhân tử
- Các kỹ thuật học tập tập hợp
Hồi Quy và Dự Báo Số
- Hình phương tối thiểu và lựa chọn biến
- Các phương pháp điều chỉnh: L1, L2
- Hồi quy đa thức và mô hình không tuyến tính
- Cây hồi quy và splines
Mạng Nơron
- Giới thiệu về mạng nơron và học sâu
- Hàm kích hoạt, lớp và truyền ngược
- Mạng nơron đa lớp (MLP)
- Sử dụng TensorFlow hoặc PyTorch để mô hình hóa mạng nơron cơ bản
- Mạng nơron cho phân loại và hồi quy
Dự Báo Doanh Số và Phân Tích Dự Báo
- Dự báo dựa trên chuỗi thời gian vs hồi quy
- Xử lý dữ liệu có xu hướng mùa và xu hướng
- Xây dựng mô hình dự báo doanh số bằng các kỹ thuật máy học
- Đánh giá độ chính xác và sự không chắc chắn của dự báo
- Giải thích và truyền tải kết quả kinh doanh
Học Không Giám Sát
- Các kỹ thuật phân cụm: k-means, k-medoids, phân cụm hệ thống, SOMs
- Giảm chiều: PCA, phân tích yếu tố, SVD
- Kích thước nhiều chiều
Khai Thác Văn Bản
- Tiền xử lý văn bản và phân tích từ
- Tương tự từ, rút gốc và nhịp
- Phân tích cảm xúc và tần suất từ
- Hiển thị dữ liệu văn bản với đám mây từ
Hệ Thống Đề Xuất
- Lọc hợp tác dựa trên người dùng và mặt hàng
- Thiết kế và đánh giá các hệ thống đề xuất
Khai Thác Mẫu Liên Kết
- Bộ tập hợp hàng hóa thường xuyên và thuật toán Apriori
- Phân tích giỏ hàng và tỷ lệ nâng cao
Phát Hiện Ngoại Lệ
- Phân tích giá trị cực đoan
- Các phương pháp dựa trên khoảng cách và mật độ
- Phát hiện ngoại lệ trong dữ liệu nhiều chiều
Vụ Đề Tài Máy Học
- Hiểu vấn đề kinh doanh
- Tiền xử lý dữ liệu và xây dựng đặc trưng
- Lựa chọn mô hình và điều chỉnh tham số
- Đánh giá và trình bày kết quả
- Triển khai
Tổng Kết và Bước Tiếp Theo
Requirements
- Kiến thức cơ bản về các khái niệm học máy như học có giám sát và học không giám sát
- Thông thạo lập trình Python (biến, vòng lặp, hàm)
- Một số kinh nghiệm xử lý dữ liệu bằng các thư viện như pandas hoặc NumPy có lợi nhưng không bắt buộc
- Không cần kinh nghiệm trước đó với mô hình nâng cao hoặc mạng nơron
Đối tượng
- Nhà khoa học dữ liệu
- Nhà phân tích kinh doanh
- Kỹ sư phần mềm và chuyên gia kỹ thuật làm việc với dữ liệu
Đánh giá (2)
hệ sinh thái ML không chỉ có MLFlow mà còn có Optuna, hyperops, docker và docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Course - MLflow
Machine Translated
Tôi đã rất thích tham gia khóa đào tạo Kubeflow được tổ chức trực tuyến. Khóa học này giúp tôi củng cố kiến thức về các dịch vụ AWS, K8s và tất cả các công cụ devOps xung quanh Kubeflow, những nền tảng cần thiết để tiếp cận chủ đề một cách hiệu quả. Tôi muốn cảm ơn Malawski Marcin vì sự kiên nhẫn và chuyên nghiệp trong việc đào tạo và tư vấn về các thực hành tốt nhất. Malawski tiếp cận chủ đề từ nhiều góc độ khác nhau, sử dụng các công cụ triển khai khác nhau như Ansible, EKS kubectl, Terraform. Bây giờ tôi hoàn toàn tin tưởng rằng mình đang đi đúng hướng trong lĩnh vực ứng dụng này.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Course - Kubeflow
Machine Translated