Đề cương khóa học
Module 1: Core Python for ML Workflows
• Khởi động khóa học và thiết lập môi trường
Đồng bộ mục tiêu và thiết lập môi trường làm việc Python ML có thể tái tạo
• Các yếu tố cơ bản của ngôn ngữ Python (đường tắt)
Ôn lại cú pháp, luồng điều khiển, hàm và các mẫu thường được sử dụng trong mã nguồn ML
• Cấu trúc dữ liệu cho ML
Danh sách, từ điển, tập hợp và bộ đôi cho các đặc trưng, nhãn và siêu dữ liệu
• Comprehensions và công cụ hàm
Biểu diễn các phép biến đổi bằng cách sử dụng comprehensions và hàm bậc cao
• Object-oriented Python cho các nhà phát triển ML
Lớp, phương thức, hợp thành và các quyết định thiết kế thực tế
• dataclasses và mô hình nhẹ
Các thùng chứa có kiểu cho cấu hình, ví dụ và kết quả
• Decorators và context managers
Thời gian, bộ đệm, ghi log và các mẫu thực thi an toàn nguồn
• Làm việc với tệp và đường dẫn
Xử lý tập dữ liệu robust và các định dạng chuỗi hóa
• Ngoại lệ và lập trình phòng thủ
Viết các kịch bản ML an toàn và minh bạch khi gặp lỗi
• Modules, packages và cấu trúc dự án
Tổ chức các mã nguồn ML có thể tái sử dụng
• Kiểu hóa và chất lượng mã
Gợi ý kiểu, tài liệu và cấu trúc thân thiện với lint
Module 2: Numerical Python, SciPy và Xử lý Dữ liệu
• Nền tảng NumPy cho tính toán vector
Các thao tác mảng hiệu quả và lập trình hiệu suất
• Chỉ mục, cắt, phát sóng và hình dạng
Xử lý tensor an toàn và suy luận về hình dạng
• Các yếu tố cơ bản của đại số tuyến tính với NumPy và SciPy
Các thao tác ma trận ổn định và phân rã được sử dụng trong ML
• Đào sâu SciPy
Thống kê, tối ưu hóa, fitting đường cong và ma trận thưa thớt
• Pandas cho dữ liệu ML bảng
Làm sạch, nối, tổng hợp và chuẩn bị tập dữ liệu
• scikit-learn đào sâu
Giao diện ước lượng, pipelines và quy trình làm việc có thể tái tạo
• Các yếu tố cơ bản của trực quan hóa
Các biểu đồ chẩn đoán cho việc khám phá dữ liệu và hành vi mô hình
Module 3: Mô Hình Lập Trình để Xây Dựng Ứng Dụng ML
• Từ notebook đến dự án có thể duy trì
Phân rã mã exploratory thành các gói có cấu trúc
• Quản lý cấu hình
Tham số bên ngoài và xác thực khi khởi chạy
• Ghi log, cảnh báo và khả năng quan sát
Ghi log có cấu trúc cho các hệ thống ML có thể gỡ lỗi
• Các thành phần có thể tái sử dụng với OOP và hợp thành
Thiết kế các transformer và predictor có thể mở rộng
• Các mô hình thiết kế thực tế
Pipeline, Factory hay Registry, Strategy và Adapter patterns
• Kiểm tra dữ liệu và kiểm tra lược đồ
Ngăn chặn các vấn đề dữ liệu âm thầm
• Hiệu suất và phân tích hiệu suất
Xác định các điểm nghẽn và áp dụng các kỹ thuật tối ưu hóa
• Đầu vào và giao diện suy luận của mô hình
Kiên trì an toàn và các giao diện dự đoán rõ ràng
• Xây dựng mini end-to-end
Đường ống ML phong cách sản xuất với cấu hình và ghi log
Module 4: Học Thống Kê cho Dữ liệu Bảng, Văn bản và Hình ảnh
• Nền tảng đánh giá
Chia tập huấn luyện và validation, chéo kiểm thực sự và các chỉ số liên quan đến kinh doanh
• Học ML bảng nâng cao
GLMs có quy định, các tập hợp cây và tiền xử lý không bị rò rỉ
• Xác định và độ không chắc chắn
Khoảng cách Platt, hồi quy isotonic, bootstrap và dự đoán conformal
• Các phương pháp NLP cổ điển
Cân nhắc về tokenization, TF-IDF, các mô hình tuyến tính và Naive Bayes
• Xây dựng chủ đề
Nền tảng LDA và các hạn chế thực tế
• Xử lý hình ảnh cổ điển
HOG, PCA và các đường ống dựa trên đặc trưng
• Phân tích lỗi
Phát hiện sự thiên lệch, nhiễu nhãn và các mối tương quan ngẫu nhiên
• Phòng thí nghiệm thực hành
Đường ống bảng không bị rò rỉ
So sánh và diễn giải cơ sở văn bản
Cơ sở hình ảnh cổ điển với phân tích thất bại có cấu trúc
Module 5: Mạng Nơ-ron cho Dữ liệu Bảng, Văn bản và Hình ảnh
• Nắm vững vòng lặp huấn luyện
Các vòng lặp PyTorch sạch sẽ với AMP, cắt và khả năng tái tạo
• Tối ưu hóa và quy định
Khởi tạo, chuẩn hóa, tối ưu hóa và lịch trình
• Độ chính xác hỗn hợp và mở rộng
Xác đống gradient và các chiến lược checkpointing
• Mạng nơ-ron bảng
Nhúng danh mục, tính năng chéo và các nghiên cứu loại bỏ
• Mạng nơ-ron văn bản
Nhúng, CNNs, BiLSTM hoặc GRU và xử lý chuỗi
• Mạng nơ-ron hình ảnh
Các yếu tố cơ bản của CNN và các kiến trúc kiểu ResNet
• Phòng thí nghiệm thực hành
Khung huấn luyện có thể tái sử dụng
So sánh NN bảng với boosting
CNN với tăng cường và thí nghiệm lịch trình
Module 6: Các Kiến Trúc Nơ-ron Nâng Cao
• Chiến lược học chuyển giao
Mô hình đóng băng và mở, tỷ lệ học phân biệt
• Kiến trúc Transformer cho văn bản
Nội bộ self-attention và các cách tiếp cận fine-tuning
• Nền tảng hình ảnh và dự đoán dày đặc
ResNet, EfficientNet, Vision Transformers và các khái niệm U-Net
• Kiến trúc bảng nâng cao
TabTransformer, FT-Transformer và các mạng Deep and Cross
• Xem xét thời gian
Cắt chia thời gian và phát hiện sự thay đổi biến phụ
• PEFT và các kỹ thuật hiệu quả
LoRA, distillation và cân nhắc về quantization
• Phòng thí nghiệm thực hành
Fine-tuning mô hình text transformer đã được tiền huấn luyện
Fine-tuning mô hình hình ảnh đã được tiền huấn luyện
So sánh Tabular transformer với GBDT
Module 7: Hệ Thống AI Sinh Ra
• Cơ bản về prompting
Promoting có cấu trúc và sinh ra có kiểm soát
• Nền tảng LLM
Tokenization, điều chỉnh chỉ dẫn và giảm thiểu ảo hóa
• Sinh ra được hỗ trợ bởi truy xuất
Chia nhỏ, nhúng, tìm kiếm hỗn hợp và các chỉ số đánh giá
• Chiến lược fine-tuning
LoRA và QLoRA với các kiểm soát chất lượng dữ liệu
• Mô hình diffuser
Trực giác diffuser tiềm ẩn và sự thích ứng thực tế
• Dữ liệu bảng tổng hợp
CTGAN và các xem xét về quyền riêng tư
• Phòng thí nghiệm thực hành
Ứng dụng RAG phong cách sản xuất nhỏ
Xác thực đầu ra có cấu trúc với thực thi lược đồ
Thí nghiệm diffuser tùy chọn
Module 8: AI Agents và MCP
• Thiết kế vòng lặp agent
Quan sát, lập kế hoạch, hành động, phản ánh và duy trì
• Kiến trúc agent
ReAct, plan-and-execute và điều phối đa agent
• Quản lý bộ nhớ
Phong cách episodic, semantic và scratchpad
• Tích hợp công cụ và an toàn
Hợp đồng công cụ, cát cát và phòng thủ chống prompt injection
• Khung đánh giá
Các dấu vết có thể tái hiện, bộ công việc và kiểm thử hồi quy
• MCP và khả năng tương tác dựa trên giao thức
Thiết kế máy chủ MCP với việc phơi bày công cụ an toàn
• Phòng thí nghiệm thực hành
Xây dựng agent từ đầu
Phơi bày công cụ qua máy chủ kiểu MCP
Tạo khung đánh giá với các ràng buộc an toàn
Yêu cầu
Người tham gia nên có kiến thức làm việc về lập trình Python.
Chương trình này dành cho các chuyên gia kỹ thuật trung cấp đến cao cấp.
Đánh giá (2)
hệ sinh thái ML không chỉ bao gồm MLFlow mà còn có Optuna, HyperOps, Docker và Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Khóa học - MLflow
Dịch thuật bằng máy
Tôi rất vui khi tham gia khóa đào tạo Kubeflow được tổ chức từ xa. Khóa học này giúp tôi củng cố kiến thức về các dịch vụ AWS, K8s và tất cả các công cụ devOps xung quanh Kubeflow, đây là những nền tảng cần thiết để tiếp cận chủ đề một cách hiệu quả. Tôi muốn cảm ơn Malawski Marcin vì sự kiên nhẫn và chuyên nghiệp của anh ấy trong việc đào tạo và tư vấn về các thực hành tốt nhất. Malawski tiếp cận chủ đề từ nhiều góc độ khác nhau, sử dụng các công cụ triển khai khác nhau như Ansible, EKS kubectl, Terraform. Bây giờ tôi hoàn toàn tin rằng mình đang bước vào lĩnh vực ứng dụng đúng đắn.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Khóa học - Kubeflow
Dịch thuật bằng máy