Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
Giới Thiệu Về Học Máy Phản Hồi
- Tổng quan về học máy phản hồi và các ứng dụng của nó
- Sự khác biệt giữa học giám sát, học không giám sát và học máy phản hồi
- Các khái niệm chính: agent, môi trường, phần thưởng và chính sách
Quá Trình Quyết Định Markov (MDPs)
- Hiểu về các trạng thái, hành động, phần thưởng và chuyển trạng thái
- Các hàm giá trị và Phương trình Bellman
- Lập trình động để giải quyết MDPs
Các Thuật Toán RL Cơ Bản
- Các phương pháp bảng: Q-Learning và SARSA
- Các phương pháp dựa trên chính sách: thuật toán REINFORCE
- Khung Actor-Critic và các ứng dụng của nó
Học Máy Phản Hồi Sâu
- Giới thiệu về Deep Q-Networks (DQN)
- Lấy lại kinh nghiệm và mạng mục tiêu
- Các gradient chính sách và các phương pháp học máy phản hồi sâu tiên tiến
Các Khung và Công Cụ RL
- Giới thiệu về OpenAI Gym và các môi trường RL khác
- Sử dụng PyTorch hoặc TensorFlow để phát triển mô hình RL
- Huấn luyện, kiểm tra và đánh giá hiệu suất các agent RL
Các Thử Thách Trong RL
- Cân bằng sự khám phá và khai thác trong quá trình huấn luyện
- Xử lý các vấn đề phần thưởng thưa thớt và phân bổ tín dụng
- Tính khả thi và các thử thách tính toán trong RL
Các Hoạt Động Thực Tế
- Triển khai thuật toán Q-Learning và SARSA từ đầu
- Huấn luyện một agent dựa trên DQN để chơi một trò chơi đơn giản trong OpenAI Gym
- Điều chỉnh các mô hình RL để cải thiện hiệu suất trong môi trường tùy chỉnh
Tóm Lượng Và Các Bước Tiếp Theo
Requirements
- Sự hiểu biết rõ ràng về các nguyên tắc và thuật toán học máy
- Thông thạo lập trình Python
- Quen thuộc với các mạng nơron và các khung công nghệ học sâu
Đối tượng
- Các kỹ sư học máy
- Các chuyên gia về trí tuệ nhân tạo
14 Hours
Testimonials (1)
Giảng viên trả lời câu hỏi một cách linh hoạt.
Adrian
Course - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated