Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
Giới thiệu về Reinforcement Learning
- Tổng quan về học tăng cường và các ứng dụng của nó
- Sự khác biệt giữa học có giám sát, học không giám sát và học tăng cường
- Các khái niệm chính: tác nhân, môi trường, phần thưởng và chính sách
Tiến trình quyết định Markov (MDP)
- Hiểu về trạng thái, hành động, phần thưởng và chuyển đổi trạng thái
- Hàm giá trị và Phương trình Bellman
- Lập trình động để giải các MDP
Các thuật toán RL cốt lõi
- Các phương pháp bảng: Q-Learning và SARSA
- Các phương pháp dựa trên chính sách: Thuật toán REINFORCE
- Các khung Actor-Critic và ứng dụng của chúng
Deep Reinforcement Learning
- Giới thiệu về Mạng lưới Q sâu (DQN)
- Tái phát kinh nghiệm và mạng mục tiêu
- Gradient chính sách và các phương pháp deep RL nâng cao
Các khung và công cụ RL
- Giới thiệu về OpenAI Gym và các môi trường RL khác
- Sử dụng PyTorch hoặc TensorFlow để phát triển mô hình RL
- Huấn luyện, kiểm tra và đánh giá hiệu suất của các tác nhân RL
Những thách thức trong RL
- Cân bằng giữa khám phá và khai thác trong quá trình huấn luyện
- Xử lý các phần thưởng thưa thớt và các vấn đề gán thưởng
- Scalability và các thách thức về tính toán trong RL
Thực hành Activities
- Triển khai các thuật toán Q-Learning và SARSA từ đầu
- Huấn luyện một tác nhân dựa trên DQN để chơi một trò chơi đơn giản trong OpenAI Gym
- Tinh chỉnh các mô hình RL để cải thiện hiệu suất trong các môi trường tùy chỉnh
Tóm tắt và các bước tiếp theo
Requirements
- Hiểu biết vững chắc về các nguyên tắc và thuật toán học máy
- Thành thạo lập trình Python
- Làm quen với mạng nơ-ron và các khuôn khổ học sâu
Đối tượng
- Kỹ sư học máy
- Chuyên gia AI
14 Hours
Testimonials (1)
Giảng viên trả lời câu hỏi một cách linh hoạt.
Adrian
Course - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated