Đề cương khóa học
Giới thiệu về Reinforcement Learning
- Học tăng cường là gì?
- Các khái niệm chính: tác nhân, môi trường, trạng thái, hành động và phần thưởng
- Những thách thức trong học tăng cường
Khám phá và Khai thác
- Cân bằng giữa khám phá và khai thác trong các mô hình RL
- Các chiến lược khám phá: epsilon-greedy, softmax và hơn thế nữa
Q-Learning và Mạng Nơ-ron Q Sâu (DQNs)
- Giới thiệu về Q-learning
- Triển khai DQNs bằng TensorFlow
- Tối ưu hóa Q-learning với bộ nhớ kinh nghiệm và mạng mục tiêu
Phương pháp Dựa trên Chính sách
- Thuật toán gradient chính sách
- Thuật toán REINFORCE và cách triển khai
- Phương pháp diễn viên-phê bình
Làm việc với OpenAI Gym
- Thiết lập môi trường trong OpenAI Gym
- Mô phỏng tác nhân trong môi trường động
- Đánh giá hiệu suất của tác nhân
Các Kỹ thuật Reinforcement Learning Nâng cao
- Học tăng cường đa tác nhân
- Gradient chính sách xác định sâu (DDPG)
- Tối ưu hóa chính sách lân cận (PPO)
Triển khai Mô hình Reinforcement Learning
- Các ứng dụng thực tế của học tăng cường
- Tích hợp các mô hình RL vào môi trường sản xuất
Tóm tắt và Các Bước Tiếp Theo
Requirements
- Kinh nghiệm với lập trình Python
- Hiểu biết cơ bản về các khái niệm học sâu và học máy
- Kiến thức về các thuật toán và khái niệm toán học được sử dụng trong học tăng cường
Đối tượng
- Nhà khoa học dữ liệu
- Các chuyên gia thực hành học máy
- Nhà nghiên cứu AI
Testimonials (4)
rất thân thiện và sẵn sàng giúp đỡ
Aktar Hossain - Unit4
Course - Building Microservices with Microsoft Azure Service Fabric (ASF)
Machine Translated
Hướng dẫn thiết lập máy chủ không có服务器。此外,我之前不知道sls网络控制台的存在,这挺不错的。 (注:由于“sls”和“web console”在特定上下文中可能指代具体的技术产品或服务,因此保持原样未翻译以确保准确性。) Hướng dẫn thiết lập máy chủ không có server. Ngoài ra, tôi cũng không biết đến sự tồn tại của sls web console, điều này thật tốt.
Rafal Kucharski - The Software House sp. z o.o.
Course - Serverless Framework for Developers
Machine Translated
Tất cả tốt, không cần cải tiến gì
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Course - AWS Lambda for Developers
Machine Translated
Ứng dụng IoT
Palaniswamy Suresh Kumar - Makers' Academy
Course - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Machine Translated