Đề cương khóa học

Giới thiệu về Reinforcement Learning

  • Reinforcement learning là gì?
  • Các khái niệm cơ bản: tác nhân, môi trường, trạng thái, hành động và phần thưởng
  • Thách thức trong reinforcement learning

Khám phá và khai thác

  • Cân bằng giữa khám phá và khai thác trong các mô hình RL
  • Chiến lược khám phá: epsilon-greedy, softmax và hơn thế nữa

Q-Learning và Deep Q-Networks (DQNs)

  • Giới thiệu về Q-learning
  • Triển khai DQNs sử dụng TensorFlow
  • Tối ưu hóa Q-learning bằng cách sử dụng kinh nghiệm replay và target networks

Phương pháp Dựa trên Chính sách

  • Thuật toán gradient chính sách
  • Thuật toán REINFORCE và cách triển khai nó
  • Phương pháp actor-critic

Làm việc với OpenAI Gym

  • Thiết lập môi trường trong OpenAI Gym
  • Mô phỏng các tác nhân trong môi trường động
  • Đánh giá hiệu suất của tác nhân

Các Kỹ Thuật Reinforcement Learning Tiên Tiến

  • Reinforcement learning đa tác nhân
  • Deep deterministic policy gradient (DDPG)
  • Proximal policy optimization (PPO)

Triển khai Mô hình Reinforcement Learning

  • Ứng dụng thực tế của reinforcement learning
  • Tích hợp các mô hình RL vào môi trường sản xuất

Tổng kết và Bước tiếp theo

Yêu cầu

  • Kinh nghiệm lập trình Python
  • Hiểu biết cơ bản về deep learning và machine learning
  • Kiến thức về các thuật toán và khái niệm toán học sử dụng trong reinforcement learning

Đối tượng

  • Khoa học dữ liệu
  • Chuyên gia machine learning
  • Nghiên cứu viên AI
 28 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan