Đề cương khóa học

Giới thiệu về Reinforcement Learning

  • Reinforcement learning là gì?
  • Các khái niệm chính: agent, môi trường, trạng thái, hành động và phần thưởng
  • Thách thức trong reinforcement learning

Khám phá và khai thác (Exploration and Exploitation)

  • Balan giữa khám phá và khai thác trong các mô hình RL
  • Các chiến lược khám phá: epsilon-greedy, softmax và hơn thế nữa

Q-Learning và Deep Q-Networks (DQNs)

  • Giới thiệu về Q-learning
  • Thực hiện DQNs sử dụng TensorFlow
  • Tối ưu hóa Q-learning với experience replay và target networks

Phương pháp dựa trên chính sách (Policy-Based Methods)

  • Thuật toán gradient policy
  • Thuật toán REINFORCE và cách triển khai
  • Các phương pháp actor-critic

Làm việc với OpenAI Gym

  • Thiết lập môi trường trong OpenAI Gym
  • Tương tác của agent trong các môi trường động
  • Đánh giá hiệu suất của agent

Các kỹ thuật nâng cao của Reinforcement Learning

  • Học tăng cường đaagent (Multi-agent reinforcement learning)
  • Gradient chính sách xác định sâu (Deep deterministic policy gradient - DDPG)
  • Tối ưu hóa chính sách gần đúng (Proximal policy optimization - PPO)

Triển khai các mô hình Reinforcement Learning

  • Ứng dụng thực tế của reinforcement learning
  • Kết hợp các mô hình RL vào môi trường sản xuất

Tóm tắt và bước tiếp theo

Requirements

  • Kinh nghiệm với lập trình Python
  • Hiểu biết cơ bản về các khái niệm học sâu và học máy
  • Kiến thức về thuật toán và các khái niệm toán học được sử dụng trong học tăng cường

Đối tượng tham gia

  • Kỹ sư dữ liệu
  • Chuyên gia về học máy
  • Nghiên cứu viên trí tuệ nhân tạo
 28 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories