Đề cương khóa học

Giới Thiệu Về Học Máy Phản Hồi

  • Tổng quan về học máy phản hồi và các ứng dụng của nó
  • Sự khác biệt giữa học giám sát, học không giám sát và học máy phản hồi
  • Các khái niệm chính: agent, môi trường, phần thưởng và chính sách

Quá Trình Quyết Định Markov (MDPs)

  • Hiểu về các trạng thái, hành động, phần thưởng và chuyển trạng thái
  • Các hàm giá trị và Phương trình Bellman
  • Lập trình động để giải quyết MDPs

Các Thuật Toán RL Cơ Bản

  • Các phương pháp bảng: Q-Learning và SARSA
  • Các phương pháp dựa trên chính sách: thuật toán REINFORCE
  • Khung Actor-Critic và các ứng dụng của nó

Học Máy Phản Hồi Sâu

  • Giới thiệu về Deep Q-Networks (DQN)
  • Lấy lại kinh nghiệm và mạng mục tiêu
  • Các gradient chính sách và các phương pháp học máy phản hồi sâu tiên tiến

Các Khung và Công Cụ RL

  • Giới thiệu về OpenAI Gym và các môi trường RL khác
  • Sử dụng PyTorch hoặc TensorFlow để phát triển mô hình RL
  • Huấn luyện, kiểm tra và đánh giá hiệu suất các agent RL

Các Thử Thách Trong RL

  • Cân bằng sự khám phá và khai thác trong quá trình huấn luyện
  • Xử lý các vấn đề phần thưởng thưa thớt và phân bổ tín dụng
  • Tính khả thi và các thử thách tính toán trong RL

Các Hoạt Động Thực Tế

  • Triển khai thuật toán Q-Learning và SARSA từ đầu
  • Huấn luyện một agent dựa trên DQN để chơi một trò chơi đơn giản trong OpenAI Gym
  • Điều chỉnh các mô hình RL để cải thiện hiệu suất trong môi trường tùy chỉnh

Tóm Lượng Và Các Bước Tiếp Theo

Requirements

  • Sự hiểu biết rõ ràng về các nguyên tắc và thuật toán học máy
  • Thông thạo lập trình Python
  • Quen thuộc với các mạng nơron và các khung công nghệ học sâu

Đối tượng

  • Các kỹ sư học máy
  • Các chuyên gia về trí tuệ nhân tạo
 14 Hours

Number of participants


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories