Đề cương khóa học

Giới Thiệu Về Học Máy Phản Hồi

  • Tổng quan về học máy phản hồi và các ứng dụng của nó
  • Sự khác biệt giữa học giám sát, học không giám sát và học máy phản hồi
  • Các khái niệm chính: agent, môi trường, phần thưởng và chính sách

Quá Trình Quyết Định Markov (MDPs)

  • Hiểu về các trạng thái, hành động, phần thưởng và chuyển trạng thái
  • Các hàm giá trị và Phương trình Bellman
  • Lập trình động để giải quyết MDPs

Các Thuật Toán RL Cơ Bản

  • Các phương pháp bảng: Q-Learning và SARSA
  • Các phương pháp dựa trên chính sách: thuật toán REINFORCE
  • Khung Actor-Critic và các ứng dụng của nó

Học Máy Phản Hồi Sâu

  • Giới thiệu về Deep Q-Networks (DQN)
  • Lấy lại kinh nghiệm và mạng mục tiêu
  • Các gradient chính sách và các phương pháp học máy phản hồi sâu tiên tiến

Các Khung và Công Cụ RL

  • Giới thiệu về OpenAI Gym và các môi trường RL khác
  • Sử dụng PyTorch hoặc TensorFlow để phát triển mô hình RL
  • Huấn luyện, kiểm tra và đánh giá hiệu suất các agent RL

Các Thử Thách Trong RL

  • Cân bằng sự khám phá và khai thác trong quá trình huấn luyện
  • Xử lý các vấn đề phần thưởng thưa thớt và phân bổ tín dụng
  • Tính khả thi và các thử thách tính toán trong RL

Các Hoạt Động Thực Tế

  • Triển khai thuật toán Q-Learning và SARSA từ đầu
  • Huấn luyện một agent dựa trên DQN để chơi một trò chơi đơn giản trong OpenAI Gym
  • Điều chỉnh các mô hình RL để cải thiện hiệu suất trong môi trường tùy chỉnh

Tóm Lượng Và Các Bước Tiếp Theo

Yêu cầu

  • Sự hiểu biết rõ ràng về các nguyên tắc và thuật toán học máy
  • Thông thạo lập trình Python
  • Quen thuộc với các mạng nơron và các khung công nghệ học sâu

Đối tượng

  • Các kỹ sư học máy
  • Các chuyên gia về trí tuệ nhân tạo
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (1)

Các khóa học sắp tới

Các danh mục liên quan