Đề cương khóa học

Giới thiệu

Reinforcement Learning Kiến thức cơ bản

Các kỹ thuật Reinforcement Learning cơ bản

Giới thiệu về BURLAP

Sự hội tụ của Lặp lại Giá trị và Chính sách

Định hình Phần thưởng

Khám phá

Tổng quát hóa

MDP Quan sát Một phần

Tùy chọn

Hậu cần

TD Lambda

Gradient Chính sách

Học sâu Q-Learning

Chủ đề về Lý thuyết Trò chơi

Tóm tắt và Các bước tiếp theo

Requirements

  • Thông thạo Python
  • Hiểu biết về Giải tích và Đại số tuyến tính ở bậc Đại học
  • Hiểu biết cơ bản về Xác suất và Statistics
  • Kinh nghiệm tạo mô hình học máy trong Python và Numpy

Đối tượng

  • Nhà phát triển
  • Nhà khoa học dữ liệu
 21 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories