Đề cương khóa học

Học Máy

Giới thiệu về Học Máy

  • Các ứng dụng của học máy
  • Học có giám sát so với học không giám sát
  • Các thuật toán học máy
    • Hồi quy (Regression)
    • Phân loại (Classification)
    • Ghép cụm (Clustering)
    • Hệ thống đề xuất (Recommender System)
    • Phát hiện bất thường (Anomaly Detection)
    • Học tăng cường (Reinforcement Learning)

Hồi quy

  • Hồi quy đơn giản và đa biến
    • Phương pháp bình phương tối thiểu (Least Square Method)
    • Ước lượng các hệ số (Estimating the Coefficients)
    • Đánh giá độ chính xác của ước lượng hệ số (Assessing the Accuracy of the Coefficient Estimates)
    • Đánh giá độ chính xác của mô hình (Assessing the Accuracy of the Model)
    • Phân tích sau ước lượng (Post Estimation Analysis)
    • Các cân nhắc khác trong các mô hình hồi quy (Other Considerations in Regression Models)
    • Dự đoán chất lượng (Qualitative Predictors)
    • Mở rộng của các mô hình tuyến tính (Extensions of Linear Models)
    • Các vấn đề tiềm ẩn (Potential Problems)
    • Sự cân bằng giữa sai số và phương sai (bias-variance trade-off) trong các mô hình hồi quy

Phương pháp tái lấy mẫu (Resampling Methods)

  • Tái kiểm tra chéo (Cross-Validation)
  • Cách tiếp cận tập xác thực (The Validation Set Approach)
  • Tái kiểm tra chéo loại một (Leave-One-Out Cross-Validation)
  • Tái kiểm tra chéo k-fold (k-Fold Cross-Validation)
  • Sự cân bằng giữa sai số và phương sai cho k-fold
  • Cách tiếp cận bootstrap (The Bootstrap)

Lựa chọn mô hình và chuẩn hóa (Model Selection and Regularization)

  • Lựa chọn tập con
    • Lựa chọn tập con tốt nhất (Best Subset Selection)
    • Lựa chọn bước tiến (Stepwise Selection)
    • Chọn mô hình tối ưu (Choosing the Optimal Model)
  • Các phương pháp thu nhỏ/chuẩn hóa (Shrinkage Methods/Regularization)
    • Hồi quy ridge (Ridge Regression)
    • Lasso & Elastic Net
  • Chọn tham số điều chỉnh (Selecting the Tuning Parameter)
  • Các phương pháp giảm chiều (Dimension Reduction Methods)
    • Hồi quy thành phần chính (Principal Components Regression)
    • Nhóm bình phương tối thiểu từng phần (Partial Least Squares)

Phân loại

Hồi quy logistic

  • Hàm mục tiêu của mô hình hồi quy logistic (The Logistic Model Cost Function)
  • Ước lượng các hệ số (Estimating the Coefficients)
  • Làm dự đoán (Making Predictions)
  • Tỷ lệ cược (Odds Ratio)
  • Các ma trận đánh giá hiệu suất
    • Nhạy bén/đặc hiệu/PPV/NPV
    • Xác định độ chính xác
    • Đường cong ROC
  • Hồi quy logistic đa biến (Multiple Logistic Regression)
  • Hồi quy logistic cho hơn 2 lớp đáp ứng (>2 Response Classes)
  • Hồi quy logistic chuẩn hóa (Regularized Logistic Regression)

Phân tích biệt thức tuyến tính (Linear Discriminant Analysis)

  • Sử dụng định lý Bayes để phân loại
  • Phân tích biệt thức tuyến tính cho p=1
  • Phân tích biệt thức tuyến tính cho p>1

Phân tích biệt thức bậc hai (Quadratic Discriminant Analysis)

Láng giềng gần nhất k (K-Nearest Neighbors)

  • Phân loại với các biên giới quyết định không tuyến tính

Máy hỗ trợ vector (Support Vector Machines)

  • Mục tiêu tối ưu hóa (Optimization Objective)
  • Lớp phân loại biên tối đa (The Maximal Margin Classifier)
  • Nhân (Kernels)
  • Phân loại một đối một (One-Versus-One Classification)
  • Phân loại một đối tất cả (One-Versus-All Classification)

So sánh các phương pháp phân loại

Học sâu

Giới thiệu về Học sâu

Mạng nơron nhân tạo (Artificial Neural Networks - ANNs)

  • Nơron sinh học và nơron nhân tạo
  • Giả thuyết không tuyến tính
  • Đại diện mô hình
  • Các ví dụ & trực quan hóa
  • Hàm chuyển đổi/hàm kích hoạt (Transfer Function/Activation Functions)
  • Các lớp kiến trúc mạng thông thường
    • Mạng nơron nhân tạo feedforward
    • Mạng nơron feedforward nhiều lớp
  • Thuật toán backpropagation
  • Backpropagation - Đào tạo và hội tụ
  • Cấp xấp xỉ chức năng với backpropagation
  • Các vấn đề thực tế và thiết kế của backpropagation learning

Học sâu

  • Nhân tạo trí tuệ & học sâu
  • Hồi quy softmax
  • Đào tạo tự động
  • Mạng nơron sâu
  • Các ví dụ và ứng dụng

Thực hành:

Bắt đầu với R

  • Giới thiệu về R
  • Các lệnh cơ bản & thư viện
  • Xử lý dữ liệu
  • Nhập & xuất dữ liệu
  • Tổng quan đồ thị và số liệu thống kê
  • Viết hàm

Hồi quy

  • Hồi quy tuyến tính đơn giản và đa biến
  • Các thuật ngữ tương tác
  • Các phép biến đổi không tuyến tính
  • Hồi quy với biến giả (Dummy Variable Regression)
  • Tái kiểm tra chéo và bootstrap
  • Phương pháp lựa chọn tập con
  • Xử phạt (Ridge, Lasso, Elastic Net)

Phân loại

  • Hồi quy logistic, LDA, QDA, và KNN
  • Tái lấy mẫu & chuẩn hóa
  • Máy hỗ trợ vector (SVM)

Ghi chú:

  • Đối với các thuật toán học máy, sẽ sử dụng các nghiên cứu trường hợp để thảo luận về ứng dụng, ưu điểm và các vấn đề tiềm ẩn.
  • Sẽ phân tích các tập dữ liệu khác nhau bằng R.

Yêu cầu

  • Có kiến thức cơ bản về các khái niệm thống kê là điều mong muốn

Đối tượng tham gia

  • Data scientists (chuyên gia dữ liệu)
  • Machine learning engineers (kỹ sư học máy)
  • Software developers interested in AI (lập trình viên quan tâm đến trí tuệ nhân tạo)
  • Researchers working with data modeling (nghiên cứu viên làm việc với mô hình hóa dữ liệu)
  • Professionals looking to apply machine learning in business or industry (chuyên gia muốn áp dụng học máy trong kinh doanh hoặc ngành công nghiệp)
 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (6)

Các khóa học sắp tới

Các danh mục liên quan