Đề cương khóa học

Giới thiệu

Phần này cung cấp một giới thiệu tổng quan về thời điểm sử dụng 'học máy', những điều cần xem xét và ý nghĩa của nó, bao gồm cả ưu và nhược điểm. Các kiểu dữ liệu (có cấu trúc/không có cấu trúc/tĩnh/luồng), tính hợp lệ/khối lượng dữ liệu, phân tích dựa trên dữ liệu so với dựa trên người dùng, mô hình thống kê so với mô hình học máy/ thách thức của học không giám sát, sự đánh đổi giữa thiên vị và phương sai, lặp lại/đánh giá, phương pháp xác thực chéo, giám sát/không giám sát/củng cố.

CÁC CHỦ ĐỀ CHÍNH

1. Hiểu về Naive Bayes

  • Các khái niệm cơ bản về phương pháp Bayesian
  • Xác suất
  • Xác suất chung
  • Xác suất có điều kiện với định lý Bayes
  • Thuật toán Naive Bayes
  • Phân loại Naive Bayes
  • Bộ ước lượng Laplace
  • Sử dụng các đặc trưng số với Naive Bayes

2. Hiểu về cây quyết định

  • Chia để trị
  • Thuật toán cây quyết định C5.0
  • Chọn phép chia tốt nhất
  • Cắt tỉa cây quyết định

3. Hiểu về mạng nơ-ron

  • Từ nơ-ron sinh học đến nơ-ron nhân tạo
  • Hàm kích hoạt
  • Cấu trúc liên kết
  • Số lượng lớp
  • Hướng truyền thông tin
  • Số lượng nút trong mỗi lớp
  • Huấn luyện mạng nơ-ron với lan truyền ngược
  • Deep Learning

4. Hiểu về Máy vectơ hỗ trợ

  • Phân loại với siêu phẳng
  • Tìm khoảng cách lớn nhất
  • Trường hợp dữ liệu có thể phân tách tuyến tính
  • Trường hợp dữ liệu không thể phân tách tuyến tính
  • Sử dụng hạt nhân cho không gian phi tuyến tính

5. Hiểu về phân cụm

  • Phân cụm như một nhiệm vụ học máy
  • Thuật toán k-means để phân cụm
  • Sử dụng khoảng cách để gán và cập nhật cụm
  • Chọn số lượng cụm phù hợp

6. Đo hiệu suất cho phân loại

  • Làm việc với dữ liệu dự đoán phân loại
  • Cái nhìn sâu sắc hơn về ma trận nhầm lẫn
  • Sử dụng ma trận nhầm lẫn để đo hiệu suất
  • Vượt xa độ chính xác – các thước đo hiệu suất khác
  • Thống kê kappa
  • Độ nhạy và độ đặc hiệu
  • Độ chính xác và độ thu hồi
  • Thước đo F
  • Trực quan hóa sự đánh đổi hiệu suất
  • Đường cong ROC
  • Ước tính hiệu suất trong tương lai
  • Phương pháp giữ lại
  • Xác thực chéo
  • Bootstrap lấy mẫu

7. Điều chỉnh các mô hình chứng khoán để cải thiện hiệu suất

  • Sử dụng caret để điều chỉnh tham số tự động
  • Tạo một mô hình được điều chỉnh đơn giản
  • Tùy chỉnh quá trình điều chỉnh
  • Cải thiện hiệu suất mô hình với học siêu cấp
  • Hiểu về tập hợp
  • Túi
  • Tăng cường
  • Rừng ngẫu nhiên
  • Huấn luyện rừng ngẫu nhiên
  • Đánh giá hiệu suất rừng ngẫu nhiên

CÁC CHỦ ĐỀ PHỤ

8. Hiểu về phân loại sử dụng láng giềng gần nhất

  • Thuật toán kNN
  • Tính khoảng cách
  • Chọn k phù hợp
  • Chuẩn bị dữ liệu để sử dụng với kNN
  • Tại sao thuật toán kNN lại lười biếng?

9. Hiểu về quy tắc phân loại

  • Tách và chinh phục
  • Thuật toán Một Quy tắc
  • Thuật toán RIPPER
  • Quy tắc từ cây quyết định

10. Hiểu về hồi quy

  • Hồi quy tuyến tính đơn giản
  • Ước tính bình phương tối thiểu thông thường
  • Tương quan
  • Hồi quy tuyến tính đa

11. Hiểu về cây hồi quy và cây mô hình

  • Thêm hồi quy vào cây

12. Hiểu về quy tắc kết hợp

  • Thuật toán Apriori để học quy tắc kết hợp
  • Đo lường sự quan tâm của quy tắc – hỗ trợ và độ tin cậy
  • Xây dựng một tập hợp các quy tắc với nguyên tắc Apriori

Ngoại lệ

  • Spark/PySpark/MLlib và Bandit đa vũ trang
 21 Hours

Number of participants


Price per participant

Testimonials (5)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories