Đề cương khóa học

Giới thiệu

Phần này cung cấp một giới thiệu tổng quan về thời điểm sử dụng 'học máy', những điều cần xem xét và ý nghĩa của nó, bao gồm cả ưu và nhược điểm. Các kiểu dữ liệu (có cấu trúc/không có cấu trúc/tĩnh/luồng), tính hợp lệ/khối lượng dữ liệu, phân tích dựa trên dữ liệu so với dựa trên người dùng, mô hình thống kê so với mô hình học máy/ thách thức của học không giám sát, sự đánh đổi giữa thiên vị và phương sai, lặp lại/đánh giá, phương pháp xác thực chéo, giám sát/không giám sát/củng cố.

CÁC CHỦ ĐỀ CHÍNH

1. Hiểu về Naive Bayes

  • Những khái niệm cơ bản của phương pháp Bayesian
  • Xác suất
  • Xác suất đồng thời
  • Xác suất điều kiện với định lý Bayes
  • Thuật toán Naive Bayes
  • Sắp xếp Naive Bayes
  • Bộ ước lượng Laplace
  • Sử dụng đặc điểm số học với Naive Bayes

2. Hiểu về cây quyết định

  • Chia để trị
  • Thuật toán cây quyết định C5.0
  • Lựa chọn phân chia tốt nhất
  • Cắt tỉa cây quyết định

3. Hiểu về mạng nơ-ron

  • Từ neuron sinh học đến nhân tạo
  • Hàm kích hoạt
  • Bản đồ mạng
  • Số lớp
  • Hướng di chuyển thông tin
  • Số lượng node trong mỗi lớp
  • Huấn luyện mạng nơ-ron với backpropagation
  • Deep Learning

4. Hiểu về Máy vectơ hỗ trợ

  • Sắp xếp với siêu phẳng
  • Tìm biên giới tối đa
  • Ví dụ dữ liệu có thể tách tuyến tính
  • Ví dụ dữ liệu không thể tách tuyến tính
  • Sử dụng kernel cho không gian phi tuyến

5. Hiểu về phân cụm

  • Phân cụm như một nhiệm vụ học máy
  • Thuật toán k-means cho phân cụm
  • Sử dụng khoảng cách để gán và cập nhật cụm
  • Lựa chọn số lượng cụm phù hợp

6. Đo hiệu suất cho phân loại

  • Làm việc với dữ liệu dự đoán phân loại
  • Xem xét kỹ ma trận nhầm lẫn
  • Sử dụng ma trận nhầm lẫn để đo lường hiệu suất
  • Vượt qua độ chính xác – các biện pháp khác của hiệu suất
  • Thống kê kappa
  • Độ nhạy và độ đặc hiệu
  • Độ chính xác và khả năng hồi phục
  • Biện pháp F
  • Hiển thị sự đánh đổi về hiệu suất
  • Curve ROC
  • Dự đoán hiệu suất tương lai
  • Phương pháp holdout
  • Xác thực chéo
  • Bootstrap lấy mẫu

7. Điều chỉnh các mô hình chứng khoán để cải thiện hiệu suất

  • Sử dụng caret cho điều chỉnh tự động tham số
  • Tạo một mô hình điều chỉnh đơn giản
  • Tùy chỉnh quá trình điều chỉnh
  • Cải thiện hiệu suất mô hình với học siêu việt
  • Hiểu về tập hợp
  • Bagging
  • Boosting
  • Rừng ngẫu nhiên
  • Huấn luyện rừng ngẫu nhiên
  • Đánh giá hiệu suất rừng ngẫu nhiên

CÁC CHỦ ĐỀ PHỤ

8. Hiểu về phân loại sử dụng láng giềng gần nhất

  • Thuật toán kNN
  • Tính khoảng cách
  • Lựa chọn một k phù hợp
  • Sẵn sàng dữ liệu để sử dụng với kNN
  • Tại sao thuật toán kNN lại lười?

9. Hiểu về quy tắc phân loại

  • Tách và trị
  • Thuật toán One Rule
  • Thuật toán RIPPER
  • Các quy tắc từ cây quyết định

10. Hiểu về hồi quy

  • Hồi quy tuyến tính đơn giản
  • Bộ ước lượng bình phương tối thiểu thông thường
  • Tương quan
  • Hồi quy tuyến tính đa biến

11. Hiểu về cây hồi quy và cây mô hình

  • Thêm hồi quy vào cây

12. Hiểu về quy tắc kết hợp

  • Thuật toán Apriori cho học quy tắc liên quan
  • Đo lường sự quan tâm của quy tắc – hỗ trợ và độ tin cậy
  • Tạo một tập hợp quy tắc với nguyên lý Apriori

Ngoại lệ

  • Spark/PySpark/MLlib và Multi-armed bandits

Requirements

Python Kiến thức

 21 Hours

Number of participants


Price per participant

Testimonials (7)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories