Đề cương khóa học

Giới thiệu

Phần này cung cấp một giới thiệu tổng quan về thời điểm sử dụng 'học máy', những điều cần xem xét và ý nghĩa của nó, bao gồm cả ưu và nhược điểm. Các kiểu dữ liệu (có cấu trúc/không có cấu trúc/tĩnh/luồng), tính hợp lệ/khối lượng dữ liệu, phân tích dựa trên dữ liệu so với dựa trên người dùng, mô hình thống kê so với mô hình học máy/ thách thức của học không giám sát, sự đánh đổi giữa thiên vị và phương sai, lặp lại/đánh giá, phương pháp xác thực chéo, giám sát/không giám sát/củng cố.

CÁC CHỦ ĐỀ CHÍNH

1. Hiểu về Naive Bayes

  • Những khái niệm cơ bản của phương pháp Bayesian
  • Xác suất
  • Xác suất đồng thời
  • Xác suất điều kiện với định lý Bayes
  • Thuật toán Naive Bayes
  • Sắp xếp Naive Bayes
  • Bộ ước lượng Laplace
  • Sử dụng đặc điểm số học với Naive Bayes

2. Hiểu về cây quyết định

  • Chia để trị
  • Thuật toán cây quyết định C5.0
  • Lựa chọn phân chia tốt nhất
  • Cắt tỉa cây quyết định

3. Hiểu về mạng nơ-ron

  • Từ neuron sinh học đến nhân tạo
  • Hàm kích hoạt
  • Bản đồ mạng
  • Số lớp
  • Hướng di chuyển thông tin
  • Số lượng node trong mỗi lớp
  • Huấn luyện mạng nơ-ron với backpropagation
  • Deep Learning

4. Hiểu về Máy vectơ hỗ trợ

  • Sắp xếp với siêu phẳng
  • Tìm biên giới tối đa
  • Ví dụ dữ liệu có thể tách tuyến tính
  • Ví dụ dữ liệu không thể tách tuyến tính
  • Sử dụng kernel cho không gian phi tuyến

5. Hiểu về phân cụm

  • Phân cụm như một nhiệm vụ học máy
  • Thuật toán k-means cho phân cụm
  • Sử dụng khoảng cách để gán và cập nhật cụm
  • Lựa chọn số lượng cụm phù hợp

6. Đo hiệu suất cho phân loại

  • Làm việc với dữ liệu dự đoán phân loại
  • Xem xét kỹ ma trận nhầm lẫn
  • Sử dụng ma trận nhầm lẫn để đo lường hiệu suất
  • Vượt qua độ chính xác – các biện pháp khác của hiệu suất
  • Thống kê kappa
  • Độ nhạy và độ đặc hiệu
  • Độ chính xác và khả năng hồi phục
  • Biện pháp F
  • Hiển thị sự đánh đổi về hiệu suất
  • Curve ROC
  • Dự đoán hiệu suất tương lai
  • Phương pháp holdout
  • Xác thực chéo
  • Bootstrap lấy mẫu

7. Điều chỉnh các mô hình chứng khoán để cải thiện hiệu suất

  • Sử dụng caret cho điều chỉnh tự động tham số
  • Tạo một mô hình điều chỉnh đơn giản
  • Tùy chỉnh quá trình điều chỉnh
  • Cải thiện hiệu suất mô hình với học siêu việt
  • Hiểu về tập hợp
  • Bagging
  • Boosting
  • Rừng ngẫu nhiên
  • Huấn luyện rừng ngẫu nhiên
  • Đánh giá hiệu suất rừng ngẫu nhiên

CÁC CHỦ ĐỀ PHỤ

8. Hiểu về phân loại sử dụng láng giềng gần nhất

  • Thuật toán kNN
  • Tính khoảng cách
  • Lựa chọn một k phù hợp
  • Sẵn sàng dữ liệu để sử dụng với kNN
  • Tại sao thuật toán kNN lại lười?

9. Hiểu về quy tắc phân loại

  • Tách và trị
  • Thuật toán One Rule
  • Thuật toán RIPPER
  • Các quy tắc từ cây quyết định

10. Hiểu về hồi quy

  • Hồi quy tuyến tính đơn giản
  • Bộ ước lượng bình phương tối thiểu thông thường
  • Tương quan
  • Hồi quy tuyến tính đa biến

11. Hiểu về cây hồi quy và cây mô hình

  • Thêm hồi quy vào cây

12. Hiểu về quy tắc kết hợp

  • Thuật toán Apriori cho học quy tắc liên quan
  • Đo lường sự quan tâm của quy tắc – hỗ trợ và độ tin cậy
  • Tạo một tập hợp quy tắc với nguyên lý Apriori

Ngoại lệ

  • Spark/PySpark/MLlib và Multi-armed bandits

Yêu cầu

Python Kiến thức

 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (7)

Các khóa học sắp tới

Các danh mục liên quan