Liên hệ với chúng tôi

Đề cương khóa học

Giới thiệu

Phần này cung cấp cái nhìn tổng quan về việc sử dụng 'học máy' khi nào, những yếu tố cần lưu ý và ý nghĩa của nó, bao gồm cả ưu điểm và nhược điểm. Các loại dữ liệu (có cấu trúc/không cấu trúc/tĩnh/lưu trữ), tính hợp lệ/khối lượng dữ liệu, phân tích dựa trên dữ liệu so với dựa trên người dùng, mô hình thống kê so với mô hình học máy / thách thức của học không giám sát, bài toán đánh đổi thiên kiến- phương sai, vòng lặp/đánh giá, các phương pháp xác thực chéo, học có giám sát/không giám sát/giám sát tăng cường.

NỘI DUNG CHÍNH

1. Hiểu về Naive Bayes

  • Các khái niệm cơ bản của phương pháp Bayesian
  • Xác suất
  • Xác suất đồng thời
  • Xác suất có điều kiện với định lý Bayes
  • Thuật toán Naive Bayes
  • Phân loại bằng Naive Bayes
  • Bộ ước lượng Laplace
  • Sử dụng các đặc trưng số với Naive Bayes

2. Hiểu về cây quyết định

  • Chia để trị
  • Thuật toán cây quyết định C5.0
  • Lựa chọn điểm chia tốt nhất
  • Cắt tỉa cây quyết định

3. Hiểu về mạng nơ-ron

  • Từ nơ-ron sinh học đến nơ-ron nhân tạo
  • Hàm kích hoạt
  • Cấu trúc mạng
  • Số lớp
  • Hướng truyền thông tin
  • Số lượng nơ-ron trong mỗi lớp
  • Huấn luyện mạng nơ-ron với lan truyền ngược
  • Học sâu

4. Hiểu về Máy vectơ hỗ trợ (SVM)

  • Phân loại bằng siêu phẳng
  • Tìm biên lớn nhất
  • Trường hợp dữ liệu tách tuyến tính
  • Trường hợp dữ liệu không tách tuyến tính
  • Sử dụng nhân cho không gian phi tuyến

5. Hiểu về phân cụm

  • Phân cụm như một nhiệm vụ học máy
  • Thuật toán k-means để phân cụm
  • Sử dụng khoảng cách để gán và cập nhật các cụm
  • Lựa chọn số lượng cụm phù hợp

6. Đo lường hiệu năng cho phân loại

  • Xử lý dữ liệu dự đoán phân loại
  • Khám phá kỹ hơn về ma trận nhầm lẫn
  • Sử dụng ma trận nhầm lẫn để đo lường hiệu năng
  • Vượt qua độ chính xác – các đo lường hiệu năng khác
  • Thống kê kappa
  • Độ nhạy và độ đặc hiệu
  • Độ chính xác và độ nhạy tìm lại
  • Chỉ số F
  • Hóa đồ sự đánh đổi hiệu năng
  • Đường cong ROC
  • Dự đoán hiệu năng tương lai
  • Phương pháp giữ lại
  • Xác thực chéo
  • Lấy mẫu Bootstrap

7. Tinh chỉnh các mô hình gốc để cải thiện hiệu năng

  • Sử dụng caret để tinh chỉnh tham số tự động
  • Tạo mô hình đã tinh chỉnh đơn giản
  • Tùy chỉnh quá trình tinh chỉnh
  • Cải thiện hiệu năng mô hình với siêu học
  • Hiểu về sự kết hợp
  • Bagging
  • Boosting
  • Rừng ngẫu nhiên
  • Huấn luyện rừng ngẫu nhiên
  • Đánh giá hiệu năng rừng ngẫu nhiên

NỘI DUNG PHỤ

8. Hiểu về phân loại sử dụng hàng xóm gần nhất

  • Thuật toán kNN
  • Tính khoảng cách
  • Lựa chọn k phù hợp
  • Chuẩn bị dữ liệu để sử dụng với kNN
  • Tại sao thuật toán kNN lại 'lười'?

9. Hiểu về quy tắc phân loại

  • Tách và trị
  • Thuật toán One Rule
  • Thuật toán RIPPER
  • Quy tắc từ cây quyết định

10. Hiểu về hồi quy

  • Hồi quy tuyến tính đơn
  • Ước lượng bình phương nhỏ nhất (OLS)
  • Hệ số tương quan
  • Hồi quy tuyến tính bội

11. Hiểu về cây hồi quy và cây mô hình

  • Thêm hồi quy vào cây

12. Hiểu về quy tắc kết hợp

  • Thuật toán Apriori cho học quy tắc kết hợp
  • Đo lường sự quan tâm của quy tắc – độ hỗ trợ và độ tin cậy
  • Xây dựng một tập hợp quy tắc với nguyên lý Apriori

Nội dung bổ trợ

  • Spark/PySpark/MLlib và các vấn đề đa cánh tay

Yêu cầu

Hiểu biết về Python

 21 Giờ

Số người tham gia


Giá cho mỗi học viên

Đánh giá (7)

Các khóa học sắp tới

Các danh mục liên quan