Đề cương khóa học
Giới thiệu
Phần này cung cấp một giới thiệu tổng quan về thời điểm sử dụng 'học máy', những điều cần xem xét và ý nghĩa của nó, bao gồm cả ưu và nhược điểm. Các kiểu dữ liệu (có cấu trúc/không có cấu trúc/tĩnh/luồng), tính hợp lệ/khối lượng dữ liệu, phân tích dựa trên dữ liệu so với dựa trên người dùng, mô hình thống kê so với mô hình học máy/ thách thức của học không giám sát, sự đánh đổi giữa thiên vị và phương sai, lặp lại/đánh giá, phương pháp xác thực chéo, giám sát/không giám sát/củng cố.
CÁC CHỦ ĐỀ CHÍNH
1. Hiểu về Naive Bayes
- Các khái niệm cơ bản về phương pháp Bayesian
- Xác suất
- Xác suất chung
- Xác suất có điều kiện với định lý Bayes
- Thuật toán Naive Bayes
- Phân loại Naive Bayes
- Bộ ước lượng Laplace
- Sử dụng các đặc trưng số với Naive Bayes
2. Hiểu về cây quyết định
- Chia để trị
- Thuật toán cây quyết định C5.0
- Chọn phép chia tốt nhất
- Cắt tỉa cây quyết định
3. Hiểu về mạng nơ-ron
- Từ nơ-ron sinh học đến nơ-ron nhân tạo
- Hàm kích hoạt
- Cấu trúc liên kết
- Số lượng lớp
- Hướng truyền thông tin
- Số lượng nút trong mỗi lớp
- Huấn luyện mạng nơ-ron với lan truyền ngược
- Deep Learning
4. Hiểu về Máy vectơ hỗ trợ
- Phân loại với siêu phẳng
- Tìm khoảng cách lớn nhất
- Trường hợp dữ liệu có thể phân tách tuyến tính
- Trường hợp dữ liệu không thể phân tách tuyến tính
- Sử dụng hạt nhân cho không gian phi tuyến tính
5. Hiểu về phân cụm
- Phân cụm như một nhiệm vụ học máy
- Thuật toán k-means để phân cụm
- Sử dụng khoảng cách để gán và cập nhật cụm
- Chọn số lượng cụm phù hợp
6. Đo hiệu suất cho phân loại
- Làm việc với dữ liệu dự đoán phân loại
- Cái nhìn sâu sắc hơn về ma trận nhầm lẫn
- Sử dụng ma trận nhầm lẫn để đo hiệu suất
- Vượt xa độ chính xác – các thước đo hiệu suất khác
- Thống kê kappa
- Độ nhạy và độ đặc hiệu
- Độ chính xác và độ thu hồi
- Thước đo F
- Trực quan hóa sự đánh đổi hiệu suất
- Đường cong ROC
- Ước tính hiệu suất trong tương lai
- Phương pháp giữ lại
- Xác thực chéo
- Bootstrap lấy mẫu
7. Điều chỉnh các mô hình chứng khoán để cải thiện hiệu suất
- Sử dụng caret để điều chỉnh tham số tự động
- Tạo một mô hình được điều chỉnh đơn giản
- Tùy chỉnh quá trình điều chỉnh
- Cải thiện hiệu suất mô hình với học siêu cấp
- Hiểu về tập hợp
- Túi
- Tăng cường
- Rừng ngẫu nhiên
- Huấn luyện rừng ngẫu nhiên
- Đánh giá hiệu suất rừng ngẫu nhiên
CÁC CHỦ ĐỀ PHỤ
8. Hiểu về phân loại sử dụng láng giềng gần nhất
- Thuật toán kNN
- Tính khoảng cách
- Chọn k phù hợp
- Chuẩn bị dữ liệu để sử dụng với kNN
- Tại sao thuật toán kNN lại lười biếng?
9. Hiểu về quy tắc phân loại
- Tách và chinh phục
- Thuật toán Một Quy tắc
- Thuật toán RIPPER
- Quy tắc từ cây quyết định
10. Hiểu về hồi quy
- Hồi quy tuyến tính đơn giản
- Ước tính bình phương tối thiểu thông thường
- Tương quan
- Hồi quy tuyến tính đa
11. Hiểu về cây hồi quy và cây mô hình
- Thêm hồi quy vào cây
12. Hiểu về quy tắc kết hợp
- Thuật toán Apriori để học quy tắc kết hợp
- Đo lường sự quan tâm của quy tắc – hỗ trợ và độ tin cậy
- Xây dựng một tập hợp các quy tắc với nguyên tắc Apriori
Ngoại lệ
- Spark/PySpark/MLlib và Bandit đa vũ trang
Testimonials (5)
Keeping it short and simple. Creating intuition and visual models around the concepts (decision tree graph, linear equations, calculating y_pred manually to prove how the model works).
Nicolae - DB Global Technology
Course - Machine Learning
It helped me achieve my goal of understanding ML. Much respect for Pablo for giving a proper introduction in this topic, since it becomes obvious after 3 days of training how vast this topic is. I have also enjoyed A LOT the idea of virtual machines you have provided, which had very good latency! It allowed every coursant to do experiments at their own pace.
Silviu - DB Global Technology
Course - Machine Learning
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Course - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Course - Machine Learning
I liked the lab exercises.