Đề cương khóa học

Giải Thích Máy Học

  • Các loại máy học – máy học có giám sát vs không giám sát
  • Từ học thống kê đến máy học
  • Quy trình khai thác dữ liệu: hiểu biết về kinh doanh, chuẩn bị dữ liệu, mô hình hóa, triển khai
  • Chọn thuật toán phù hợp cho nhiệm vụ
  • Phân loại quá mức và cân bằng sai lệch-biến đổi

Tổng Quát về Python và Thư viện Máy Học

  • Tại sao sử dụng ngôn ngữ lập trình cho máy học
  • Lựa chọn giữa R và Python
  • Khóa học nhanh về Python và Jupyter Notebooks
  • Thư viện Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Kiểm Tra và Đánh Giá Thuật Toán Máy Học

  • Tổng quát hóa, phân loại quá mức và xác thực mô hình
  • Các chiến lược đánh giá: phân chia dữ liệu, kiểm tra chéo, bootstrapping
  • Đánh giá cho hồi quy: ME, MSE, RMSE, MAPE
  • Đánh giá cho phân loại: độ chính xác, ma trận nhầm lẫn, lớp không cân bằng
  • Hiển thị hiệu suất mô hình: đường cong lợi nhuận, đường cong ROC, đường cong nâng cao
  • Lựa chọn mô hình và tìm kiếm lưới để điều chỉnh

Chuẩn Bị Dữ Liệu

  • Nhập và lưu trữ dữ liệu trong Python
  • Phân tích khám phá và thống kê tổng hợp
  • Xử lý giá trị thiếu và ngoại lệ
  • Tiêu chuẩn hóa, chuẩn hóa và chuyển đổi
  • Mã hóa lại dữ liệu định tính và xử lý dữ liệu với pandas

Thuật Toán Phân Loại

  • Phân loại nhị phân vs phân loại đa lớp
  • Hồi quy lôgic và hàm phân biệt
  • Naïve Bayes, k-nearest neighbors
  • Cây quyết định: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máy hỗ trợ vectơ và nhân tử
  • Các kỹ thuật học tập tập hợp

Hồi Quy và Dự Báo Số

  • Hình phương tối thiểu và lựa chọn biến
  • Các phương pháp điều chỉnh: L1, L2
  • Hồi quy đa thức và mô hình không tuyến tính
  • Cây hồi quy và splines

Mạng Nơron

  • Giới thiệu về mạng nơron và học sâu
  • Hàm kích hoạt, lớp và truyền ngược
  • Mạng nơron đa lớp (MLP)
  • Sử dụng TensorFlow hoặc PyTorch để mô hình hóa mạng nơron cơ bản
  • Mạng nơron cho phân loại và hồi quy

Dự Báo Doanh Số và Phân Tích Dự Báo

  • Dự báo dựa trên chuỗi thời gian vs hồi quy
  • Xử lý dữ liệu có xu hướng mùa và xu hướng
  • Xây dựng mô hình dự báo doanh số bằng các kỹ thuật máy học
  • Đánh giá độ chính xác và sự không chắc chắn của dự báo
  • Giải thích và truyền tải kết quả kinh doanh

Học Không Giám Sát

  • Các kỹ thuật phân cụm: k-means, k-medoids, phân cụm hệ thống, SOMs
  • Giảm chiều: PCA, phân tích yếu tố, SVD
  • Kích thước nhiều chiều

Khai Thác Văn Bản

  • Tiền xử lý văn bản và phân tích từ
  • Tương tự từ, rút gốc và nhịp
  • Phân tích cảm xúc và tần suất từ
  • Hiển thị dữ liệu văn bản với đám mây từ

Hệ Thống Đề Xuất

  • Lọc hợp tác dựa trên người dùng và mặt hàng
  • Thiết kế và đánh giá các hệ thống đề xuất

Khai Thác Mẫu Liên Kết

  • Bộ tập hợp hàng hóa thường xuyên và thuật toán Apriori
  • Phân tích giỏ hàng và tỷ lệ nâng cao

Phát Hiện Ngoại Lệ

  • Phân tích giá trị cực đoan
  • Các phương pháp dựa trên khoảng cách và mật độ
  • Phát hiện ngoại lệ trong dữ liệu nhiều chiều

Vụ Đề Tài Máy Học

  • Hiểu vấn đề kinh doanh
  • Tiền xử lý dữ liệu và xây dựng đặc trưng
  • Lựa chọn mô hình và điều chỉnh tham số
  • Đánh giá và trình bày kết quả
  • Triển khai

Tổng Kết và Bước Tiếp Theo

Yêu cầu

  • Kiến thức cơ bản về các khái niệm học máy như học có giám sát và học không giám sát
  • Thông thạo lập trình Python (biến, vòng lặp, hàm)
  • Một số kinh nghiệm xử lý dữ liệu bằng các thư viện như pandas hoặc NumPy có lợi nhưng không bắt buộc
  • Không cần kinh nghiệm trước đó với mô hình nâng cao hoặc mạng nơron

Đối tượng

  • Nhà khoa học dữ liệu
  • Nhà phân tích kinh doanh
  • Kỹ sư phần mềm và chuyên gia kỹ thuật làm việc với dữ liệu
 28 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (2)

Các khóa học sắp tới

Các danh mục liên quan