Đề cương khóa học

Giải Thích Máy Học

  • Các loại máy học – máy học có giám sát vs không giám sát
  • Từ học thống kê đến máy học
  • Quy trình khai thác dữ liệu: hiểu biết về kinh doanh, chuẩn bị dữ liệu, mô hình hóa, triển khai
  • Chọn thuật toán phù hợp cho nhiệm vụ
  • Phân loại quá mức và cân bằng sai lệch-biến đổi

Tổng Quát về Python và Thư viện Máy Học

  • Tại sao sử dụng ngôn ngữ lập trình cho máy học
  • Lựa chọn giữa R và Python
  • Khóa học nhanh về Python và Jupyter Notebooks
  • Thư viện Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Kiểm Tra và Đánh Giá Thuật Toán Máy Học

  • Tổng quát hóa, phân loại quá mức và xác thực mô hình
  • Các chiến lược đánh giá: phân chia dữ liệu, kiểm tra chéo, bootstrapping
  • Đánh giá cho hồi quy: ME, MSE, RMSE, MAPE
  • Đánh giá cho phân loại: độ chính xác, ma trận nhầm lẫn, lớp không cân bằng
  • Hiển thị hiệu suất mô hình: đường cong lợi nhuận, đường cong ROC, đường cong nâng cao
  • Lựa chọn mô hình và tìm kiếm lưới để điều chỉnh

Chuẩn Bị Dữ Liệu

  • Nhập và lưu trữ dữ liệu trong Python
  • Phân tích khám phá và thống kê tổng hợp
  • Xử lý giá trị thiếu và ngoại lệ
  • Tiêu chuẩn hóa, chuẩn hóa và chuyển đổi
  • Mã hóa lại dữ liệu định tính và xử lý dữ liệu với pandas

Thuật Toán Phân Loại

  • Phân loại nhị phân vs phân loại đa lớp
  • Hồi quy lôgic và hàm phân biệt
  • Naïve Bayes, k-nearest neighbors
  • Cây quyết định: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máy hỗ trợ vectơ và nhân tử
  • Các kỹ thuật học tập tập hợp

Hồi Quy và Dự Báo Số

  • Hình phương tối thiểu và lựa chọn biến
  • Các phương pháp điều chỉnh: L1, L2
  • Hồi quy đa thức và mô hình không tuyến tính
  • Cây hồi quy và splines

Mạng Nơron

  • Giới thiệu về mạng nơron và học sâu
  • Hàm kích hoạt, lớp và truyền ngược
  • Mạng nơron đa lớp (MLP)
  • Sử dụng TensorFlow hoặc PyTorch để mô hình hóa mạng nơron cơ bản
  • Mạng nơron cho phân loại và hồi quy

Dự Báo Doanh Số và Phân Tích Dự Báo

  • Dự báo dựa trên chuỗi thời gian vs hồi quy
  • Xử lý dữ liệu có xu hướng mùa và xu hướng
  • Xây dựng mô hình dự báo doanh số bằng các kỹ thuật máy học
  • Đánh giá độ chính xác và sự không chắc chắn của dự báo
  • Giải thích và truyền tải kết quả kinh doanh

Học Không Giám Sát

  • Các kỹ thuật phân cụm: k-means, k-medoids, phân cụm hệ thống, SOMs
  • Giảm chiều: PCA, phân tích yếu tố, SVD
  • Kích thước nhiều chiều

Khai Thác Văn Bản

  • Tiền xử lý văn bản và phân tích từ
  • Tương tự từ, rút gốc và nhịp
  • Phân tích cảm xúc và tần suất từ
  • Hiển thị dữ liệu văn bản với đám mây từ

Hệ Thống Đề Xuất

  • Lọc hợp tác dựa trên người dùng và mặt hàng
  • Thiết kế và đánh giá các hệ thống đề xuất

Khai Thác Mẫu Liên Kết

  • Bộ tập hợp hàng hóa thường xuyên và thuật toán Apriori
  • Phân tích giỏ hàng và tỷ lệ nâng cao

Phát Hiện Ngoại Lệ

  • Phân tích giá trị cực đoan
  • Các phương pháp dựa trên khoảng cách và mật độ
  • Phát hiện ngoại lệ trong dữ liệu nhiều chiều

Vụ Đề Tài Máy Học

  • Hiểu vấn đề kinh doanh
  • Tiền xử lý dữ liệu và xây dựng đặc trưng
  • Lựa chọn mô hình và điều chỉnh tham số
  • Đánh giá và trình bày kết quả
  • Triển khai

Tổng Kết và Bước Tiếp Theo

Requirements

  • Kiến thức cơ bản về các khái niệm học máy như học có giám sát và học không giám sát
  • Thông thạo lập trình Python (biến, vòng lặp, hàm)
  • Một số kinh nghiệm xử lý dữ liệu bằng các thư viện như pandas hoặc NumPy có lợi nhưng không bắt buộc
  • Không cần kinh nghiệm trước đó với mô hình nâng cao hoặc mạng nơron

Đối tượng

  • Nhà khoa học dữ liệu
  • Nhà phân tích kinh doanh
  • Kỹ sư phần mềm và chuyên gia kỹ thuật làm việc với dữ liệu
 28 Hours

Number of participants


Price per participant

Đánh giá (2)

Upcoming Courses

Related Categories