Đề cương khóa học

Giới thiệu

  • Hiểu tầm quan trọng của việc chuẩn bị dữ liệu trong phân tích và học máy
  • Quy trình chuẩn bị dữ liệu và vai trò của nó trong vòng đời dữ liệu
  • Khám phá các thách thức phổ biến trong dữ liệu thô và tác động của nó đến phân tích

Thu thập và Tích lũy Dữ liệu

  • Nguồn dữ liệu: cơ sở dữ liệu, API, bảng tính, tệp văn bản, v.v.
  • Kỹ thuật thu thập dữ liệu và đảm bảo chất lượng dữ liệu trong quá trình thu thập
  • Thu thập dữ liệu từ nhiều nguồn khác nhau

Data Cleaning Kỹ thuật

  • Xác định và xử lý các giá trị bị thiếu, giá trị ngoại lệ và sự không nhất quán
  • Xử lý các bản sao và lỗi trong tập dữ liệu
  • Làm sạch các tập dữ liệu thực tế

Chuyển đổi và Chuẩn hóa Dữ liệu

  • Kỹ thuật chuẩn hóa và chuẩn hóa dữ liệu
  • Xử lý dữ liệu phân loại: mã hóa, phân nhóm và kỹ thuật đặc trưng
  • Chuyển đổi dữ liệu thô thành các định dạng có thể sử dụng

Data Integration và Tổng hợp

  • Hợp nhất và kết hợp các tập dữ liệu từ các nguồn khác nhau
  • Giải quyết xung đột dữ liệu và căn chỉnh các loại dữ liệu
  • Kỹ thuật tổng hợp và hợp nhất dữ liệu

Data Quality Đảm bảo

  • Phương pháp đảm bảo chất lượng và tính toàn vẹn của dữ liệu trong suốt quá trình
  • Triển khai kiểm tra chất lượng và quy trình xác thực
  • Nghiên cứu điển hình và ứng dụng thực tế của đảm bảo chất lượng dữ liệu

Giảm chiều và Lựa chọn Đặc trưng

  • Hiểu nhu cầu giảm chiều
  • Kỹ thuật như PCA, lựa chọn đặc trưng và chiến lược giảm
  • Triển khai các kỹ thuật giảm chiều

Tóm tắt và Các Bước Tiếp Theo

Yêu cầu

  • Nắm vững các khái niệm cơ bản về dữ liệu

Đối tượng

  • Nhân viên phân tích dữ liệu
  • Database quản trị viên
  • Nhân viên chuyên ngành công nghệ thông tin
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (2)

Các khóa học sắp tới

Các danh mục liên quan