Đề cương khóa học

Giới thiệu

  • Quy trình Data Science
  • Vai trò và trách nhiệm của một Nhà khoa học dữ liệu

Chuẩn bị Môi trường Phát triển

  • Thư viện, khung, ngôn ngữ và công cụ
  • Phát triển cục bộ
  • Phát triển dựa trên nền tảng web cộng tác

Thu thập Dữ liệu

  • Các Loại Dữ liệu khác nhau
    • Cấu trúc
      • Cơ sở dữ liệu cục bộ
      • Database connectors
      • Định dạng phổ biến: xlxs, XML, Json, csv, ...
    • Phi cấu trúc
      • Clicks, cảm biến, điện thoại thông minh
      • APIs
      • Internet of Things (IoT)
      • Tài liệu, hình ảnh, video, âm thanh
  • Nghiên cứu điển hình: Thu thập lượng lớn dữ liệu phi cấu trúc liên tục

Lưu trữ Dữ liệu

  • Cơ sở dữ liệu quan hệ
  • Cơ sở dữ liệu phi quan hệ
  • Hadoop: Hệ thống Tệp Phân tán (HDFS)
  • Spark: Tập dữ liệu Phân tán Bền bỉ (RDD)
  • Lưu trữ đám mây

Chuẩn bị Dữ liệu

  • Thu thập, lựa chọn, làm sạch và chuyển đổi
  • Đảm bảo chất lượng dữ liệu - tính chính xác, ý nghĩa và bảo mật
  • Báo cáo ngoại lệ

Languages được sử dụng để Chuẩn bị, Xử lý và Phân tích

  • Ngôn ngữ R
    • Giới thiệu về R
    • Thao tác dữ liệu, tính toán và hiển thị đồ họa
  • Python
    • Giới thiệu về Python
    • Thao tác, xử lý, làm sạch và phân tích dữ liệu

Phân tích Dữ liệu

  • Phân tích thăm dò
    • Thống kê cơ bản
    • Bản nháp trực quan hóa
    • Hiểu dữ liệu
  • Quan hệ nhân quả
  • Tính năng và chuyển đổi
  • Machine Learning
    • Giám sát so với không giám sát
    • Khi nào sử dụng mô hình nào
  • Natural Language Processing (NLP)

Data Visualization

  • Các Thực hành Tốt nhất
  • Chọn biểu đồ phù hợp cho dữ liệu phù hợp
  • Bảng màu
  • Nâng cao hơn nữa
    • Dashboards
    • Trực quan hóa tương tác
  • Kể chuyện bằng dữ liệu

Tóm tắt và Kết luận

Yêu cầu

  • Một hiểu biết chung về các khái niệm cơ sở dữ liệu
  • Một hiểu biết cơ bản về thống kê
 35 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (3)

Các khóa học sắp tới

Các danh mục liên quan