Đề cương khóa học

Giới thiệu về Hệ thống Big Data

  • Tổng quan về công nghệ và kiến trúc big data
  • Xử lý batch so với xử lý thời gian thực
  • Chiến lược lưu trữ dữ liệu cho khả năng mở rộng

Xử lý Dữ liệu Nâng cao với Apache Spark

  • Tối ưu hóa công việc Spark về hiệu suất
  • Biến đổi và hành động nâng cao
  • Làm việc với streaming có cấu trúc

Machine Learning ở Mức Độ Lớn

  • Các kỹ thuật huấn luyện mô hình phân tán
  • Tùy chỉnh siêu tham số trên tập dữ liệu lớn
  • Triển khai mô hình trong môi trường big data

Deep Learning cho Big Data

  • Hoàn thiện tích hợp TensorFlow và PyTorch với Spark
  • Các ống dẫn huấn luyện học sâu phân tán
  • Ví dụ sử dụng trong phân tích hình ảnh, văn bản, và chuỗi thời gian

Phân tích Thời gian Thực và Dữ liệu Streaming

  • Apache Kafka cho việc lấy dữ liệu streaming
  • Các khung làm việc xử lý luồng
  • Theo dõi và cảnh báo trong hệ thống thời gian thực

Data Governance, An toàn và Đạo đức

  • Yêu cầu về quyền riêng tư dữ liệu và tuân thủ
  • Quản lý quyền truy cập và mã hóa trong các hệ thống big data
  • Các cân nhắc đạo đức trong phân tích quy mô lớn

Tích hợp Big Data với Business Intelligence

  • Biểu đồ dữ liệu và bảng điều khiển cho big data
  • Kết nối các ống dẫn big data đến công cụ BI
  • Khơi dậy kết quả kinh doanh bằng phân tích nâng cao

Tóm tắt và Bước Tiếp theo

Yêu cầu

  • Sự hiểu biết sâu sắc về các khái niệm phân tích dữ liệu và mô hình thống kê
  • Kinh nghiệm với các công cụ xử lý dữ liệu và ngôn ngữ lập trình như Python, R, hoặc Scala
  • Tham gia với các khung tính toán phân tán như Hadoop hoặc Spark

Đối tượng học viên

  • Những nhà khoa học dữ liệu muốn thâm nhập vào việc xử lý dữ liệu quy mô lớn và phân tích dự đoán
  • Những nhà phân tích cấp cao muốn thiết kế và triển khai các quy trình phân tích phức tạp
  • Những chuyên gia R&D tập trung vào các giải pháp thúc đẩy dữ liệu sáng tạo
 42 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (3)

Các khóa học sắp tới

Các danh mục liên quan