Đề cương khóa học

Giới thiệu về Google Colab và Apache Spark

  • Tổng quan về Google Colab
  • Giới thiệu về Apache Spark
  • Cài đặt Spark trong Google Colab

Xử lý Dữ liệu với Apache Spark

  • Làm việc với RDDs và DataFrames
  • Tải và xử lý các tập dữ liệu lớn
  • Sử dụng Spark SQL để truy vấn dữ liệu có cấu trúc

Phân tích Nâng cao với Spark

  • Học máy với Spark MLlib
  • Thực hiện phân tích dữ liệu thời gian thực
  • Tính toán phân tán với Spark

Biểu đồ và Collaboration trong Google Colab

  • Tích hợp Colab với các thư viện biểu đồ phổ biến
  • Các quy trình làm việc cộng tác với sổ ghi Colab
  • Chia sẻ và xuất kết quả

Tối ưu hóaWorkflow Big Data

  • Cài đặt Spark để tối ưu hiệu suất
  • Tối ưu hóa sử dụng bộ nhớ và lưu trữ
  • Mở rộng quy trình làm việc cho các tập dữ liệu lớn

Big Data Trong đám mây

  • Tích hợp Google Colab với công cụ dựa trên đám mây
  • Sử dụng lưu trữ đám mây cho dữ liệu lớn
  • Làm việc với Spark trong môi trường phân tán trên đám mây

Trường hợp điển hình và các Kỹ thuật Tốt nhất

  • Đánh giá các ứng dụng dữ liệu lớn thực tế
  • Trường hợp điển hình sử dụng Apache Spark và Colab
  • Các kỹ thuật tốt nhất cho phân tích dữ liệu lớn

Tổng kết và Bước kế tiếp

Yêu cầu

  • Kiến thức cơ bản về các khái niệm khoa học dữ liệu
  • Quen thuộc với Apache Spark
  • Kỹ năng lập trình Python

Đối tượng tham gia

  • Nhà khoa học dữ liệu
  • Kỹ sư dữ liệu
  • Nghiên cứu viên làm việc với dữ liệu lớn
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (3)

Các khóa học sắp tới

Các danh mục liên quan