Đề cương khóa học

Giới thiệu về Google Colab và Apache Spark

  • Tổng quan về Google Colab
  • Giới thiệu về Apache Spark
  • Cài đặt Spark trong Google Colab

Xử lý Dữ liệu với Apache Spark

  • Làm việc với RDDs và DataFrames
  • Tải và xử lý các tập dữ liệu lớn
  • Sử dụng Spark SQL để truy vấn dữ liệu có cấu trúc

Phân tích Nâng cao với Spark

  • Học máy với Spark MLlib
  • Thực hiện phân tích dữ liệu thời gian thực
  • Tính toán phân tán với Spark

Biểu đồ và Collaboration trong Google Colab

  • Tích hợp Colab với các thư viện biểu đồ phổ biến
  • Các quy trình làm việc cộng tác với sổ ghi Colab
  • Chia sẻ và xuất kết quả

Tối ưu hóaWorkflow Big Data

  • Cài đặt Spark để tối ưu hiệu suất
  • Tối ưu hóa sử dụng bộ nhớ và lưu trữ
  • Mở rộng quy trình làm việc cho các tập dữ liệu lớn

Big Data Trong đám mây

  • Tích hợp Google Colab với công cụ dựa trên đám mây
  • Sử dụng lưu trữ đám mây cho dữ liệu lớn
  • Làm việc với Spark trong môi trường phân tán trên đám mây

Trường hợp điển hình và các Kỹ thuật Tốt nhất

  • Đánh giá các ứng dụng dữ liệu lớn thực tế
  • Trường hợp điển hình sử dụng Apache Spark và Colab
  • Các kỹ thuật tốt nhất cho phân tích dữ liệu lớn

Tổng kết và Bước kế tiếp

Requirements

  • Kiến thức cơ bản về các khái niệm khoa học dữ liệu
  • Quen thuộc với Apache Spark
  • Kỹ năng lập trình Python

Đối tượng tham gia

  • Nhà khoa học dữ liệu
  • Kỹ sư dữ liệu
  • Nghiên cứu viên làm việc với dữ liệu lớn
 14 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories