Đề cương khóa học

Giới thiệu

  • Tổng quan về Spark và Hadoop các tính năng và kiến trúc
  • Hiểu về dữ liệu lớn
  • Python các kiến thức lập trình cơ bản

Bắt đầu

  • Cài đặt Python, Spark và Hadoop
  • Hiểu về các cấu trúc dữ liệu trong Python
  • Hiểu về PySpark API
  • Hiểu về HDFS và MapReduce

Tích hợp Spark và Hadoop với Python

  • Triển khai Spark RDD trong Python
  • Xử lý dữ liệu bằng MapReduce
  • Tạo các tập dữ liệu phân tán trong HDFS

Machine Learning với Spark MLlib

Xử lý Big Data với Spark Streaming

Làm việc với Hệ thống Gợi ý

Làm việc với Kafka, Sqoop, Kafka và Flume

Apache Mahout với Spark và Hadoop

Khắc phục sự cố

Tóm tắt và Các bước tiếp theo

Yêu cầu

  • Kinh nghiệm làm việc với Spark và Hadoop
  • Kinh nghiệm lập trình Python

Đối tượng

  • Nhà khoa học dữ liệu
  • Nhà phát triển
 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (3)

Các khóa học sắp tới

Các danh mục liên quan