Đề cương khóa học

Giới thiệu

  • Tổng quan về Spark và Hadoop các tính năng và kiến trúc
  • Hiểu về dữ liệu lớn
  • Python các kiến thức lập trình cơ bản

Bắt đầu

  • Cài đặt Python, Spark và Hadoop
  • Hiểu về các cấu trúc dữ liệu trong Python
  • Hiểu về PySpark API
  • Hiểu về HDFS và MapReduce

Tích hợp Spark và Hadoop với Python

  • Triển khai Spark RDD trong Python
  • Xử lý dữ liệu bằng MapReduce
  • Tạo các tập dữ liệu phân tán trong HDFS

Machine Learning với Spark MLlib

Xử lý Big Data với Spark Streaming

Làm việc với Hệ thống Gợi ý

Làm việc với Kafka, Sqoop, Kafka và Flume

Apache Mahout với Spark và Hadoop

Khắc phục sự cố

Tóm tắt và Các bước tiếp theo

Requirements

  • Kinh nghiệm làm việc với Spark và Hadoop
  • Kinh nghiệm lập trình Python

Đối tượng

  • Nhà khoa học dữ liệu
  • Nhà phát triển
 21 Hours

Number of participants


Price per participant

Testimonials (3)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories