Đề cương khóa học
Giới thiệu
- Tổng quan về Spark và Hadoop các tính năng và kiến trúc
- Hiểu về dữ liệu lớn
- Python các kiến thức lập trình cơ bản
Bắt đầu
- Cài đặt Python, Spark và Hadoop
- Hiểu về các cấu trúc dữ liệu trong Python
- Hiểu về PySpark API
- Hiểu về HDFS và MapReduce
Tích hợp Spark và Hadoop với Python
- Triển khai Spark RDD trong Python
- Xử lý dữ liệu bằng MapReduce
- Tạo các tập dữ liệu phân tán trong HDFS
Machine Learning với Spark MLlib
Xử lý Big Data với Spark Streaming
Làm việc với Hệ thống Gợi ý
Làm việc với Kafka, Sqoop, Kafka và Flume
Apache Mahout với Spark và Hadoop
Khắc phục sự cố
Tóm tắt và Các bước tiếp theo
Requirements
- Kinh nghiệm làm việc với Spark và Hadoop
- Kinh nghiệm lập trình Python
Đối tượng
- Nhà khoa học dữ liệu
- Nhà phát triển
Testimonials (3)
Thực tế là chúng ta có thể mang theo hầu hết thông tin/bài học/trình bày/bài tập đã thực hiện, để sau này có thể xem lại và có thể làm lại những phần chưa hiểu lần đầu hoặc cải thiện những gì chúng ta đã làm.
Raul Mihail Rat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
Machine Translated
Tôi thích rằng nó đã quản lý được việc xây dựng nền tảng cho chủ đề và đi đến một số bài tập khá nâng cao. Ngoài ra, còn cung cấp cách viết/mã thử dễ dàng.
Ionut Goga - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
Machine Translated
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
Machine Translated