Đề cương khóa học
Giới thiệu
- Tổng quan về Spark và Hadoop các tính năng và kiến trúc
- Hiểu về dữ liệu lớn
- Python các kiến thức lập trình cơ bản
Bắt đầu
- Cài đặt Python, Spark và Hadoop
- Hiểu về các cấu trúc dữ liệu trong Python
- Hiểu về PySpark API
- Hiểu về HDFS và MapReduce
Tích hợp Spark và Hadoop với Python
- Triển khai Spark RDD trong Python
- Xử lý dữ liệu bằng MapReduce
- Tạo các tập dữ liệu phân tán trong HDFS
Machine Learning với Spark MLlib
Xử lý Big Data với Spark Streaming
Làm việc với Hệ thống Gợi ý
Làm việc với Kafka, Sqoop, Kafka và Flume
Apache Mahout với Spark và Hadoop
Khắc phục sự cố
Tóm tắt và Các bước tiếp theo
Yêu cầu
- Kinh nghiệm làm việc với Spark và Hadoop
- Kinh nghiệm lập trình Python
Đối tượng
- Nhà khoa học dữ liệu
- Nhà phát triển
Đánh giá (3)
Thật tuyệt vời là chúng tôi có thể mang về hầu hết các thông tin/khóa học/bài trình bày/bài tập đã thực hiện, để chúng tôi có thể xem lại và có thể làm lại những phần chưa hiểu rõ lần đầu hoặc cải thiện những phần đã thực hiện.
Raul Mihail Rat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
Tôi thích cách nó đã xây dựng nền tảng của chủ đề và đưa ra một số bài tập khá nâng cao. Đồng thời, nó cũng cung cấp các phương pháp đơn giản để viết và kiểm thử mã.
Ionut Goga - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy