Đề cương khóa học
Giới thiệu
Hiểu Big Data
Tổng quan về Spark
Tổng quan về Python
Tổng quan về PySpark
- Phân phối Dữ liệu Sử dụng Khung Resilient Distributed Datasets
- Phân phối Tính toán Sử dụng Toán tử API Spark
Thiết lập Python với Spark
Thiết lập PySpark
Sử dụng các Instance EC2 Amazon Web Services (AWS) cho Spark
Thiết lập Databricks
Thiết lập Cluster AWS EMR
Học các Kiến thức Cơ bản về Python Programming
- Bắt đầu với Python
- Sử dụng Jupyter Notebook
- Sử dụng Biến và Các Kiểu Dữ liệu Đơn giản
- Làm việc với Danh sách
- Sử dụng Câu lệnh if
- Sử dụng Đầu vào của Người dùng
- Làm việc với Vòng lặp while
- Triển khai Hàm
- Làm việc với Lớp
- Làm việc với Tệp và Ngoại lệ
- Làm việc với Dự án, Dữ liệu và API
Học các Kiến thức Cơ bản về Spark DataFrame
- Bắt đầu với Spark DataFrames
- Triển khai các Thao tác Cơ bản với Spark
- Sử dụng Thao tác Groupby và Aggregate
- Làm việc với Dấu thời gian và Ngày tháng
Làm việc trên Bài tập Dự án Spark DataFrame
Hiểu Machine Learning với MLlib
Làm việc với MLlib, Spark và Python cho Machine Learning
Hiểu Hồi quy
- Học Lý thuyết Hồi quy Tuyến tính
- Triển khai Mã Đánh giá Hồi quy
- Làm việc trên Bài tập Hồi quy Tuyến tính Mẫu
- Học Lý thuyết Hồi quy Logistic
- Triển khai Mã Hồi quy Logistic
- Làm việc trên Bài tập Hồi quy Logistic Mẫu
Hiểu Random Forest và Cây Quyết định
- Học Lý thuyết Phương pháp Cây
- Triển khai Mã Cây Quyết định và Random Forest
- Làm việc trên Bài tập Phân loại Random Forest Mẫu
Làm việc với Phân cụm K-means
- Hiểu Lý thuyết Phân cụm K-means
- Triển khai Mã Phân cụm K-means
- Làm việc trên Bài tập Phân cụm Mẫu
Làm việc với Hệ thống Đề xuất
Triển khai Xử lý Ngôn ngữ Tự nhiên
- Hiểu Natural Language Processing (NLP)
- Tổng quan về các Công cụ NLP
- Làm việc trên Bài tập NLP Mẫu
Truyền phát với Spark trên Python
- Tổng quan về Truyền phát với Spark
- Bài tập Spark Streaming Mẫu
Lời Kết
Requirements
- Kỹ năng lập trình tổng quát
Đối tượng
- Nhà phát triển
- Chuyên gia IT
- Nhà khoa học dữ liệu
Testimonials (6)
Tôi thích rằng nó rất thực tế. Rất yêu thích việc áp dụng kiến thức lý thuyết thông qua các ví dụ thực tế.
Aurelia-Adriana - Allianz Services Romania
Course - Python and Spark for Big Data (PySpark)
Machine Translated
Khóa học tập trung vào一系列复杂相关的话题,Pablo对每个话题都有深入的专长。 有时,在沟通中会丢失一些细微差别,并且/或者由于时间压力,可能因此没有完全达到期望。 此外,还有一些UHG/Azure Databricks设置问题,但一旦这些问题变得明显,Pablo和UHG迅速解决了它们——这向我展示了UHG与Pablo之间具有高水平的理解力和专业性。 请注意,由于中文的表达习惯,我稍微调整了句子结构以确保流畅性和自然度。如果需要严格保持原句结构,请告知。
Michael Monks - Tech NorthWest Skillnet
Course - Python and Spark for Big Data (PySpark)
Machine Translated
Căm sóc cá nhân.
ARCHANA ANILKUMAR - PPL
Course - Python and Spark for Big Data (PySpark)
Machine Translated
Hướng dẫn thực hành...
Abraham Thomas - PPL
Course - Python and Spark for Big Data (PySpark)
Machine Translated
Các bài học được giảng dạy trong một quyển sổ Jupyter. Các chủ đề được sắp xếp theo một trình tự logic và tự nhiên giúp phát triển buổi học từ những phần dễ dàng đến phức tạp hơn. Tôi đã là người dùng chuyên sâu của Python với nền tảng kiến thức về Machine Learning, nên thấy khóa học dễ theo dõi hơn so với có thể là một số bạn cùng lớp tham gia khóa đào tạo này. Tôi đánh giá cao việc những khái niệm cơ bản nhất đã bị bỏ qua và anh ấy tập trung vào những vấn đề quan trọng nhất.
Angela DeLaMora - ADT, LLC
Course - Python and Spark for Big Data (PySpark)
Machine Translated
các bài tập thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Course - Python and Spark for Big Data (PySpark)
Machine Translated