Đề cương khóa học
Giới thiệu
Hiểu Big Data
Tổng quan về Spark
Tổng quan về Python
Tổng quan về PySpark
- Phân phối Dữ liệu Sử dụng Khung Resilient Distributed Datasets
- Phân phối Tính toán Sử dụng Toán tử API Spark
Thiết lập Python với Spark
Thiết lập PySpark
Sử dụng các Instance EC2 Amazon Web Services (AWS) cho Spark
Thiết lập Databricks
Thiết lập Cluster AWS EMR
Học các Kiến thức Cơ bản về Python Programming
- Bắt đầu với Python
- Sử dụng Jupyter Notebook
- Sử dụng Biến và Các Kiểu Dữ liệu Đơn giản
- Làm việc với Danh sách
- Sử dụng Câu lệnh if
- Sử dụng Đầu vào của Người dùng
- Làm việc với Vòng lặp while
- Triển khai Hàm
- Làm việc với Lớp
- Làm việc với Tệp và Ngoại lệ
- Làm việc với Dự án, Dữ liệu và API
Học các Kiến thức Cơ bản về Spark DataFrame
- Bắt đầu với Spark DataFrames
- Triển khai các Thao tác Cơ bản với Spark
- Sử dụng Thao tác Groupby và Aggregate
- Làm việc với Dấu thời gian và Ngày tháng
Làm việc trên Bài tập Dự án Spark DataFrame
Hiểu Machine Learning với MLlib
Làm việc với MLlib, Spark và Python cho Machine Learning
Hiểu Hồi quy
- Học Lý thuyết Hồi quy Tuyến tính
- Triển khai Mã Đánh giá Hồi quy
- Làm việc trên Bài tập Hồi quy Tuyến tính Mẫu
- Học Lý thuyết Hồi quy Logistic
- Triển khai Mã Hồi quy Logistic
- Làm việc trên Bài tập Hồi quy Logistic Mẫu
Hiểu Random Forest và Cây Quyết định
- Học Lý thuyết Phương pháp Cây
- Triển khai Mã Cây Quyết định và Random Forest
- Làm việc trên Bài tập Phân loại Random Forest Mẫu
Làm việc với Phân cụm K-means
- Hiểu Lý thuyết Phân cụm K-means
- Triển khai Mã Phân cụm K-means
- Làm việc trên Bài tập Phân cụm Mẫu
Làm việc với Hệ thống Đề xuất
Triển khai Xử lý Ngôn ngữ Tự nhiên
- Hiểu Natural Language Processing (NLP)
- Tổng quan về các Công cụ NLP
- Làm việc trên Bài tập NLP Mẫu
Truyền phát với Spark trên Python
- Tổng quan về Truyền phát với Spark
- Bài tập Spark Streaming Mẫu
Lời Kết
Yêu cầu
- Kỹ năng lập trình tổng quát
Đối tượng
- Nhà phát triển
- Chuyên gia IT
- Nhà khoa học dữ liệu
Đánh giá (6)
Tôi thích vì nó thực tế. Tôi rất thích áp dụng kiến thức lý thuyết với các ví dụ thực tế.
Aurelia-Adriana - Allianz Services Romania
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy
Khóa học đề cập đến một loạt các chủ đề phức tạp và có liên quan, và Pablo có chuyên môn sâu rộng về từng chủ đề. Đôi khi, những chi tiết tinh tế bị mất trong quá trình giao tiếp và/hoặc do áp lực thời gian, dẫn đến việc kỳ vọng có thể không được đáp ứng đầy đủ. Ngoài ra, đã xảy ra một số vấn đề liên quan đến việc cài đặt UHG/Azure Databricks, tuy nhiên Pablo và UHG đã giải quyết nhanh chóng ngay khi các vấn đề này xuất hiện - điều này cho tôi thấy sự hiểu biết và chuyên nghiệp cao giữa UHG và Pablo,
Michael Monks - Tech NorthWest Skillnet
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy
Sự chú ý cá nhân.
ARCHANA ANILKUMAR - PPL
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy
Đào tạo thực hành..
Abraham Thomas - PPL
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy
Các bài học được giảng dạy trong một Jupyter notebook. Các chủ đề được tổ chức theo trình tự logic và tự nhiên giúp phát triển buổi học từ phần dễ đến phần khó hơn. Tôi đã là người dùng nâng cao của Python với kiến thức về Machine Learning, nên tôi thấy khóa học dễ theo dõi hơn so với có thể là một số bạn đồng lớp khác tham gia khóa đào tạo. Tôi đánh giá cao việc các khái niệm cơ bản nhất được bỏ qua và tập trung vào những vấn đề quan trọng nhất.
Angela DeLaMora - ADT, LLC
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy
các nhiệm vụ thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy