Đề cương khóa học

Giới thiệu về Nền tảng Stratio

  • Tổng quan về kiến trúc và các mô-đun cốt lõi của Stratio
  • Vai trò của Rocket và Trí Tuệ trong chu kỳ sống dữ liệu
  • Đăng nhập và điều hướng giao diện người dùng Stratio

Làm việc với Mô-đun Rocket

  • Nhập liệu dữ liệu và tạo pipeline
  • Kết nối nguồn dữ liệu và cấu hình chuyển đổi
  • Sử dụng PySpark cho các tác vụ tiền xử lý trong Rocket

Các Tính Năng Cốt Lõi của PySpark cho Người Dùng Stratio

  • Cấu trúc dữ liệu và thao tác trong PySpark
  • Cấu trúc lặp: for, while, if/else
  • Viết các hàm tùy chỉnh với def và áp dụng chúng

Sử Dụng Nâng Cao Rocket với PySpark

  • Nhập liệu và chuyển đổi streaming
  • Sử dụng các cấu trúc lặp và hàm trong các kịch bản hàng loạt và thời gian thực
  • Các phương pháp tốt nhất để tối ưu hiệu suất trong pipeline PySpark

Khám Phá Mô-đun Trí Tuệ

  • Tổng quan về các tính năng mô hình dữ liệu và phân tích
  • Chọn, chuyển đổi và khám phá đặc trưng
  • Vai trò của PySpark trong phân tích tùy chỉnh và thông tin chi tiết

Xây Dựng Quy Trình Phân Tích Nâng Cao

  • Tạo hàm do người dùng định nghĩa (UDFs) trong mô-đun Trí Tuệ
  • Áp dụng điều kiện và lặp cho logic dữ liệu
  • Các trường hợp sử dụng: phân đoạn, tổng hợp và dự đoán

Triển Khai và Hợp Tác

  • Lưu, xuất và tái sử dụng quy trình làm việc
  • Hợp tác với các thành viên nhóm khác trên Stratio
  • Xem xét đầu ra và tích hợp với các công cụ hạ nguồn

Tóm Tắt và Bước Tiếp Theo

Yêu cầu

  • Kinh nghiệm lập trình Python
  • Hiểu biết về phân tích dữ liệu hoặc các khái niệm xử lý big data
  • Kiến thức cơ bản về Apache Spark và tính toán phân tán

Đối Tượng Học Viên

  • Kỹ sư dữ liệu làm việc trên nền tảng dựa trên Stratio
  • Nhà phân tích hoặc nhà phát triển sử dụng các mô-đun Rocket và Trí Tuệ
  • Các đội ngũ kỹ thuật chuyển đổi sang quy trình làm việc PySpark trong Stratio
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (3)

Các khóa học sắp tới

Các danh mục liên quan