Đề cương khóa học
Giới thiệu về nền tảng Stratio
- Tổng quan về kiến trúc và các mô-đun chính của Stratio
- Vai trò của Rocket và Intelligence trong vòng đời dữ liệu
- Đăng nhập và điều hướng giao diện người dùng (UI) của Stratio
Làm việc với mô-đun Rocket
- Nhập dữ liệu và tạo pipeline
- Kết nối nguồn dữ liệu và cấu hình chuyển đổi
- Sử dụng PySpark cho các tác vụ tiền xử lý trong Rocket
PySpark Cơ bản cho người dùng Stratio
- Cấu trúc dữ liệu và hoạt động của PySpark
- Kết cấu vòng lặp: sử dụng for, while, if/else
- Viết hàm tùy chỉnh với def và áp dụng chúng
Sử dụng Nâng cao của Rocket với PySpark
- Nhập dữ liệu luồng và chuyển đổi
- Sử dụng vòng lặp và hàm trong các kịch bản batch và thời gian thực
- Những nguyên tắc tốt nhất để tối ưu hiệu suất trong pipeline PySpark
Khám phá mô-đun Intelligence
- Tổng quan về các tính năng mô hình dữ liệu và phân tích
- Chọn đặc trưng, chuyển đổi và khám phá
- Vai trò của PySpark trong phân tích tùy chỉnh và thông tin chi tiết
Tạo luồng phân tích nâng cao
- Tạo hàm được định nghĩa bởi người dùng (UDFs) trong Intelligence
- Áp dụng điều kiện và vòng lặp cho logic dữ liệu
- Trường hợp sử dụng: phân đoạn, tổng hợp và dự đoán
Triển khai và Collaboration
- Lưu trữ, xuất và tái sử dụng luồng làm việc
- Làm việc nhóm với các thành viên khác trong đội trên Stratio
- Xem xét kết quả đầu ra và tích hợp với công cụ phía sau
Tóm tắt và Các Bước Tiếp theo
Requirements
- Kinh nghiệm với lập trình Python
- Hiểu biết về phân tích dữ liệu hoặc khái niệm xử lý big data
- Kiến thức cơ bản về Apache Spark và tính toán phân tán
Đối tượng
- Người làm công việc kỹ sư dữ liệu trên các nền tảng dựa trên Stratio
- Nhân viên phân tích hoặc phát triển sử dụng các mô-đun Rocket và Intelligence
- Các nhóm kỹ thuật chuyển đổi sang luồng công việc PySpark trong Stratio
Testimonials (5)
Các ví dụ thực hành đã giúp chúng tôi có được cảm nhận thực tế về cách chương trình hoạt động. Giải thích chi tiết và tích hợp các khái niệm lý thuyết cùng cách chúng liên quan đến ứng dụng thực tế.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
Machine Translated
Tất cả các chủ đề mà anh ấy đã đề cập bao gồm cả ví dụ. Đồng thời giải thích cách chúng hữu ích trong công việc hàng ngày của chúng ta.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
Machine Translated
Tôi thích phong cách của Pablo, việc ông ấy đã đề cập đến nhiều chủ đề từ thiết kế báo cáo, tùy chỉnh bằng HTML cho đến triển khai các thuật toán học máy đơn giản. Sự cân đối giữa thông tin lý thuyết và bài tập rất tốt. Pablo thực sự đã涵盖所有我感兴趣的主题,并对我的问题给出了详尽的答案。 请注意,最后一句的部分翻译被错误地用中文完成了。根据指南要求,这里应保持目标语言的一致性,因此正确的翻译应该是: Pablo thật sự đã bao phủ tất cả các chủ đề mà tôi quan tâm và đưa ra những câu trả lời chi tiết cho các câu hỏi của tôi.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Điều tôi thích nhất về khóa đào tạo là tổ chức và địa điểm
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Course - ArcGIS for Spatial Analysis
Machine Translated
Thật sự tôi rất thích nhiều bài lab và thực hành.
Vivian Feng - Destination Canada
Course - Data Analysis with SQL, Python and Spotfire
Machine Translated