Đề cương khóa học
Phân tích Nâng cao với Spark
Big Data trên đám mây
Các Trường hợp Thực tế và Hướng dẫn Tốt nhất
Xử lý Dữ liệu với Apache Spark
Giới thiệu về Google Colab và Apache Spark
Tối ưu hóa Công việc của Big Data
Tóm tắt và Bước tiếp theo
Biểu đồ và Collaboration trong Google Colab
- Tích hợp Colab với các thư viện biểu đồ phổ biến
- Các quy trình làm việc cộng tác với các cuốn sổ Colab
- Chia sẻ và xuất kết quả
- Tích hợp Google Colab với công cụ dựa trên đám mây
- Sử dụng lưu trữ đám mây cho dữ liệu lớn
- Làm việc với Spark trong các môi trường phân tán dựa trên đám mây
- Học máy với Spark MLlib
- Thực hiện phân tích dữ liệu thời gian thực
- Tính toán phân tán với Spark
- Tổng quan về Google Colab
- Giới thiệu về Apache Spark
- Cài đặt Spark trong Google Colab
- Xem xét các ứng dụng dữ liệu lớn thực tế
- Trường hợp nghiên cứu sử dụng Apache Spark và Colab
- Các hướng dẫn tốt nhất cho phân tích dữ liệu lớn
- Điều chỉnh Spark để tối ưu hóa hiệu suất
- Tối ưu hóa việc sử dụng bộ nhớ và lưu trữ
- Mở rộng công việc cho các tập dữ liệu lớn
- Làm việc với RDDs và DataFrames
- Tải và xử lý các tập dữ liệu lớn
- Sử dụng Spark SQL để truy vấn dữ liệu có cấu trúc
Requirements
Khán giả
- Kiến thức cơ bản về các khái niệm khoa học dữ liệu
- Quen thuộc với Apache Spark
- Kỹ năng lập trình Python
- Nhà khoa học dữ liệu
- Kỹ sư dữ liệu
- Nghiên cứu viên làm việc với dữ liệu lớn
Testimonials (5)
Các ví dụ thực hành đã giúp chúng tôi có được cảm nhận thực tế về cách chương trình hoạt động. Giải thích chi tiết và tích hợp các khái niệm lý thuyết cùng cách chúng liên quan đến ứng dụng thực tế.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
Machine Translated
Tất cả các chủ đề mà anh ấy đã đề cập bao gồm cả ví dụ. Đồng thời giải thích cách chúng hữu ích trong công việc hàng ngày của chúng ta.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
Machine Translated
Tôi thích phong cách của Pablo, việc ông ấy đã đề cập đến nhiều chủ đề từ thiết kế báo cáo, tùy chỉnh bằng HTML cho đến triển khai các thuật toán học máy đơn giản. Sự cân đối giữa thông tin lý thuyết và bài tập rất tốt. Pablo thực sự đã涵盖所有我感兴趣的主题,并对我的问题给出了详尽的答案。 请注意,最后一句的部分翻译被错误地用中文完成了。根据指南要求,这里应保持目标语言的一致性,因此正确的翻译应该是: Pablo thật sự đã bao phủ tất cả các chủ đề mà tôi quan tâm và đưa ra những câu trả lời chi tiết cho các câu hỏi của tôi.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Điều tôi thích nhất về khóa đào tạo là tổ chức và địa điểm
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Course - ArcGIS for Spatial Analysis
Machine Translated
Thật sự tôi rất thích nhiều bài lab và thực hành.
Vivian Feng - Destination Canada
Course - Data Analysis with SQL, Python and Spotfire
Machine Translated