Đề cương khóa học
Giới thiệu về Apache Spark
- Vai trò của Spark trong xử lý dữ liệu lớn
- Kiến trúc Spark và các thành phần của nó
Thiết lập Apache Spark
- Yêu cầu về phần cứng và phần mềm
- Quy trình cài đặt cho chế độ độc lập và chế độ cluster
- Các phương pháp thực hành tốt nhất để cấu hình hệ thống cho quản trị viên
Quản lý cụm Spark
- Công cụ và kỹ thuật quản lý cụm
- Giám sát các ứng dụng Spark và tài nguyên cụm
- Cấu hình bảo mật và quản lý người dùng
Tinh chỉnh và tối ưu hóa hiệu suất
- Phân bổ và lên lịch tài nguyên
- Tinh chỉnh Spark để đạt hiệu suất tối ưu
- Xác định và giải quyết các tắc nghẽn phổ biến
Khắc phục sự cố và giải quyết vấn đề
- Các thách thức quản trị Spark phổ biến
- Công cụ và kỹ thuật chẩn đoán để khắc phục sự cố
- Cách tiếp cận từng bước để giải quyết các vấn đề phổ biến
- Các phương pháp thực hành tốt nhất để duy trì môi trường Spark khỏe mạnh
Các chủ đề quản trị nâng cao
- Tích hợp với các công cụ dữ liệu lớn khác
- Đảm bảo tính khả dụng cao và khôi phục sau thảm họa
- Nâng cấp và mở rộng quy mô cụm Spark
Tóm tắt và các bước tiếp theo
Yêu cầu
- Kiến thức cơ bản về cấu hình và quản lý mạng
- Làm quen với hệ điều hành Linux và giao diện dòng lệnh
- Có hứng thú tìm hiểu về các hệ thống tính toán phân tán và quản lý dữ liệu lớn
Đối tượng
- Quản trị viên hệ thống
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Thực hành充分的手动操作,讲师知识渊博 (Note: The translation provided above mistakenly includes Chinese characters at the end. Here is the correct translation in Vietnamese without the error.) Thực hành đủ, giảng viên có kiến thức sâu rộng
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các bài tập thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy