Đề cương khóa học

Giới thiệu về Apache Spark

  • Vai trò của Spark trong xử lý dữ liệu lớn
  • Kiến trúc Spark và các thành phần của nó

Thiết lập Apache Spark

  • Yêu cầu về phần cứng và phần mềm
  • Quy trình cài đặt cho chế độ độc lập và chế độ cluster
  • Các phương pháp thực hành tốt nhất để cấu hình hệ thống cho quản trị viên

Quản lý cụm Spark

  • Công cụ và kỹ thuật quản lý cụm
  • Giám sát các ứng dụng Spark và tài nguyên cụm
  • Cấu hình bảo mật và quản lý người dùng

Tinh chỉnh và tối ưu hóa hiệu suất

  • Phân bổ và lên lịch tài nguyên
  • Tinh chỉnh Spark để đạt hiệu suất tối ưu
  • Xác định và giải quyết các tắc nghẽn phổ biến

Khắc phục sự cố và giải quyết vấn đề

  • Các thách thức quản trị Spark phổ biến
  • Công cụ và kỹ thuật chẩn đoán để khắc phục sự cố
  • Cách tiếp cận từng bước để giải quyết các vấn đề phổ biến
  • Các phương pháp thực hành tốt nhất để duy trì môi trường Spark khỏe mạnh

Các chủ đề quản trị nâng cao

  • Tích hợp với các công cụ dữ liệu lớn khác
  • Đảm bảo tính khả dụng cao và khôi phục sau thảm họa
  • Nâng cấp và mở rộng quy mô cụm Spark

Tóm tắt và các bước tiếp theo

Yêu cầu

  • Kiến thức cơ bản về cấu hình và quản lý mạng
  • Làm quen với hệ điều hành Linux và giao diện dòng lệnh
  • Có hứng thú tìm hiểu về các hệ thống tính toán phân tán và quản lý dữ liệu lớn

Đối tượng

  • Quản trị viên hệ thống
 35 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (5)

Các khóa học sắp tới

Các danh mục liên quan