Đề cương khóa học

Giới thiệu về Apache Spark

  • Vai trò của Spark trong xử lý dữ liệu lớn
  • Kiến trúc Spark và các thành phần của nó

Thiết lập Apache Spark

  • Yêu cầu về phần cứng và phần mềm
  • Quy trình cài đặt cho chế độ độc lập và chế độ cluster
  • Các phương pháp thực hành tốt nhất để cấu hình hệ thống cho quản trị viên

Quản lý cụm Spark

  • Công cụ và kỹ thuật quản lý cụm
  • Giám sát các ứng dụng Spark và tài nguyên cụm
  • Cấu hình bảo mật và quản lý người dùng

Tinh chỉnh và tối ưu hóa hiệu suất

  • Phân bổ và lên lịch tài nguyên
  • Tinh chỉnh Spark để đạt hiệu suất tối ưu
  • Xác định và giải quyết các tắc nghẽn phổ biến

Khắc phục sự cố và giải quyết vấn đề

  • Các thách thức quản trị Spark phổ biến
  • Công cụ và kỹ thuật chẩn đoán để khắc phục sự cố
  • Cách tiếp cận từng bước để giải quyết các vấn đề phổ biến
  • Các phương pháp thực hành tốt nhất để duy trì môi trường Spark khỏe mạnh

Các chủ đề quản trị nâng cao

  • Tích hợp với các công cụ dữ liệu lớn khác
  • Đảm bảo tính khả dụng cao và khôi phục sau thảm họa
  • Nâng cấp và mở rộng quy mô cụm Spark

Tóm tắt và các bước tiếp theo

Requirements

  • Kiến thức cơ bản về cấu hình và quản lý mạng
  • Làm quen với hệ điều hành Linux và giao diện dòng lệnh
  • Có hứng thú tìm hiểu về các hệ thống tính toán phân tán và quản lý dữ liệu lớn

Đối tượng

  • Quản trị viên hệ thống
 35 Hours

Number of participants


Price per participant

Testimonials (5)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories