Đề cương khóa học

Giới thiệu Apache Iceberg

  • Tổng quan về Apache Iceberg
  • Xem lại các khái niệm cơ bản

Kiến thức sâu về kiến trúc Apache Iceberg

  • Phân tích chi tiết về định dạng bảng của Apache Iceberg
  • Tổng quan chi tiết về kiến trúc, bao gồm metadata và bố cục file
  • Các thành phần bên trong của schema và sự phát triển của partition

Cài đặt và cấu hình nâng cao

  • Cấu hình Apache Iceberg để tối ưu hóa hiệu suất trong các môi trường khác nhau
  • Tích hợp với các công cụ xử lý dữ liệu khác nhau
  • Cài đặt nâng cao: bảo mật, mã hóa và kiểm soát truy cập
  • Cài đặt Apache Iceberg trong môi trường phân tán

Các hoạt động và bảo trì nâng cao

  • Quản lý các bảng Apache Iceberg lớn
  • Triển khai và quản lý các thay đổi schema phức tạp
  • Xử lý sự phát triển của partition và partition ẩn
  • Các hoạt động CRUD nâng cao với thay đổi schema và partition

Kỹ thuật tối ưu hóa truy vấn

  • Các kỹ thuật để giảm độ trễ truy vấn
  • Cắt partition và cắt file
  • Caching metadata và các chiến lược tối ưu hóa
  • Triển khai và kiểm thử các kỹ thuật tối ưu hóa truy vấn

Điều chỉnh hiệu suất cho các tập dữ liệu lớn

  • Tối ưu hóa hiệu suất cho các tập dữ liệu lớn
  • Sử dụng các tính năng tích hợp sẵn của Apache Iceberg để điều chỉnh hiệu suất
  • Các nghiên cứu về điều chỉnh hiệu suất trong các trường hợp thực tế
  • Điều chỉnh hiệu suất cho các tập dữ liệu lớn

Di chuyển và tích hợp dữ liệu nâng cao

  • Di chuyển các cấu trúc dữ liệu phức tạp từ các hệ thống khác
  • Tích hợp Apache Iceberg với các luồng dữ liệu thời gian thực
  • Di chuyển các tập dữ liệu phức tạp và tích hợp các luồng dữ liệu thời gian thực

Độ tin cậy và nhất quán

  • Đảm bảo tính nhất quán và tính toàn vẹn dữ liệu trong các môi trường phân tán
  • Triển khai và quản lý các bảo đảm giao dịch
  • Xử lý các sự cố và cơ chế phục hồi
  • Triển khai các tính năng độ tin cậy và nhất quán

Các tính năng và tùy chỉnh nâng cao

  • Triển khai catalog tùy chỉnh
  • Mở rộng Apache Iceberg với các tính năng tùy chỉnh
  • Triển khai catalog tùy chỉnh và mở rộng các chức năng của Apache Iceberg

Quản trị và tuân thủ quy định dữ liệu

  • Triển khai các chính sách quản trị dữ liệu
  • Tuân thủ các quy định dữ liệu
  • Quản lý các bản ghi kiểm duyệt và nguồn gốc dữ liệu
  • Triển khai các tính năng quản trị và tuân thủ quy định

Tổng kết và các bước tiếp theo

Yêu cầu

  • Tham gia các khái niệm cơ bản, các thao tác cơ bản và quản lý bảng Iceberg

Đối tượng

  • Kỹ sư dữ liệu
  • Kiến trúc sư dữ liệu
  • Phân tích viên dữ liệu
  • Nhà phát triển phần mềm
 21 Giờ

Số người tham gia


Giá cho mỗi học viên

Đánh giá (5)

Các khóa học sắp tới

Các danh mục liên quan