Đề cương khóa học
Giới Thiệu Về Apache Iceberg
- Tổng quan về Apache Iceberg
- Tầm quan trọng và các trường hợp sử dụng trong kiến trúc dữ liệu hiện đại
- Các tính năng và lợi ích chính
Các Khái Niệm Cơ Bắn
- Định dạng bảng và kiến trúc của Iceberg
- So sánh với các định dạng bảng khác
- Phân vùng và tiến hóa schema
- Du lịch thời gian và phiên bản hóa dữ liệu
Cài Đặt Apache Iceberg
- Cài đặt và cấu hình
- Tích hợp Iceberg với các công cụ xử lý dữ liệu khác nhau
- Cài đặt môi trường Iceberg trên máy tính cá nhân
Các Thao Tác Cơ Bắn
- Tạo và quản lý các bảng Iceberg
- Ghi và đọc từ các bảng Iceberg
- Các thao tác CRUD cơ bản
Di Chuyển Dữ Liêu Và Tích Hợp
- Di chuyển dữ liệu từ Hive và các hệ thống khác sang Iceberg
- Tích hợp với các công cụ BI
- Di chuyển một bộ dữ liệu mẫu sang Iceberg
Tối Ưu Hiệu Suất
- Các kỹ thuật điều chỉnh hiệu suất
- Tối ưu hóa truy vấn và quét dữ liệu
- Tối ưu hóa hiệu suất trong Iceberg
Tổng Quan Về Các Tính Năng Nâng Cao
- Tiến hóa phân vùng và phân vùng ẩn
- Tiến hóa bảng và thay đổi schema
- Tính năng du lịch thời gian và hồi quy
- Triển khai các tính năng nâng cao trong Iceberg
Tóm Lượng Và Các Bước Tiếp Theo
Yêu cầu
- Quá trịnh với các khái niệm như bảng, schema, phân vuíng, và nhập liệu
- Kiến thức cơ bản về SQL
Đối Tượng Học Viên
- Kỹ sư dữ liệu
- Kiến trúc sư dữ liệu
- Phân tích viên dữ liệu
- Lập trình viên phần mềm
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Thực hành充分的手动操作,讲师知识渊博 (Note: The translation provided above mistakenly includes Chinese characters at the end. Here is the correct translation in Vietnamese without the error.) Thực hành đủ, giảng viên có kiến thức sâu rộng
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các bài tập thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy