Đề cương khóa học
Cơ sở của Data Warehousing
- Mục đích, thành phần và kiến trúc của kho dữ liệu
- Data marts, kho dữ liệu doanh nghiệp và mẫu lakehouse
- Cơ bản về OLTP vs OLAP và phân chia khối lượng công việc
Phương pháp mô hình hóa đa chiều
- Sự thật, chiều và mức độ hạt nhân
- Phân biệt giữa schema sao và schema tuyếtflake
- Các loại chiều thay đổi chậm và cách xử lý chúng
Quá trình ETL và ELT
- Chiến lược trích xuất từ OLTP và API
- Bảng biến đổi, làm sạch dữ liệu và tuân thủ
- Mẫu tải, quản lý và phụ thuộc hoặcchoreography
Chất lượng dữ liệu và Quản lý Metadata
- Phân tích cấu hình dữ liệu và quy tắc xác thực
- Tương thích dữ liệu chính và tham chiếu
- Nguồn gốc, danh mục và tài liệu ghi chép
Phân tích và Hiệu suất
- Kiến thức về lập hình lập phương, tổng hợp và các view vật lý
- Tách vùng dữ liệu, phân cụm và lập chỉ mục cho việc phân tích
- Quản lý khối lượng công việc, bộ nhớ đệm và tối ưu hóa truy vấn
Bảo mật và Quản trị
- Quyền truy cập, vai trò và bảo mật hàng loạt
- Cân nhắc tuân thủ và kiểm toán
- Hành vi sao lưu, phục hồi và độ tin cậy
Kiến trúc hiện đại
- Data warehouses đám mây và tính đàn hồi
- Nạp luồng dữ liệu và phân tích gần thời gian thực
- Tối ưu hóa chi phí và theo dõi
Chuyên đề: Từ Nguồn tới Mô hình Sao
- Mô phỏng quy trình kinh doanh thành sự thật và chiều
- Xây dựng một chuỗi làm việc ETL hoặc ELT từ đầu đến cuối
- Phát hành bảng điều khiển và xác nhận chỉ số
Tóm tắt và Bước tiếp theo
Yêu cầu
- Có hiểu biết về cơ sở dữ liệu quan hệ và SQL
- Kinh nghiệm trong phân tích dữ liệu hoặc báo cáo
- Có sự am hiểu cơ bản về nền tảng dữ liệu đám mây hoặc trên site nội bộ
Đối tượng
- Nhân viên phân tích dữ liệu chuyển sang kho dữ liệu
- Người phát triển BI và kỹ sư ETL
- Kỹ sư kiến trúc dữ liệu và trưởng nhóm
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Thực hành充分的手动操作,讲师知识渊博 (Note: The translation provided above mistakenly includes Chinese characters at the end. Here is the correct translation in Vietnamese without the error.) Thực hành đủ, giảng viên có kiến thức sâu rộng
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các bài tập thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy