Đề cương khóa học
Giới thiệu về DataStage
- Tổng quan về quy trình ETL
- Hiểu kiến trúc của DataStage
- Các thành phần chính của DataStage
Quản trị DataStage
- Cài đặt và cấu hình
- Quản lý người dùng và bảo mật
- Thiết lập dự án và quản lý môi trường
- Đặt lịch và quản lý công việc
- Thủ tục sao lưu và phục hồi
Kỹ thuật trích xuất dữ liệu
- Kết nối với các nguồn dữ liệu khác nhau
- Trích xuất dữ liệu từ cơ sở dữ liệu, tệp văn bản phẳng và các nguồn bên ngoài
- Các thực hành tốt nhất cho việc trích xuất dữ liệu
Chuyển đổi dữ liệu với DataStage
- Hiểu DataStage designer
- Làm việc với các loại giai đoạn khác nhau
- Triển khai logic kinh doanh trong quá trình chuyển đổi
- Các kỹ thuật chuyển đổi dữ liệu nâng cao
Tải và tích hợp dữ liệu
- Tải dữ liệu vào hệ thống đích
- Đảm bảo chất lượng và độ chính xác của dữ liệu
- Xử lý lỗi và ghi log
Tối ưu hóa hiệu suất
- Các thực hành tốt nhất cho việc tối ưu hóa hiệu suất
- Quản lý tài nguyên
- Đặt lịch công việc và song song
Chủ đề nâng cao
- Làm việc với DataStage director
- Gỡ lỗi và khắc phục sự cố
Tổng kết và các bước tiếp theo
Yêu cầu
- Hiểu biết cơ bản về khái niệm cơ sở dữ liệu
- Thạo SQL và nguyên lý kho dữ liệu
Đối tượng
- Chuyên viên công nghệ thông tin
- Quản trị viên cơ sở dữ liệu
- Nhà phát triển
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Có đủ thực hành, người hướng dẫn có kiến thức tốt
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các nhiệm vụ thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy