Đề cương khóa học
Giới thiệu về DataStage
- Tổng quan về quá trình ETL
- Hiểu về kiến trúc DataStage
- Các thành phần chính của DataStage
Quản lý DataStage
- Cài đặt và cấu hình
- Quản lý người dùng và bảo mật
- Thiết lập dự án và quản lý môi trường
- Lập lịch và quản lý công việc
- Các thủ tục sao lưu và khôi phục
Các kỹ thuật trích xuất dữ liệu
- Kết nối với các nguồn dữ liệu khác nhau
- Trích xuất dữ liệu từ cơ sở dữ liệu, tệp phẳng và các nguồn bên ngoài
- Các tốt nhất trong việc trích xuất dữ liệu
Biến đổi dữ liệu với DataStage
- Hiểu về DataStage designer
- Làm việc với các loại stage khác nhau
- Triển khai logic kinh doanh trong các biến đổi
- Các kỹ thuật biến đổi dữ liệu nâng cao
Nạp và tích hợp dữ liệu
- Nạp dữ liệu vào các hệ thống đích
- Đảm bảo chất lượng và tính toàn vẹn dữ liệu
- Xử lý lỗi và ghi nhật ký
Điều chỉnh hiệu suất và tối ưu hóa
- Các tốt nhất trong việc điều chỉnh hiệu suất
- Quản lý tài nguyên
- Thu tuần và song song
Các chủ đề nâng cao
- Làm việc với DataStage director
- Gỡ lỗi và khắc phục sự cố
Tóm lược và các bước tiếp theo
Yêu cầu
- Cơ bản về khái niệm cơ sở dữ liệu
- Nắm vững SQL và các nguyên tắc về kho dữ liệu
Đối tượng học viên
- Các chuyên gia IT
- Quản trị viên cơ sở dữ liệu
- Lập trình viên
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Thực hành充分的手动操作,讲师知识渊博 (Note: The translation provided above mistakenly includes Chinese characters at the end. Here is the correct translation in Vietnamese without the error.) Thực hành đủ, giảng viên có kiến thức sâu rộng
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các bài tập thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy