Đề cương khóa học
Giới thiệu
Tổng quan về đặc điểm và kiến trúc của "Open Studio for Big Data"
Cài đặt Open Studio for Big Data
Điều hướng giao diện người dùng
Hiểu về các thành phần và bộ kết nối dữ liệu lớn
Kết nối với cụm Hadoop
Đọc và viết dữ liệu
Xử lý dữ liệu bằng Hive và MapReduce
Phân tích kết quả
Cải thiện chất lượng dữ liệu lớn
Xây dựng một đường ống dữ liệu lớn
Quản lý người dùng, nhóm, vai trò và dự án
Triển khai Open Studio vào môi trường sản xuất
Giám sát Open Studio
Khắc phục sự cố
Tóm tắt và kết luận
Yêu cầu
- Hiểu về cơ sở dữ liệu quan hệ
- Hiểu về kho dữ liệu
- Hiểu các khái niệm ETL (Extract, Transform, Load)
Đối tượng học viên
- Chuyên gia thông tin kinh doanh
- Chuyên gia cơ sở dữ liệu
- Nhà phát triển SQL
- Nhà phát triển ETL
- Kiến trúc sư giải pháp
- Kiến trúc sư dữ liệu
- Chuyên gia kho dữ liệu
- Quản trị viên hệ thống và tích hợp
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Có đủ thực hành, người hướng dẫn có kiến thức tốt
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
các nhiệm vụ thực hành
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Khóa học - Python and Spark for Big Data (PySpark)
Dịch thuật bằng máy