Đề cương khóa học
Bài 1: Quản lý Dữ liệu trong HDFS
- Các Định dạng Dữ liệu Khác Nhau (JSON / Avro / Parquet)
- Các Phương án Nén
- Masking Dữ liệu
- Thực hành: Phân tích các định dạng dữ liệu khác nhau; kích hoạt nén
Bài 2: Pig Nâng Cao
- Hàm Định nghĩa Người Dùng
- Giới thiệu về Thư viện Pig (ElephantBird / Data-Fu)
- Tải dữ liệu cấu trúc phức tạp bằng Pig
- Tối ưu hóa Pig
- Thực hành: Lập trình Pig nâng cao, phân tích các kiểu dữ liệu phức tạp
Bài 3: Hive Nâng Cao
- Hàm Định nghĩa Người Dùng
- Bảng đã nén
- Tối ưu hóa Hiệu suất Hive
- Thực hành: Tạo bảng đã nén, đánh giá định dạng và cấu hình bảng
Bài 4: HBase Nâng Cao
- Mô hình Schema Nâng Cao
- Nén dữ liệu
- Tải dữ liệu hàng loạt
- So sánh Bảng Rộng / Bảng Dài
- HBase và Pig
- HBase và Hive
- Tối ưu hóa Hiệu suất HBase
- Thực hành: Tối ưu hóa HBase; truy cập dữ liệu HBase từ Pig & Hive; Sử dụng Phoenix cho mô hình dữ liệu
Yêu cầu
- thành thạo ngôn ngữ lập trình Java (hầu hết các bài tập lập trình đều sử dụng Java)
- thành thạo môi trường Linux (có thể điều hướng dòng lệnh Linux, chỉnh sửa tệp tin bằng vi / nano)
- có kiến thức cơ bản về Hadoop.
Môi trường Thí Nghiệm
Không Cần Cài Đặt: Học viên không cần cài đặt phần mềm Hadoop trên máy của mình! Một cụm Hadoop đang hoạt động sẽ được cung cấp cho học viên.
Học viên cần có:
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
Trong quá trình thực hành, James đã giải thích cho tôi từng bước một khi tôi gặp khó khăn, với độ chi tiết hơn. Tôi hoàn toàn mới với NIFI. Ông đã giải thích mục đích thật sự của NIFI, thậm chí cả những kiến thức cơ bản như mã nguồn mở. Ông đã bao quát mọi khái niệm về Nifi từ mức độ Người Mới Bắt Đầu đến mức độ Nhà Phát Triển.
Firdous Hashim Ali - MOD A BLOCK
Khóa học - Apache NiFi for Administrators
Dịch thuật bằng máy
Rằng tôi đã có nó từ đầu.
Peter Scales - CACI Ltd
Khóa học - Apache NiFi for Developers
Dịch thuật bằng máy
những điều thực tế cần làm, đồng thời lý thuyết cũng được Ajay trình bày tốt
Dominik Mazur - Capgemini Polska Sp. z o.o.
Khóa học - Hadoop Administration on MapR
Dịch thuật bằng máy
Tôi rất thích máy ảo (VM) Giáo viên có kiến thức rất sâu rộng về chủ đề cũng như các chủ đề khác, ông ấy rất thân thiện và dễ gần Tôi thích cơ sở vật chất ở Dubai.
Safar Alqahtani - Elm Information Security
Khóa học - Big Data Analytics in Health
Dịch thuật bằng máy