Đề cương khóa học

Bộ phận 1: Data Management trong HDFS

  • Nhiều Định dạng Dữ liệu (JSON / Avro / Parquet)
  • Các Kỹ thuật Nén
  • Mặt nạ Dữ liệu
  • Thực hành: Phân tích các định dạng dữ liệu khác nhau; kích hoạt nén

Bộ phận 2: Pig Nâng cao

  • Hàm Định nghĩa bởi Người dùng
  • Giới thiệu về Thư viện Pig (ElephantBird / Data-Fu)
  • Tải Dữ liệu Cấu trúc Phức tạp bằng Pig
  • Tối ưu hóa Pig
  • Thực hành: lập trình Pig nâng cao, phân tích các loại dữ liệu phức tạp

Bộ phận 3 : Hive Nâng cao

  • Hàm Định nghĩa bởi Người dùng
  • Các Bảng Nén
  • Tối ưu hóa Hiệu suất của Hive
  • Thực hành: tạo bảng nén, đánh giá định dạng và cấu hình bảng

Bộ phận 4 : HBase Nâng cao

  • Mô hình hóa CSDL Nâng cao
  • Nén
  • Nạp Dữ liệu Tích cực
  • So sánh bảng rộng / bảng dài
  • HBase và Pig
  • HBase và Hive
  • Tối ưu hóa Hiệu suất HBase
  • Thực hành: tối ưu hóa HBase; truy cập dữ liệu HBase từ Pig & Hive; Sử dụng Phoenix cho thiết kế dữ liệu

Requirements

  • thoải mái với ngôn ngữ lập trình Java (hầu hết các bài tập lập trình đều được viết bằng Java)
  • quen thuộc với môi trường Linux (có thể điều hướng dòng lệnh của Linux, chỉnh sửa file sử dụng vi / nano)
  • có kiến thức làm việc về Hadoop.

Môi trường phòng lab

Không cần cài đặt: Học viên không cần phải cài đặt phần mềm Hadoop trên máy tính của mình! Một cụm Hadoop hoạt động sẽ được cung cấp cho học viên.

Học viên sẽ cần những điều sau

 21 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories