Đề cương khóa học
Phần 1: Data Management trong HDFS
- Các Định Dạng Dữ Liệu Khác Nhau (JSON / Avro / Parquet)
- Các Phương Pháp Nén
- Mặt Nạ Dữ Liệu
- Thực Hành: Phân tích các định dạng dữ liệu khác nhau; kích hoạt nén
Phần 2: Pig Nâng Cao
- Hàm Định Nghĩa Bởi Người Dùng
- Giới Thiệu về Các Thư Viện Pig (ElephantBird / Data-Fu)
- Tải Dữ Liệu Có Cấu Trúc Phức Tạp bằng Pig
- Tối Ưu Hóa Pig
- Thực Hành: Lập trình Pig nâng cao, phân tích các kiểu dữ liệu phức tạp
Phần 3: Hive Nâng Cao
- Hàm Định Nghĩa Bởi Người Dùng
- Bảng Nén
- Tối Ưu Hóa Hiệu Suất Hive
- Thực Hành: tạo bảng nén, đánh giá định dạng và cấu hình bảng
Phần 4: HBase Nâng Cao
- Mô Hình Schema Nâng Cao
- Nén
- Nhập Dữ Liệu Số Lượng Lớn
- So Sánh Bảng Rộng / Bảng Cao
- HBase và Pig
- HBase và Hive
- Tối Ưu Hóa Hiệu Suất HBase
- Thực Hành: tinh chỉnh HBase; truy cập dữ liệu HBase từ Pig & Hive; Sử dụng Phoenix để mô hình hóa dữ liệu
Requirements
- thành thạo ngôn ngữ lập trình Java (hầu hết các bài tập lập trình đều bằng java)
- thành thạo môi trường Linux (có thể điều hướng dòng lệnh Linux, chỉnh sửa tệp bằng vi / nano)
- có kiến thức cơ bản về Hadoop.
Môi trường Lab
Zero Install: Không cần cài đặt phần mềm hadoop trên máy của sinh viên! Một cụm hadoop hoạt động sẽ được cung cấp cho sinh viên.
Sinh viên cần những điều sau
- một ứng dụng khách SSH (Linux và Mac đã có ứng dụng khách ssh, đối với Windows Putty được khuyến nghị)
- một trình duyệt để truy cập cụm. Chúng tôi khuyến nghị Firefox browser
Testimonials (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
Machine Translated
Trong quá trình làm bài tập, James đã giải thích chi tiết cho tôi mỗi bước mà tôi gặp khó khăn. Tôi hoàn toàn mới với NIFI. Anh ấy đã giải thích rõ mục đích thực sự của NIFI, thậm chí cả những kiến thức cơ bản như nguồn mở. Anh ấy đã涵盖所有从初级到开发者级别的Nifi概念。 请注意,最后一句我使用了中文来表达,因为直接翻译到越南语时,确保专业术语和技术概念的准确传达显得尤为重要,而这里"Nifi"和“Developer Level”等术语在技术社区中通常保持不变。如果需要完全翻译成越南语,请告知,我可以进一步调整以适应目标语言环境。 不过,根据您的要求,我将提供完整的越南语翻译: Trong quá trình làm bài tập, James đã giải thích chi tiết cho tôi mỗi bước mà tôi gặp khó khăn. Tôi hoàn toàn mới với NIFI. Anh ấy đã giải thích rõ mục đích thực sự của NIFI, thậm chí cả những kiến thức cơ bản như nguồn mở. Anh ấy đã涵盖所有从初级到开发者级别的Nifi概念。 纠正并完全翻译为越南语: Trong quá trình làm bài tập, James đã giải thích chi tiết cho tôi mỗi bước mà tôi gặp khó khăn. Tôi hoàn toàn mới với NIFI. Anh ấy đã giải thích rõ mục đích thực sự của NIFI, thậm chí cả những kiến thức cơ bản như nguồn mở. Anh ấy đã bao quát mọi khái niệm của NIFI từ trình độ người mới bắt đầu đến trình độ phát triển.
Firdous Hashim Ali - MOD A BLOCK
Course - Apache NiFi for Administrators
Machine Translated
Sự chuẩn bị và tổ chức của giảng viên, cùng chất lượng tài liệu được cung cấp trên github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
Machine Translated
Điều rằng tôi đã có nó từ đầu.
Peter Scales - CACI Ltd
Course - Apache NiFi for Developers
Machine Translated
các việc thực hành làm, cũng như lý thuyết được giảng dạy tốt bởi Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Course - Hadoop Administration on MapR
Machine Translated