Đề cương khóa học
- Phần 1: Giới thiệu về Big Data & NoSQL
- Big Data hệ sinh thái
- Tổng quan về NoSQL
- Định lý CAP
- Khi nào nên sử dụng NoSQL
- Lưu trữ theo cột
- HBase và NoSQL
- Phần 2: Giới thiệu về HBase
- Khái niệm và Thiết kế
- Kiến trúc (HMaster và Region Server)
- Tính toàn vẹn dữ liệu
- Hệ sinh thái HBase
- Thực hành: Khám phá HBase
- Phần 3: Mô hình dữ liệu HBase
- Namespaces, Tables và Regions
- Rows, columns, column families, versions
- HBase Shell và các lệnh Admin
- Thực hành: HBase Shell
- Phần 3: Lập trình HBase bằng Java API
- Giới thiệu về Java API
- Đường dẫn Đọc / Ghi
- Dữ liệu chuỗi thời gian
- Quét
- Map Reduce
- Bộ lọc
- Bộ đếm
- Co-processors
- Thực hành (nhiều): Sử dụng HBase Java API để triển khai chuỗi thời gian, Map Reduce, Bộ lọc và bộ đếm.
- Phần 4: Thiết kế lược đồ HBase: Buổi làm nhóm
- Sinh viên được trình bày các trường hợp sử dụng thực tế
- Sinh viên làm việc nhóm để đưa ra các giải pháp thiết kế
- Thảo luận / đánh giá và học hỏi từ nhiều thiết kế
- Thực hành: Triển khai một kịch bản trong HBase
- Phần 5: Nội bộ HBase
- Hiểu HBase hoạt động như thế nào
- Memfile / HFile / WAL
- Lưu trữ HDFS
- Nén
- Tách
- Bộ lọc Bloom
- Bộ nhớ đệm
- Chẩn đoán
- Phần 6: Cài đặt và cấu hình HBase
- Lựa chọn phần cứng
- Phương pháp cài đặt
- Cấu hình phổ biến
- Thực hành: Cài đặt HBase
- Phần 7: Hệ sinh thái HBase
- Phát triển ứng dụng bằng HBase
- Tương tác với các Hadoop stack khác (MapReduce, Pig, Hive)
- Framework xung quanh HBase
- Các khái niệm nâng cao (co-processors)
- Thực hành: Viết ứng dụng HBase
- Phần 8: Giám sát và Thực tiễn tốt nhất
- Công cụ và thực tiễn giám sát
- Tối ưu hóa HBase
- HBase trên đám mây
- Các trường hợp sử dụng HBase trong thực tế
- Thực hành: Kiểm tra các chỉ số quan trọng của HBase
Requirements
- thành thạo ngôn ngữ lập trình Java
- thành thạo ngôn ngữ lập trình Java (sử dụng dòng lệnh, chỉnh sửa tệp bằng vi / nano)
- Một IDE như Eclipse hoặc IntelliJ
Môi trường thực hành:
Một cụm HBase hoạt động sẽ được cung cấp cho sinh viên. Sinh viên cần một ứng dụng khách SSH và trình duyệt để truy cập cụm.
Không cần cài đặt: Không cần cài đặt phần mềm HBase trên máy của sinh viên!
Testimonials (5)
Đề xuất sửa lỗi chính tả và dịch: Bài trình bày và bài tập thú vị
Szymon - Agora SA
Course - Scylla Database
Machine Translated
Sự chuẩn bị và tổ chức của giảng viên, cùng chất lượng tài liệu được cung cấp trên github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
Machine Translated
Nó giúp tôi hiểu về Redis và cũng dẫn dắt tôi đi đúng hướng nếu tôi muốn biết thêm về Redis
Ameer Fiqri Barahim - Sarawak Information Systems Sdn Bhd
Course - Redis for High Availability and Performance Training Course
Machine Translated
các việc thực hành làm, cũng như lý thuyết được giảng dạy tốt bởi Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Course - Hadoop Administration on MapR
Machine Translated
Liked very much the interactive way of learning.
Luigi Loiacono
Course - Data Analysis with Hive/HiveQL
Machine Translated