Đề cương khóa học
- Phần 1: Giới thiệu về Big Data & NoSQL
- Big Data hệ sinh thái
- Tổng quan về NoSQL
- Định lý CAP
- Khi nào nên sử dụng NoSQL
- Lưu trữ theo cột
- HBase và NoSQL
- Phần 2: Giới thiệu về HBase
- Khái niệm và Thiết kế
- Kiến trúc (HMaster và Region Server)
- Tính toàn vẹn dữ liệu
- Hệ sinh thái HBase
- Thực hành: Khám phá HBase
- Phần 3: Mô hình dữ liệu HBase
- Namespaces, Tables và Regions
- Rows, columns, column families, versions
- HBase Shell và các lệnh Admin
- Thực hành: HBase Shell
- Phần 3: Lập trình HBase bằng Java API
- Giới thiệu về Java API
- Đường dẫn Đọc / Ghi
- Dữ liệu chuỗi thời gian
- Quét
- Map Reduce
- Bộ lọc
- Bộ đếm
- Co-processors
- Thực hành (nhiều): Sử dụng HBase Java API để triển khai chuỗi thời gian, Map Reduce, Bộ lọc và bộ đếm.
- Phần 4: Thiết kế lược đồ HBase: Buổi làm nhóm
- Sinh viên được trình bày các trường hợp sử dụng thực tế
- Sinh viên làm việc nhóm để đưa ra các giải pháp thiết kế
- Thảo luận / đánh giá và học hỏi từ nhiều thiết kế
- Thực hành: Triển khai một kịch bản trong HBase
- Phần 5: Nội bộ HBase
- Hiểu HBase hoạt động như thế nào
- Memfile / HFile / WAL
- Lưu trữ HDFS
- Nén
- Tách
- Bộ lọc Bloom
- Bộ nhớ đệm
- Chẩn đoán
- Phần 6: Cài đặt và cấu hình HBase
- Lựa chọn phần cứng
- Phương pháp cài đặt
- Cấu hình phổ biến
- Thực hành: Cài đặt HBase
- Phần 7: Hệ sinh thái HBase
- Phát triển ứng dụng bằng HBase
- Tương tác với các Hadoop stack khác (MapReduce, Pig, Hive)
- Framework xung quanh HBase
- Các khái niệm nâng cao (co-processors)
- Thực hành: Viết ứng dụng HBase
- Phần 8: Giám sát và Thực tiễn tốt nhất
- Công cụ và thực tiễn giám sát
- Tối ưu hóa HBase
- HBase trên đám mây
- Các trường hợp sử dụng HBase trong thực tế
- Thực hành: Kiểm tra các chỉ số quan trọng của HBase
Requirements
- thành thạo ngôn ngữ lập trình Java
- thành thạo ngôn ngữ lập trình Java (sử dụng dòng lệnh, chỉnh sửa tệp bằng vi / nano)
- Một IDE như Eclipse hoặc IntelliJ
Môi trường thực hành:
Một cụm HBase hoạt động sẽ được cung cấp cho sinh viên. Sinh viên cần một ứng dụng khách SSH và trình duyệt để truy cập cụm.
Không cần cài đặt: Không cần cài đặt phần mềm HBase trên máy của sinh viên!
Testimonials (5)
Intresting presentation and excercises
Szymon - Agora SA
Course - Scylla Database
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
It gives me an insight on Redis, and also guide me to the right path if I want to know more about Redis
Ameer Fiqri Barahim - Sarawak Information Systems Sdn Bhd
Course - Redis for High Availability and Performance Training Course
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
Liked very much the interactive way of learning.