Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
Big Data Tổng quan:
- Big Data là gì
- Tại sao Big Data lại trở nên phổ biến
- Trường hợp điển hình của Big Data
- Đặc điểm của Big Data
- Giải pháp để làm việc với Big Data.
Hadoop và các thành phần của nó:
- Hadoop là gì và các thành phần của nó.
- Cấu trúc Hadoop và đặc điểm dữ liệu mà nó có thể xử lý.
- Tổng quan về lịch sử Hadoop, các công ty đang sử dụng và lý do tại sao họ bắt đầu sử dụng nó.
- Khung làm việc của Hadoop và các thành phần - giải thích chi tiết.
- HDFS là gì và cách đọc-ghi vào hệ thống tệp phân tán Hadoop.
- Cách cài đặt cụm Hadoop ở chế độ khác nhau - độc lập/pseudo/multi-node.
(Điều này bao gồm việc thiết lập một cụm Hadoop trong VirtualBox/KVM/VMware, cấu hình mạng cần được xem xét kỹ, chạy quái vật của Hadoop và kiểm tra cụm).
- Khung làm việc Map Reduce là gì và nó hoạt động như thế nào.
- Chạy công việc Map Reduce trên cụm Hadoop.
- Hiểu về sao chép, gương và nhận biết khung trong bối cảnh cụm Hadoop.
Kế hoạch Cụm Hadoop:
- Cách lập kế hoạch cho cụm hadoop của bạn.
- Hiểu về phần cứng/phần mềm để lập kế hoạch cụm hadoop của bạn.
- Hiểu về tải công việc và lập kế hoạch cụm để tránh lỗi và hoạt động tối ưu.
MapR là gì và tại sao sử dụng MapR:
- Tổng quan về MapR và kiến trúc của nó.
- Hiểu và làm việc với hệ thống kiểm soát MapR, thể tích MapR, bản chụp và gương.
- Lập kế hoạch cụm trong bối cảnh của MapR.
- So sánh MapR với các phân phối khác và Apache Hadoop.
- Cài đặt và triển khai cụm MapR.
Thiết lập và Quản lý Cụm:
- Quản lý dịch vụ, nút, bản chụp, thể tích gương và cụm từ xa.
- Hiểu và quản lý các nút.
- Hiểu về các thành phần của Hadoop, cài đặt các thành phần Hadoop cùng với dịch vụ MapR.
- Access dữ liệu trên cụm, bao gồm cả qua NFS Quản lý dịch vụ và nút.
- Quản lý dữ liệu bằng cách sử dụng thể tích, quản lý người dùng và nhóm, quản lý và gán vai trò cho các nút, hoán đổi kích hoạt và ngưng hoạt động của các nút, quản lý cụm và theo dõi hiệu suất, cấu hình/phân tích và theo dõi các tiêu chuẩn để giám sát hiệu suất, cấu hình và quản lý an ninh MapR.
- Hiểu và làm việc với M7 - Lưu trữ gốc cho bảng MapR.
- Cấu hình và điều chỉnh cụm để đạt được hiệu suất tối ưu.
Cập nhật và tích hợp với các cài đặt khác:
- Cập nhật phiên bản phần mềm của MapR và các loại cập nhật.
- Cấu hình cụm Mapr để truy cập cụm HDFS.
- Thiết lập cụm MapR trên Amazon Elastic Mapreduce.
Tất cả các chủ đề trên bao gồm hướng dẫn thực hành và buổi tập cho học viên có kinh nghiệm thực tế với công nghệ.
Requirements
- Kiến thức cơ bản về Linux FS
- Kiến thức cơ bản về Java
- Kiến thức về Apache Hadoop (đề nghị)
28 Hours
Testimonials (1)
các việc thực hành làm, cũng như lý thuyết được giảng dạy tốt bởi Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Course - Hadoop Administration on MapR
Machine Translated