Đề cương khóa học
Giới thiệu
- Giới thiệu về các giải pháp Cloud Computing và Big Data
- Tổng quan về các tính năng và kiến trúc của Apache Hadoop
Thiết lập Hadoop
- Lập kế hoạch cho một cụm Hadoop (tại chỗ, trên đám mây, v.v.)
- Chọn hệ điều hành và bản phân phối Hadoop
- Cung cấp tài nguyên (phần cứng, mạng, v.v.)
- Tải xuống và cài đặt phần mềm
- Định kích thước cụm để đảm bảo tính linh hoạt
Làm việc với HDFS
- Hiểu về Hệ thống Tệp Phân tán Hadoop (HDFS)
- Tổng quan về Tham khảo Lệnh HDFS
- Accessing HDFS
- Thực hiện các thao tác tệp cơ bản trên HDFS
- Sử dụng S3 như một bổ sung cho HDFS
Tổng quan về MapReduce
- Hiểu về luồng dữ liệu trong khung MapReduce
- Map, Shuffle, Sort và Reduce
- Demo: Tính toán mức lương hàng đầu
Làm việc với YARN
- Hiểu về quản lý tài nguyên trong Hadoop
- Làm việc với ResourceManager, NodeManager, Application Master
- Lên lịch công việc dưới YARN
- Lên lịch cho số lượng lớn các nút và cụm
- Demo: Lên lịch công việc
Tích hợp Hadoop với Spark
- Thiết lập bộ nhớ cho Spark (HDFS, Amazon, S3, NoSQL, v.v.)
- Hiểu về Tập dữ liệu phân tán linh hoạt (RDD)
- Tạo một RDD
- Triển khai các phép biến đổi RDD
- Demo: Triển khai chương trình tìm kiếm văn bản cho tiêu đề phim
Quản lý một cụm Hadoop
- Giám sát Hadoop
- Bảo mật một cụm Hadoop
- Thêm và xóa các nút
- Chạy điểm chuẩn hiệu suất
- Tinh chỉnh một cụm Hadoop để tối ưu hóa hiệu suất
- Sao lưu, khôi phục và lập kế hoạch liên tục kinh doanh
- Đảm bảo tính khả dụng cao (HA)
Nâng cấp và Di chuyển một cụm Hadoop
- Đánh giá các yêu cầu về khối lượng công việc
- Nâng cấp Hadoop
- Di chuyển từ tại chỗ sang đám mây và ngược lại
- Khôi phục từ các lỗi
Khắc phục sự cố
Tóm tắt và Kết luận
Yêu cầu
- Kinh nghiệm quản trị hệ thống
- Kinh nghiệm với dòng lệnh Linux
- Hiểu biết về các khái niệm dữ liệu lớn
Đối tượng
- Quản trị viên hệ thống
- DBA
Đánh giá (5)
Các ví dụ trực tiếp
Ahmet Bolat - Accenture Industrial SS
Khóa học - Python, Spark, and Hadoop for Big Data
Dịch thuật bằng máy
rất tương tác...
Richard Langford
Khóa học - SMACK Stack for Data Science
Dịch thuật bằng máy
Có đủ thực hành, người hướng dẫn có kiến thức tốt
Chris Tan
Khóa học - A Practical Introduction to Stream Processing
Dịch thuật bằng máy
Học về Spark Streaming, Databricks và AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Khóa học - Apache Spark in the Cloud
Dịch thuật bằng máy
những điều thực tế cần làm, đồng thời lý thuyết cũng được Ajay trình bày tốt
Dominik Mazur - Capgemini Polska Sp. z o.o.
Khóa học - Hadoop Administration on MapR
Dịch thuật bằng máy