Cảm ơn bạn đã gửi yêu cầu! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Cảm ơn bạn đã gửi đặt chỗ! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Đề cương khóa học
Giới thiệu
- Tổng quan về Databricks và Apache Spark
- Hiểu về kiến trúc của Databricks
Bắt đầu làm việc
- Cài đặt môi trường
- Cài đặt và cấu hình Databricks
- Điều hướng giao diện người dùng Databricks
- Tạo không gian làm việc Databricks
Làm việc với dữ liệu trong Databricks
- Kết nối đến nguồn dữ liệu Apache Spark
- Hiểu về cột và kiểu dữ liệu cơ bản
- Quản lý hệ thống tệp vào Notebooks
Quản lý công việc và cụm máy (clusters)
- Tạo và cấu hình các cụm máy
- Tạo công việc sử dụng Notebook
- Chạy công việc
- Xem công việc và chi tiết công việc
Sử dụng Delta Lake trong Databricks
- Nạp dữ liệu vào Delta Lake
- Quản lý dữ liệu trong Delta Lake
Bảo mật Databricks
- Quản lý bảo mật của Databricks
- Quản lý sao lưu và khôi phục
Gỡ lỗi
Tổng kết và các bước tiếp theo
Yêu cầu
- Hiểu biết cơ bản về phân tích dữ liệu
- Kiến thức về Apache Spark
Đối tượng
- Kỹ sư Dữ liệu
- Nghiên cứu viên Dữ liệu
- Lập trình viên
14 Giờ học