Đề cương khóa học

Giới thiệu

  • Tổng quan về Databricks và Apache Spark
  • Hiểu về kiến trúc của Databricks

Bắt đầu làm việc

  • Cài đặt môi trường
  • Cài đặt và cấu hình Databricks
  • Điều hướng giao diện người dùng Databricks
  • Tạo không gian làm việc Databricks

Làm việc với dữ liệu trong Databricks

  • Kết nối đến nguồn dữ liệu Apache Spark
  • Hiểu về cột và kiểu dữ liệu cơ bản
  • Quản lý hệ thống tệp vào Notebooks

Quản lý công việc và cụm máy (clusters)

  • Tạo và cấu hình các cụm máy
  • Tạo công việc sử dụng Notebook
  • Chạy công việc
  • Xem công việc và chi tiết công việc

Sử dụng Delta Lake trong Databricks

  • Nạp dữ liệu vào Delta Lake
  • Quản lý dữ liệu trong Delta Lake

Bảo mật Databricks

  • Quản lý bảo mật của Databricks
  • Quản lý sao lưu và khôi phục

Gỡ lỗi

Tổng kết và các bước tiếp theo

Yêu cầu

  • Hiểu biết cơ bản về phân tích dữ liệu
  • Kiến thức về Apache Spark

Đối tượng

  • Kỹ sư Dữ liệu
  • Nghiên cứu viên Dữ liệu
  • Lập trình viên
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan