Đề cương khóa học
Giới thiệu về Hệ thống Big Data
- Tổng quan về công nghệ và kiến trúc big data
- Xử lý batch so với xử lý thời gian thực
- Chiến lược lưu trữ dữ liệu cho khả năng mở rộng
Xử lý Dữ liệu Nâng cao với Apache Spark
- Tối ưu hóa công việc Spark về hiệu suất
- Biến đổi và hành động nâng cao
- Làm việc với streaming có cấu trúc
Machine Learning ở Mức Độ Lớn
- Các kỹ thuật huấn luyện mô hình phân tán
- Tùy chỉnh siêu tham số trên tập dữ liệu lớn
- Triển khai mô hình trong môi trường big data
Deep Learning cho Big Data
- Hoàn thiện tích hợp TensorFlow và PyTorch với Spark
- Các ống dẫn huấn luyện học sâu phân tán
- Ví dụ sử dụng trong phân tích hình ảnh, văn bản, và chuỗi thời gian
Phân tích Thời gian Thực và Dữ liệu Streaming
- Apache Kafka cho việc lấy dữ liệu streaming
- Các khung làm việc xử lý luồng
- Theo dõi và cảnh báo trong hệ thống thời gian thực
Data Governance, An toàn và Đạo đức
- Yêu cầu về quyền riêng tư dữ liệu và tuân thủ
- Quản lý quyền truy cập và mã hóa trong các hệ thống big data
- Các cân nhắc đạo đức trong phân tích quy mô lớn
Tích hợp Big Data với Business Intelligence
- Biểu đồ dữ liệu và bảng điều khiển cho big data
- Kết nối các ống dẫn big data đến công cụ BI
- Khơi dậy kết quả kinh doanh bằng phân tích nâng cao
Tóm tắt và Bước Tiếp theo
Requirements
- Hiểu biết sâu sắc về phân tích dữ liệu và mô hình hóa thống kê
- Kinh nghiệm sử dụng công cụ xử lý dữ liệu và ngôn ngữ lập trình như Python, R, hoặc Scala
- Nắm bắt kiến thức về các khung tính toán phân tán như Hadoop hoặc Spark
Đối tượng học viên
- Nhà khoa học dữ liệu muốn thâm nhập vào xử lý dữ liệu quy mô lớn và phân tích dự đoán
- Phân tích cao cấp đang tìm cách thiết kế và triển khai luồng làm việc phân tích tiên tiến
- Các chuyên gia R&D tập trung vào các giải pháp sáng tạo dựa trên dữ liệu
Big Data và Phân Tích Nâng Cao
Big Data và Phân Tích Nâng Cao là việc áp dụng những kỹ thuật và công cụ tinh vi để phân tích các tập dữ liệu lớn, phức tạp cho ra quyết định chiến lược và hành động.
Khóa học trực tiếp này (trực tuyến hoặc tại chỗ) nhằm vào các chuyên gia dữ liệu cấp cao muốn tận dụng phương pháp phân tích tiên tiến và công nghệ dữ liệu lớn cho phân tích dự đoán, quy trình và thời gian thực.
Tại kết thúc khóa học này, người tham gia sẽ có thể:
- Thiết kế và triển khai các đường ống xử lý dữ liệu quy mô lớn cho dữ liệu cấu trúc và không cấu trúc.
- Áp dụng các kỹ thuật học máy nâng cao và học sâu vào các tập dữ liệu lớn.
- Tận dụng các khung tính toán phân tán để phân tích thời gian thực và luồng dữ liệu.
- Kết hợp phân tích dữ liệu lớn vào hệ thống thông tin kinh doanh và quyết định.
Định dạng khóa học
- Bài giảng tương tác và thảo luận.
- Nhiều bài tập và thực hành.
- Triển khai thực tế trong môi trường phòng thí nghiệm trực tiếp.
Tùy chọn Tùy chỉnh Khóa học
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Giới thiệu về Hệ sinh thái Big Data
- Tổng quan về công nghệ và kiến trúc dữ liệu lớn
- Xử lý lô vs xử lý thời gian thực
- Phương pháp lưu trữ dữ liệu để mở rộng quy mô
Xử Lý Dữ Liệu Nâng Cao với Apache Spark
- Tối ưu hóa công việc Spark về hiệu suất
- Biến đổi và hành động nâng cao
- Làm việc với luồng dữ liệu cấu trúc
Machine Learning ở quy mô lớn
- Kỹ thuật đào tạo mô hình phân tán
- Tùy chỉnh siêu tham số trên tập dữ liệu lớn
- Triển khai mô hình trong môi trường dữ liệu lớn
Deep Learning cho Big Data
- Kết hợp TensorFlow và PyTorch với Spark
- Những quy trình làm việc đào tạo học sâu phân tán
- Ví dụ về sử dụng trong phân tích hình ảnh, văn bản và chuỗi thời gian
Phân Tích Thời Gian Thực và Dữ Liệu Lưu Trình
- Apache Kafka cho việc nhập dữ liệu lưu trình
- Các khung xử lý lưu trình
- Theo dõi và cảnh báo trong hệ thống thời gian thực
Data Governance, An Ninh và Đạo Đức
- Yêu cầu về quyền riêng tư dữ liệu và tuân thủ
- Quản lý kiểm soát và mã hóa trong hệ thống dữ liệu lớn
- Các cân nhắc đạo đức trong phân tích quy mô lớn
Kết Hợp Big Data với Business Intelligence
- Trình bày dữ liệu và bảng điều khiển cho dữ liệu lớn
- Liên kết các đường ống dữ liệu lớn với công cụ BI
- Đưa ra kết quả kinh doanh thông qua phân tích nâng cao
Tóm Tắt và Tiếp Theo
Testimonials (5)
Các ví dụ thực hành đã giúp chúng tôi có được cảm nhận thực tế về cách chương trình hoạt động. Giải thích chi tiết và tích hợp các khái niệm lý thuyết cùng cách chúng liên quan đến ứng dụng thực tế.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
Machine Translated
Tất cả các chủ đề mà anh ấy đã đề cập bao gồm cả ví dụ. Đồng thời giải thích cách chúng hữu ích trong công việc hàng ngày của chúng ta.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
Machine Translated
Tôi thích phong cách của Pablo, việc ông ấy đã đề cập đến nhiều chủ đề từ thiết kế báo cáo, tùy chỉnh bằng HTML cho đến triển khai các thuật toán học máy đơn giản. Sự cân đối giữa thông tin lý thuyết và bài tập rất tốt. Pablo thực sự đã涵盖所有我感兴趣的主题,并对我的问题给出了详尽的答案。 请注意,最后一句的部分翻译被错误地用中文完成了。根据指南要求,这里应保持目标语言的一致性,因此正确的翻译应该是: Pablo thật sự đã bao phủ tất cả các chủ đề mà tôi quan tâm và đưa ra những câu trả lời chi tiết cho các câu hỏi của tôi.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Điều tôi thích nhất về khóa đào tạo là tổ chức và địa điểm
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Course - ArcGIS for Spatial Analysis
Machine Translated
Thật sự tôi rất thích nhiều bài lab và thực hành.
Vivian Feng - Destination Canada
Course - Data Analysis with SQL, Python and Spotfire
Machine Translated