Lập trình GPU - So sánh OpenCL, CUDA và ROCm Khóa Học Đào Tạo

Lập trình GPU là kỹ thuật tận dụng sức mạnh xử lý song song của GPU để tăng tốc các ứng dụng yêu cầu tính toán hiệu năng cao, như trí tuệ nhân tạo, trò chơi, đồ họa và tính toán khoa học. Có nhiều khung công tác (frameworks) cho phép lập trình GPU, mỗi khung có những ưu điểm và nhược điểm riêng. OpenCL là tiêu chuẩn mở có thể được sử dụng để lập trình CPU, GPU và các thiết bị khác từ các nhà sản xuất khác nhau, trong khi CUDA chỉ dành cho GPU của NVIDIA. ROCm là một nền tảng hỗ trợ lập trình GPU trên GPU của AMD và cũng cung cấp khả năng tương thích với CUDA và OpenCL.

Khóa học trực tiếp do giảng viên hướng dẫn (trực tuyến hoặc tại chỗ) này nhằm vào các nhà phát triển có trình độ từ cơ bản đến trung cấp, mong muốn sử dụng các khung công tác khác nhau cho lập trình GPU và so sánh các tính năng, hiệu suất và khả năng tương thích của chúng.

Sau khi kết thúc khóa học này, người tham gia sẽ có thể:

Thiết lập môi trường phát triển bao gồm OpenCL SDK, CUDA Toolkit, ROCm Platform, một thiết bị hỗ trợ OpenCL, CUDA hoặc ROCm, và Visual Studio Code.
Tạo chương trình GPU cơ bản thực hiện phép cộng vector sử dụng OpenCL, CUDA và ROCm, và so sánh cú pháp, cấu trúc và cách thực thi của từng khung công tác.
Sử dụng các API tương ứng để truy vấn thông tin thiết bị, cấp phát và giải phóng bộ nhớ thiết bị, sao chép dữ liệu giữa máy chủ và thiết bị, khởi chạy nhân (kernels) và đồng bộ hóa luồng.
Sử dụng các ngôn ngữ tương ứng để viết nhân thực thi trên thiết bị và xử lý dữ liệu.
Sử dụng các hàm, biến và thư viện tích hợp sẵn để thực hiện các tác vụ và thao tác thông thường.
Sử dụng các không gian bộ nhớ như global, local, constant và private để tối ưu hóa việc chuyển dữ liệu và truy cập bộ nhớ.
Sử dụng các mô hình thực thi tương ứng để kiểm soát các luồng, khối và lưới định nghĩa tính song song.
Gỡ lỗi và thử nghiệm chương trình GPU sử dụng các công cụ như CodeXL, CUDA-GDB, CUDA-MEMCHECK và NVIDIA Nsight.
Tối ưu hóa chương trình GPU sử dụng các kỹ thuật như coalescing, caching, prefetching và profiling.

Định dạng của khóa học

Bài giảng tương tác và thảo luận.
Nhiều bài tập và thực hành.
Thực hiện trên môi trường phòng thí nghiệm trực tiếp.

Tùy chỉnh khóa học

Để yêu cầu khóa học tùy chỉnh, vui lòng liên hệ với chúng tôi để sắp xếp.

Cảm ơn bạn đã gửi yêu cầu! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.

Cảm ơn bạn đã gửi đặt chỗ! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.

Các khóa học sắp tới

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

2026-04-27 09:30

28 Giờ học

Khách sạn Pullman Hải Phòng

406,480,472 VND (Trực tuyến)

406,480,472 VND (Phòng học)

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

2026-05-11 09:30

28 Giờ học

Khách sạn Wink

406,480,472 VND (Trực tuyến)

406,480,472 VND (Phòng học)

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

2026-05-25 09:30

28 Giờ học

Ly Thai To

406,480,472 VND (Trực tuyến)

406,495,072 VND (Phòng học)

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

2026-06-08 09:30

28 Giờ học

InterContinental Hồ Tây Hà Nội

406,480,472 VND (Trực tuyến)

406,480,472 VND (Phòng học)

Lập trình GPU - So sánh OpenCL, CUDA và ROCm Khóa Học Đào Tạo

Đề cương khóa học

Yêu cầu

Các khóa học sắp tới

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Các danh mục liên quan

Trang web này ở các quốc gia/khu vực khác

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Lập trình GPU - So sánh OpenCL, CUDA và ROCm Khóa Học Đào Tạo

Đề cương khóa học

Yêu cầu

Các khóa học sắp tới

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Lập trình GPU - So sánh OpenCL, CUDA và ROCm

Các khóa học liên quan

Phát triển ứng dụng AI với Huawei Ascend và CANN

Deploying AI Models with CANN và Ascend AI Processors

Phát Triển và triển khai AI với CloudMatrix

Lập trình GPU trên Biren AI Accelerators

Phát triển Cambricon MLU với BANGPy và Neuware

Giới thiệu về CANN cho Nhà phát triển Framework AI

CANN cho Edge AI Triển部署

Hiểu về Cụm Tính Toán AI của Huawei: Từ CANN đến MindSpore

Tối ưu Hiệu suất Mạng Neural với CANN SDK

CANN SDK cho các đường dẫn Xử lý Hình ảnh và ngôn ngữ tự nhiên (NLP)

Xây dựng Các Bộ Phận Tùy Chỉnh AI với CANN TIK và TVM

Chuyển đổi Các Ứng dụng CUDA sang Kiến trúc GPU Trung Quốc

Performance Optimization on Ascend, Biren, and Cambricon

Các danh mục liên quan

GPU

Trang web này ở các quốc gia/khu vực khác

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites