Đề cương khóa học

Giới thiệu về kiến trúc GPU Biren

  • Tổng quan và các trường hợp sử dụng của Biren
  • Bố cục phần cứng: lõi, bộ nhớ, cụm tính toán
  • So sánh với GPU NVIDIA và AMD

Thiết lập môi trường lập trình Biren

  • Cài đặt SDK và runtime của Biren
  • Hiểu về toolchain và mô hình biên dịch
  • Cấu trúc dự án cơ bản và quy trình build

Lập trình GPU với bộ công cụ Biren

  • Mô hình luồng và khối
  • Quản lý bộ nhớ và chuyển dữ liệu
  • Phát triển và mô hình khởi chạy kernel

Chuyển đổi từ CUDA sang Biren

  • Kỹ thuật chuyển đổi mã CUDA
  • Các bản đồ API phổ biến và thích ứng
  • Thực hành chuyển đổi và luyện tập mã

Gỡ lỗi và phân tích hiệu suất

  • Sử dụng trình gỡ lỗi và phân tích của Biren
  • Xác định điểm nghẽn
  • Mô hình truy cập bộ nhớ và tối ưu hóa

Kỹ thuật tối ưu hóa

  • Lập lịch luồng và ống dẫn lệnh
  • Mở rộng vòng lặp và sử dụng bộ nhớ chia sẻ
  • Điều chỉnh kernel nâng cao cho thông lượng

Trường hợp nghiên cứu và ví dụ ứng dụng

  • Đào tạo mô hình với Biren accelerators
  • Chuyển đổi và phân tích hiệu suất một mô hình thị giác hoặc NLP
  • So sánh hiệu suất so với CUDA/NVIDIA

Tóm tắt và bước tiếp theo

Yêu cầu

  • Hiểu kiến trúc GPU và xử lý song song
  • Kinh nghiệm với CUDA, OpenCL hoặc các môi trường lập trình GPU tương tự
  • Thuộc lòng các framework học sâu như PyTorch hoặc TensorFlow

Đối tượng

  • Nhà phát triển HPC
  • Kỹ sư hạ tầng AI
  • Chuyên gia tối ưu hóa hiệu suất
 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (1)

Các khóa học sắp tới

Các danh mục liên quan