Đề cương khóa học

Cơ Sở của AI An Toàn và Công Bằng

  • Những khái niệm chính: an toàn, sơ hở, công bằng, minh bạch
  • Loại hình sơ hở: dữ liệu, biểu diễn, thuật toán
  • Tổng quan về các khuôn khổ quy định (EU AI Act, GDPR, v.v.)

Sơ Hở trong Các Mô Hình Đã Tinh Chỉnh

  • Cách tinh chỉnh có thể giới thiệu hoặc làm tăng cường sơ hở
  • Những trường hợp thực tế và thất bại trong thế giới thực
  • Nhận dạng sơ hở trong dữ liệu và dự đoán mô hình

Kỹ Thuật Giảm Thiểu Sơ Hở

  • Các chiến lược cấp dữ liệu (điều chỉnh cân bằng, tăng cường)
  • Các chiến lược trong quá trình đào tạo (régularization, adversarial debiasing)
  • Các chiến lược sau xử lý (lọc đầu ra, hiệu chỉnh)

An Toàn và Độ Bền Mô Hình

  • Phát hiện các đầu ra không an toàn hoặc có hại
  • Xử lý đầu vào đối kháng
  • Đội đỏ và thử nghiệm chịu tải mô hình đã tinh chỉnh

Kiểm toán và Giám Sát Hệ Thống AI

  • Các tiêu chí đánh giá sơ hở và công bằng (ví dụ: sự đồng đẳng dân tộc)
  • Công cụ giải thích và các khung minh bạch
  • Thực hành giám sát và quản lý liên tục

Bộ Công Cụ và Thực Hành Thực Tế

  • Sử dụng thư viện nguồn mở (ví dụ: Fairlearn, Transformers, CheckList)
  • Thực hành: Phát hiện và giảm thiểu sơ hở trong mô hình đã tinh chỉnh
  • Tạo đầu ra an toàn thông qua thiết kế câu hỏi và ràng buộc

Các Trường Hợp Sử Dụng Doanh Nghiệp và Sẵn Sàng Tuân Thủ

  • Thực hành tốt nhất để tích hợp an toàn trong quy trình LLM
  • Tài liệu và thẻ mô hình cho tuân thủ
  • Chuẩn bị cho việc kiểm toán và đánh giá bên ngoài

Tổng Kết và Các Bước Tiếp Theo

Yêu cầu

  • Có hiểu biết về các mô hình học máy và quy trình đào tạo
  • Có kinh nghiệm làm việc với quá trình tinh chỉnh và LLMs
  • Familiarity with Python and NLP concepts

Đối Tượng Học Viên

  • Các đội tuân thủ AI
  • Các kỹ sư ML
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan