Đề cương khóa học

Giới thiệu về Tạo Dữ liệu được Tăng cường bằng Truy xuất (RAG)

  • RAG là gì và tại sao nó quan trọng đối với AI doanh nghiệp
  • Các thành phần của hệ thống RAG: truy xuất, tạo ra, kho tài liệu
  • So sánh với LLM độc lập và tìm kiếm vector

Tạo Dây chuyền RAG

  • Cài đặt và cấu hình Haystack hoặc các framework tương tự
  • Nhận dữ liệu tài liệu và tiền xử lý
  • Kết nối truy xuất với cơ sở dữ liệu vector (ví dụ: FAISS, Pinecone)

Tinh chỉnh Trình Truy xuất

  • Đào tạo trình truy xuất dày sử dụng dữ liệu cụ thể cho lĩnh vực
  • Sử dụng các mô hình chuyển đổi câu và học tương phản
  • Đánh giá chất lượng trình truy xuất với độ chính xác top-k

Tinh chỉnh Trình Tạo

  • Chọn các mô hình cơ sở (ví dụ: BART, T5, FLAN-T5)
  • Điều chỉnh hướng dẫn vs. tinh chỉnh giám sát
  • Phương pháp LoRA và PEFT cho cập nhật hiệu quả

Đánh giá và Tối ưu hóa

  • Các chỉ số đánh giá hiệu suất RAG (ví dụ: BLEU, EM, F1)
  • Bạn độ trễ, chất lượng truy xuất, và giảm thiểu ảo tưởng
  • Theo dõi thí nghiệm và cải tiến lặp lại

Bố trí và Tích hợp Thực tế

  • Bố trí RAG trong các công cụ tìm kiếm nội bộ và chatbot
  • Các xem xét về bảo mật, truy cập dữ liệu, và quản lý
  • Tích hợp với API, bảng điều khiển, hoặc cổng thông tin kiến thức

Nghiên cứu Trường hợp và Thực hành Tốt nhất

  • Trường hợp sử dụng doanh nghiệp trong tài chính, y tế, và pháp lý
  • Quản lý sự thay đổi lĩnh vực và cập nhật cơ sở kiến thức
  • Hướng đi trong tương lai của hệ thống LLM được tăng cường bằng truy xuất

Tổng kết và Bước Tiếp theo

Yêu cầu

  • Có hiểu biết về các khái niệm xử lý ngôn ngữ tự nhiên (NLP)
  • Có kinh nghiệm làm việc với các mô hình ngôn ngữ dựa trên transformer
  • Thạo Python và quy trình học máy cơ bản

Đối tượng

  • Kỹ sư NLP
  • Đội ngũ quản lý kiến thức
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan