Đề cương khóa học

Giới thiệu về Retrieval-Augmented Generation (RAG)

  • RAG là gì và tại sao nó quan trọng đối với AI doanh nghiệp
  • Các thành phần của hệ thống RAG: retriever, generator, document store
  • Sự so sánh với LLM độc lập và tìm kiếm vector

Thiết lập một Pipeline RAG

  • Cài đặt và cấu hình Haystack hoặc các khung làm việc tương tự
  • Nạp và tiền xử lý tài liệu
  • Kết nối retriever với cơ sở dữ liệu vector (ví dụ: FAISS, Pinecone)

Fine-Tuning Retriever

  • Huấn luyện dense retrievers sử dụng dữ liệu chuyên ngành
  • Sử dụng sentence transformers và học đối lập
  • Đánh giá chất lượng retriever bằng độ chính xác top-k

Fine-Tuning Generator

  • Lựa chọn các mô hình cơ sở (ví dụ: BART, T5, FLAN-T5)
  • Hướng dẫn điều chỉnh vs. huấn luyện tinh vi có giám sát
  • Các phương pháp LoRA và PEFT cho cập nhật hiệu quả

Đánh giá và Tối ưu hóa

  • Métrics để đánh giá hiệu suất RAG (ví dụ: BLEU, EM, F1)
  • Thời gian phản hồi, chất lượng tìm kiếm và giảm thiểu sự giả tưởng
  • Theo dõi thí nghiệm và cải tiến lặp lại

Triển khai và Tích hợp Thực tế

  • Triển khai RAG trong các công cụ tìm kiếm nội bộ và chatbots
  • Xem xét về bảo mật, truy cập dữ liệu và quản trị
  • Tích hợp với API, bảng điều khiển hoặc cổng thông tin kiến thức

Trường Hợp và Lời Khuyên Tốt

  • Các trường hợp sử dụng doanh nghiệp trong tài chính, y tế và pháp lý
  • Quản lý sự dịch chuyển lĩnh vực và cập nhật cơ sở dữ liệu kiến thức
  • Hướng đi tương lai của các hệ thống LLM được tăng cường bằng việc tìm kiếm

Tóm tắt và Bước Tiếp theo

Requirements

  • Sự hiểu biết về các khái niệm xử lý ngôn ngữ tự nhiên (NLP)
  • Kinh nghiệm với mô hình ngôn ngữ dựa trên transformer
  • Thành thạo Python và quy trình làm việc cơ bản của học máy

Đối tượng

  • Nhà phát triển NLP
  • Các đội quản lý kiến thức
 14 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories