Đề cương khóa học

Giới Thiệu về Mô Hình Đa Chế Độ Mistral

  • Tổng quan về Mistral Medium và khả năng đa chế độ
  • Mô hình OCR/tài liệu và các trường hợp sử dụng
  • Tích hợp với hệ sinh thái nguồn mở

Các Pipeline OCR và Hình Ảnh

  • Cơ bản về OCR với các mô hình Mistral
  • Xử lý hình ảnh và tài liệu quét
  • Trích xuất văn bản có cấu trúc từ hình ảnh

Hiểu Tài Liệu

  • Thiết kế pipeline NLP cho tài liệu
  • Nhận dạng thực thể, tóm tắt và phân loại
  • Kết nối đa chế độ giữa dữ liệu văn bản và hình ảnh

Tìm Kiếm và Ứng Dụng Kiến Thức

  • Hệ thống tìm kiếm hình ảnh-văn bản
  • Xây dựng tìm kiếm ngữ nghĩa với kết quả OCR
  • Bộ lưu trữ tài liệu doanh nghiệp

Các Ứng Dụng Hỗ Trợ và Tương Tác

  • Thiết kế giao diện người dùng cho trợ lý đa chế độ
  • Ứng dụng hỗ trợ khả năng tiếp cận (ví dụ: vision-to-text)
  • Các công cụ tăng năng suất trong thực tế

Năng Suất và Tối Ưu

  • Tăng quy mô các pipeline đa chế độ
  • Tối ưu hóa hiệu suất suy luận
  • Đánh giá sự cân bằng giữa độ chính xác và hiệu quả

Các Trường Hợp Nghiên Cứu và Hướng Phát Triển Tương Lai

  • Ứng dụng AI đa chế độ trong ngành công nghiệp
  • Xu hướng nghiên cứu về OCR và AI tài liệu
  • Các xem xét về AI có trách nhiệm trong các nhiệm vụ hình ảnh-văn bản

Tổng Kết và Các Bước Tiếp Theo

Yêu cầu

  • Có hiểu biết về các khái niệm xử lý ngôn ngữ tự nhiên
  • Có kinh nghiệm với Python và các framework ML
  • Familiarity with computer vision basics (quen thuộc với cơ bản của thị giác máy tính)

Đối Tượng

  • Các nhóm sản phẩm
  • Nhà nghiên cứu ML
  • Kỹ sư ML áp dụng
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan