Đề cương khóa học

Giới thiệu về AI đa phương tiện

  • AI đa phương tiện là gì?
  • Các mô hình AI đa phương tiện hoạt động như thế nào
  • Các trường hợp ứng dụng trong nhiều ngành công nghiệp

Cơ sở về kỹ thuật xây dựng prompt (Prompt Engineering)

  • Nguyên tắc thiết kế prompt hiệu quả
  • Hiểu về hành vi phản hồi của AI
  • Những sai lầm thường gặp và cách tránh chúng

Tối ưu hóa prompt dựa trên văn bản

  • Sắp xếp prompt để tạo ra văn bản chính xác
  • Tùy chỉnh phản hồi cho các bối cảnh khác nhau
  • Xử lý sự mơ hồ và sự thiên vị trong các prompt văn bản

Sinh và chỉnh sửa hình ảnh

  • Tối ưu hóa prompt cho các hình ảnh được AI tạo ra
  • Kiểm soát phong cách, cấu trúc và các phần tử
  • Làm việc với các công cụ chỉnh sửa được AI hỗ trợ

Xử lý âm thanh và giọng nói

  • Sinh giọng nói từ các prompt dựa trên văn bản
  • Tạo và cải thiện âm thanh do AI điều khiển
  • Tạo tương tác giọng nói với AI

Tạo nội dung video với AI

  • Sinh các đoạn video bằng các prompt AI
  • Kết hợp văn bản, hình ảnh và âm thanh được AI tạo ra
  • Chỉnh sửa và hoàn thiện nội dung video được AI tạo ra

Tích hợp AI đa phương tiện vào các quy trình làm việc

  • Kết hợp các đầu ra văn bản, hình ảnh và âm thanh
  • Xây dựng các đường ống nội dung tự động do AI điều khiển
  • Các nghiên cứu trường hợp và các ứng dụng thực tế

Các vấn đề đạo đức và các thao tác tốt nhất

  • Sự thiên vị AI và kiểm duyệt nội dung
  • Các vấn đề bảo mật trong AI đa phương tiện
  • Đảm bảo sử dụng AI một cách có trách nhiệm

Tóm tắt và các bước tiếp theo

Yêu cầu

  • Hiểu biết về các mô hình AI và ứng dụng của chúng
  • Kiện thức lập trình (Python được khuyến cáo)
  • Thông thạo về API và các quy trình do AI thúc đẩy

Đối tượng

  • Các nhà nghiên cứu về AI
  • Các tác giả đa phương tiện
  • Các nhà phát triển làm việc với các mô hình đa phương tiện
 14 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan