Cảm ơn bạn đã gửi yêu cầu! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Cảm ơn bạn đã gửi đặt chỗ! Một thành viên trong đội ngũ của chúng tôi sẽ liên hệ với bạn ngay lập tức.
Đề cương khóa học
Giới thiệu về AI đa mô-đun
- AI đa mô-đun là gì?
- Các thách thức và ứng dụng chính
- Tổng quan về các mô hình đa mô-đun dẫn đầu
Xử lý văn bản và hiểu ngôn ngữ tự nhiên
- Tận dụng các mô hình ngôn ngữ lớn cho các agent AI dựa trên văn bản
- Hiểu về kỹ thuật xây dựng câu hỏi cho các nhiệm vụ đa mô-đun
- Cân chỉnh mô hình văn bản cho các ứng dụng đặc thù
Nhận diện và tạo hình ảnh
- Xử lý hình ảnh bằng AI: phân loại, mô tả và nhận diện đối tượng
- Tạo hình ảnh bằng các mô hình phân tán (Stable Diffusion, DALLE)
- Tích hợp dữ liệu hình ảnh với các mô hình dựa trên văn bản
Xử lý âm thanh và giọng nói
- Nhận diện giọng nói với Whisper ASR
- Các kỹ thuật tổng hợp giọng nói từ văn bản (TTS)
- Tăng cường tương tác người dùng với AI dựa trên giọng nói
Tích hợp các đầu vào đa mô-đun
- Xây dựng các pipeline AI để xử lý nhiều loại đầu vào
- Các kỹ thuật hợp nhất để kết hợp dữ liệu văn bản, hình ảnh và giọng nói
- Các ứng dụng thực tế của các agent AI đa mô-đun
Triển khai các agent AI đa mô-đun
- Xây dựng các giải pháp AI đa mô-đun dựa trên API
- Tối ưu hóa các mô hình để đạt hiệu suất và khả năng mở rộng
- Các thực hành tốt nhất để triển khai AI đa mô-đun trong sản xuất
Các vấn đề đạo đức và xu hướng tương lai
- Sự thiên vị và công bằng trong AI đa mô-đun
- Các mối quan tâm về quyền riêng tư với dữ liệu đa mô-đun
- Các phát triển tương lai trong AI đa mô-đun
Tóm lược và các bước tiếp theo
Yêu cầu
- Hiểu biết về cơ sở của học máy
- Kinh nghiệm lập trình với Python
- Familiarity with deep learning frameworks (e.g., TensorFlow, PyTorch)
Đối tượng
- Nhà phát triển AI
- Nghiên cứu viên
- Kỹ sư đa phương tiện
21 Giờ học
Đánh giá (1)
Giảng viên trả lời câu hỏi một cách linh hoạt.
Adrian
Khóa học - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Dịch thuật bằng máy