Đề cương khóa học

Cơ sở của Phân loại Âm thanh

  • Các loại sự kiện âm thanh: môi trường, cơ khí, do con người tạo ra
  • Khái quát về các ứng dụng: giám sát, theo dõi, tự động hóa
  • Phân loại âm thanh so với phát hiện và phân đoạn

Dữ liệu Âm thanh và Trích xuất Đặc trưng

  • Các loại file và định dạng âm thanh
  • Tần số lấy mẫu, kích thước khung và cửa sổ
  • Trích xuất MFCCs, đặc trưng chroma, mel-spectrograms

Chuẩn bị Dữ liệu và Ghi chú

  • UrbanSound8K, ESC-50 và bộ dữ liệu tùy chỉnh
  • Gán nhãn cho sự kiện âm thanh và ranh giới thời gian
  • Cân bằng bộ dữ liệu và mở rộng âm thanh

Xây dựng Mô hình Phân loại Âm thanh

  • Sử dụng mạng nơ-ron tích chập (CNNs) cho âm thanh
  • Nhập dữ liệu mô hình: dạng sóng thô vs đặc trưng
  • Hàm mất mát, chỉ số đánh giá và hiện tượng quá khớp

Phát hiện Sự kiện và Định vị Thời gian

  • Các chiến lược phát hiện dựa trên khung và đoạn
  • Xử lý hậu kỳ phát hiện bằng ngưỡng và làm mịn
  • Vẽ biểu đồ dự đoán trên thời gian âm thanh

Chủ đề Nâng cao và Xử lý Thời gian Thực

  • Học chuyển giao cho các trường hợp dữ liệu ít
  • Triển khai mô hình với TensorFlow Lite hoặc ONNX
  • Xử lý âm thanh trực tiếp và xem xét độ trễ

Phep phát triển Dự án và Trường Hợp Ứng dụng

  • Lập kế hoạch toàn bộ quy trình: từ nhập liệu đến phân loại
  • Phát triển một chứng minh khái niệm cho giám sát, kiểm soát chất lượng hoặc theo dõi
  • Kiểm tra nhật ký, cảnh báo và tích hợp với bảng điều khiển hoặc API

Tóm tắt và Bước kế tiếp

Yêu cầu

  • Có hiểu biết về các khái niệm học máy và đào tạo mô hình
  • Kinh nghiệm lập trình với Python và tiền xử lý dữ liệu
  • Hiểu rõ về cơ bản của âm thanh số

Đối tượng

  • Nhà khoa học dữ liệu
  • Kỹ sư học máy
  • Nghiên cứu viên và nhà phát triển trong xử lý tín hiệu âm thanh
 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Các khóa học sắp tới

Các danh mục liên quan