Đề cương khóa học

Cơ sở của Phân loại Âm thanh

  • Các loại sự kiện âm thanh: môi trường, cơ khí, do con người tạo ra
  • Khái quát về các ứng dụng: giám sát, theo dõi, tự động hóa
  • Phân loại âm thanh so với phát hiện và phân đoạn

Dữ liệu Âm thanh và Trích xuất Đặc trưng

  • Các loại file và định dạng âm thanh
  • Tần số lấy mẫu, kích thước khung và cửa sổ
  • Trích xuất MFCCs, đặc trưng chroma, mel-spectrograms

Chuẩn bị Dữ liệu và Ghi chú

  • UrbanSound8K, ESC-50 và bộ dữ liệu tùy chỉnh
  • Gán nhãn cho sự kiện âm thanh và ranh giới thời gian
  • Cân bằng bộ dữ liệu và mở rộng âm thanh

Xây dựng Mô hình Phân loại Âm thanh

  • Sử dụng mạng nơ-ron tích chập (CNNs) cho âm thanh
  • Nhập dữ liệu mô hình: dạng sóng thô vs đặc trưng
  • Hàm mất mát, chỉ số đánh giá và hiện tượng quá khớp

Phát hiện Sự kiện và Định vị Thời gian

  • Các chiến lược phát hiện dựa trên khung và đoạn
  • Xử lý hậu kỳ phát hiện bằng ngưỡng và làm mịn
  • Vẽ biểu đồ dự đoán trên thời gian âm thanh

Chủ đề Nâng cao và Xử lý Thời gian Thực

  • Học chuyển giao cho các trường hợp dữ liệu ít
  • Triển khai mô hình với TensorFlow Lite hoặc ONNX
  • Xử lý âm thanh trực tiếp và xem xét độ trễ

Phep phát triển Dự án và Trường Hợp Ứng dụng

  • Lập kế hoạch toàn bộ quy trình: từ nhập liệu đến phân loại
  • Phát triển một chứng minh khái niệm cho giám sát, kiểm soát chất lượng hoặc theo dõi
  • Kiểm tra nhật ký, cảnh báo và tích hợp với bảng điều khiển hoặc API

Tóm tắt và Bước kế tiếp

Requirements

  • Có hiểu biết về các khái niệm học máy và đào tạo mô hình
  • Kinh nghiệm lập trình với Python và tiền xử lý dữ liệu
  • Hiểu rõ về cơ bản của âm thanh số

Đối tượng

  • Nhà khoa học dữ liệu
  • Kỹ sư học máy
  • Nghiên cứu viên và nhà phát triển trong xử lý tín hiệu âm thanh
 21 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories