AI Glossary: Traitement Audio Terms & Definitions

Transformateur de Spectrogramme Audio

AST

Un transformateur de spectrogramme audio est un modèle d'apprentissage profond qui traite les spectrogrammes audio pour des tâches telles que la reconnaissance vocale et l'analyse musicale.

Dénaturation

DN

La dénaturation est le processus de suppression du bruit dans les données, améliorant la clarté et la qualité dans diverses applications comme les images et l'audio.

Diarisation

Diarization is the process of segmenting audio recordings into distinct speakers' segments.

Transformée Cosinus Discrète

DCT

La transformée cosinus discrète (DCT) est une technique mathématique utilisée pour convertir des signaux en composantes de fréquence.

Transformée de Fourier Discrète

TFD

La transformée de Fourier discrète (DFT) convertit une séquence de valeurs en composantes de différentes fréquences.

Transformée de Fourier Rapide

FFT

La transformée de Fourier rapide (FFT) est un algorithme efficace pour calculer la transformée de Fourier d'un signal.

Transformée de Fourier

TF

La transformée de Fourier convertit les signaux entre les domaines temporel et fréquentiel, révélant les composantes en fréquence dans les données.

Coefficients Cepstraux en Fréquence Mel

MFCC

Les coefficients cepstraux en fréquence Mel (MFCC) sont des caractéristiques utilisées dans le traitement audio et la reconnaissance vocale.

Traitement Audio par Microarray

Le traitement audio par microarray implique l'utilisation de plusieurs microphones pour améliorer la capture et le traitement audio.

Fréquence Mode

La fréquence mode fait référence à la fréquence la plus courante dans un ensemble de données ou un signal.

Codage Mu Law

μ-loi

Le codage Mu Law est une méthode de compression des données audio, couramment utilisée dans les systèmes de télécommunication.

Filtrage du bruit

Le filtrage du bruit est une technique utilisée pour éliminer les bruits indésirables des données ou des signaux afin d'améliorer la clarté et la précision.

Réduction du bruit

La réduction du bruit est le processus de minimisation des signaux sonores indésirables dans le traitement audio et les systèmes de communication.

Source de bruit

Une source de bruit est une entité qui génère un son indésirable, affectant la qualité audio dans diverses applications.

Suppression du bruit

La suppression du bruit est une technique utilisée pour réduire les interférences sonores indésirables dans les signaux audio.

Bruit de sortie

Le bruit de sortie fait référence aux perturbations indésirables dans le signal de sortie d'un système, affectant la qualité et la précision des données.

Méthode d'addition de chevauchement

La méthode d'addition de chevauchement est une technique pour une convolution efficace des signaux, particulièrement utile pour les longues séquences.

Méthode de sauvegarde par chevauchement

La méthode de sauvegarde par chevauchement est une technique pour le traitement efficace de grands ensembles de données dans le traitement du signal et les applications d'IA.

Diarisation de locuteur

SD

La diarisation de locuteur est le processus d'identification et de séparation des différents locuteurs dans un enregistrement audio.

WaveNet

WN

WaveNet est un modèle génératif profond pour produire des formes d'onde audio brutes, initialement développé par DeepMind.

Architecture WaveNet

WN

L'architecture WaveNet est un modèle d'apprentissage profond pour générer de l'audio et de la parole avec une haute qualité et un naturel.