Explorez 3 termes liés à l'IA dans le traitement de la parole
Un modèle acoustique représente la relation entre les signaux audio et leurs unités phonétiques ou linguistiques correspondantes dans la reconnaissance vocale.
i-Vector est une représentation compacte des caractéristiques audio ou de la parole utilisée en apprentissage automatique pour des tâches comme la reconnaissance de locuteur.
Les coefficients cepstraux en fréquence Mel (MFCC) sont des caractéristiques utilisées dans le traitement audio et la reconnaissance vocale.