Explora 3 términos de IA en Procesamiento de Voz
Un modelo acústico representa la relación entre las señales de audio y sus unidades fonéticas o lingüísticas correspondientes en el reconocimiento de voz.
i-Vector es una representación compacta de características de audio o voz utilizada en aprendizaje automático para tareas como reconocimiento de locutor.
Los Coeficientes Cepstrales en Frecuencia Mel (MFCCs) son características utilizadas en el procesamiento de audio y reconocimiento de voz.