Explore 3 termos de IA em Processamento de Fala
Um modelo acústico representa a relação entre sinais de áudio e suas unidades fonéticas ou linguísticas correspondentes no reconhecimento de fala.
i-Vector é uma representação compacta de recursos de áudio ou fala usada em aprendizado de máquina para tarefas como reconhecimento de falantes.
Coeficientes Cepstrais de Frequência Mel (MFCCs) são recursos usados em processamento de áudio e reconhecimento de fala.