Entdecken Sie 3 KI-Begriffe in der Sprachverarbeitung
Ein akustisches Modell stellt die Beziehung zwischen Audiosignalen und ihren entsprechenden phonetischen oder linguistischen Einheiten in der Spracherkennung dar.
i-Vektor ist eine kompakte Darstellung von Audio- oder Sprachmerkmalen, die im maschinellen Lernen für Aufgaben wie Sprechererkennung verwendet wird.
Mel-Frequenz-Cepstrum-Koeffizienten (MFCCs) sind Merkmale, die in der Audioverarbeitung und Spracherkennung verwendet werden.