AI Glossary: Reconnaissance Vocale Terms & Definitions

Modèle audio-langage

ALM

Un modèle audio-langage traite l'entrée audio pour comprendre et générer le langage humain.

DW

Distil-Whisper est un modèle d'IA compact et efficace pour la reconnaissance et la génération de la parole.

FW

Faster Whisper est un modèle de reconnaissance vocale conçu pour la transcription en temps réel avec une grande précision et rapidité.

M4T

SeamlessM4T est un modèle d'IA multilingue conçu pour la traduction et la transcription en temps réel dans diverses langues.

SD

La diarisation de locuteur est le processus d'identification et de séparation des différents locuteurs dans un enregistrement audio.

STT

La reconnaissance vocale vers texte est une technologie qui convertit le langage parlé en texte écrit.

Whisper est un modèle d'IA développé par OpenAI pour la reconnaissance automatique de la parole (ASR) et les tâches de transcription.

WL

Whisper Large est un modèle de reconnaissance vocale de pointe développé par OpenAI, conçu pour une transcription et une traduction précises.