AI Glossary: Linguistique Terms & Definitions

CoLA

CoLA signifie Corpus of Linguistic Acceptability, un ensemble de données pour évaluer les modèles linguistiques.

Humour computationnel

CH

L'humour computationnel consiste à utiliser des algorithmes pour générer ou comprendre des blagues et de l'humour.

Linguistique computationnelle

D'accord, je traduis.

La linguistique computationnelle est l'étude de l'utilisation d'algorithmes informatiques pour traiter et analyser le langage humain.

Langage construit

Langue construite

Un langage construit est une langue artificiellement créée conçue pour des usages spécifiques, tels que la communication, l’art ou l’expérimentation.

Linguistique de corpus

La linguistique de corpus est l'étude du langage à travers de grandes collections de textes, appelées corpus.

Acte de dialogue

AD

A dialogue act is a communicative function of a segment of conversation, indicating the speaker's intention.

Digraphe

Un digraphe est une paire de lettres utilisées ensemble pour représenter un seul son ou phonème.

Corpus Europarl

Contrat de performance énergétique

Le corpus Europarl est un ensemble de données multilingue provenant des débats du Parlement européen, utile pour les tâches de traitement du langage.

Glyphe

Un glyphe est un symbole visuel représentant un caractère ou un concept dans l'écriture ou le design graphique.

Diversité lexicale

LD

La diversité lexicale mesure la gamme de mots uniques utilisés dans un texte ou un discours par rapport au nombre total de mots.

Analyse linguistique

L'Analyse Linguistique consiste à examiner la structure, la signification et l'utilisation du langage pour comprendre les schémas de communication.

Caractéristique linguistique

Les caractéristiques linguistiques sont des traits du langage qui influencent la communication et la compréhension.

Traitement linguistique

Le Traitement Linguistique implique l'analyse et la compréhension du langage humain par des méthodes computationnelles.

Règle linguistique

Les règles linguistiques sont des lignes directrices formalisées qui dictent la structure et l'utilisation du langage.

Segmentation en morphèmes

La segmentation en morphèmes est le processus de décomposition des mots en leurs plus petites unités significatives, appelées morphèmes.

Traitement du langage naturel

PNL

Le traitement du langage naturel (TNL) permet aux ordinateurs de comprendre, d'interpréter et de répondre au langage humain.

OntoNotes

ACTIVÉ

OntoNotes est un corpus annoté à grande échelle utilisé dans les tâches de traitement du langage naturel.

Corpus OPUS

OPUS

OPUS Corpus est une collection de corpus parallèles multilingues utilisés pour les tâches de traitement du langage naturel.

Polysemanticité

Polysemie

La polysémie fait référence à un mot ou une phrase ayant plusieurs significations ou interprétations.

Compréhension de lecture

RC

La compréhension en lecture est la capacité de comprendre et d'interpréter un texte écrit.

Vocabulaire

Le vocabulaire fait référence à l'ensemble des mots connus et utilisés par des individus ou des groupes.