AI Glossary: Jeux De Données Terms & Definitions

BoolQ

BoolQ est un ensemble de données pour évaluer les modèles d'apprentissage automatique sur des questions oui/non basées sur des passages.

Ensemble de données C4

C4

L'ensemble de données C4 est un ensemble de données à grande échelle et soigneusement sélectionné pour l'entraînement de modèles linguistiques, dérivé du contenu web.

CIFAR

CIFAR est un ensemble de données largement utilisé pour entraîner des modèles d'apprentissage automatique dans les tâches de vision par ordinateur.

COCO

COCO est un ensemble de données à grande échelle pour la reconnaissance d'images, la segmentation et la légende dans les applications d'IA.

CoNLL 2003

CoNLL 2003 est un ensemble de données utilisé pour évaluer les systèmes de reconnaissance d'entités nommées en traitement du langage naturel.

Ensemble de données DROP

BAISSE

Un ensemble de données DROP est une collection de données utilisée pour entraîner des modèles d'IA, en se concentrant sur des tâches de raisonnement et de résolution de problèmes.

DuReader

DR

DuReader est un ensemble de données de compréhension de lecture en chinois à grande échelle, conçu pour entraîner des modèles d'IA.

HotpotQA

HPQA

HotpotQA est un ensemble de données de référence pour évaluer les modèles d'IA sur des tâches de réponse à des questions multi-étapes.

Voici la traduction en français : JaQuAD

JaQuAD est un ensemble de données conçu pour évaluer les systèmes de réponse aux questions en utilisant le langage naturel.

KorQuAD

KorQuAD est un ensemble de données en coréen pour les tâches de question-réponse en traitement du langage naturel.

LAION-400M

LAION-400M est un ensemble de données à grande échelle contenant 400 millions de paires image-texte pour la formation et la recherche en IA.

LAION-5B

LAION-5B est un ensemble de données à grande échelle pour l'entraînement de modèles d'IA, comprenant 5 milliards de paires image-texte.

Jeu de données LFW

LFW

Le jeu de données LFW est une collection d'images faciales étiquetées utilisée pour la recherche en reconnaissance faciale.

MNIST

MNIST est un ensemble de données de chiffres manuscrits utilisé pour entraîner des systèmes de traitement d'images.

Chiffre MNIST

MNIST

Le chiffre MNIST fait référence aux chiffres manuscrits dans un ensemble de données standard utilisé pour entraîner des systèmes de traitement d'images.

MS COCO

MS COCO est un ensemble de données à grande échelle pour la reconnaissance d'images et la segmentation dans la recherche en IA.

Jeu de données MUMFORD

MUMFORD

Le dataset MUMFORD est une collection d'images annotées pour évaluer les modèles d'apprentissage automatique dans les tâches de vision par ordinateur.

Ensemble de données d'images ouvertes

OID

Le Open Images Dataset est une grande collection d'images annotées pour l'entraînement de modèles de vision par ordinateur.

OpenWebText

Désolé, je n'ai pas trouvé de texte en anglais à traduire. Pourriez-vous fournir le texte que vous souhaitez que je traduise en français ?

OpenWebText est un ensemble de données conçu pour entraîner des modèles linguistiques d'IA en utilisant du contenu provenant du web.

Jeu de données RACE

COURSE

Le jeu de données RACE est un ensemble de données à grande échelle pour évaluer la compréhension en lecture dans les modèles d'IA.

La Pile

The Pile est un grand ensemble de données utilisé pour entraîner des modèles linguistiques d'IA, composé de textes divers issus d'Internet.

TriviaQA

Désolé, je n'ai pas encore appris à traduire ce texte.

TriviaQA est un ensemble de données à grande échelle pour entraîner des modèles d'IA à répondre à des questions en domaine ouvert en utilisant des questions de trivia.

Genome Visuel

VG

Visual Genome est un ensemble de données à grande échelle pour entraîner l'IA à la compréhension des images et au raisonnement visuel.

Ensemble de données Waymo Open

WOD

L'ensemble de données Waymo Open est un ensemble de données à grande échelle pour la recherche sur les véhicules autonomes, comprenant des données de capteurs diverses et des scénarios étiquetés.

Jeux de données

BoolQ

Ensemble de données C4

CIFAR

COCO

CoNLL 2003

Ensemble de données DROP

DuReader

HotpotQA

Voici la traduction en français : JaQuAD

KorQuAD

LAION-400M

LAION-5B

Jeu de données LFW

MNIST

Chiffre MNIST

MS COCO

Jeu de données MUMFORD

Ensemble de données d'images ouvertes

OpenWebText

Jeu de données RACE

La Pile

TriviaQA

Genome Visuel

Ensemble de données Waymo Open