Explorez 24 termes liés à l'IA dans Datasets
BoolQ est un ensemble de données pour évaluer les modèles d'apprentissage automatique sur des questions oui/non basées sur des passages.
L'ensemble de données C4 est un ensemble de données à grande échelle et soigneusement sélectionné pour l'entraînement de modèles linguistiques, dérivé du contenu web.
CIFAR est un ensemble de données largement utilisé pour entraîner des modèles d'apprentissage automatique dans les tâches de vision par ordinateur.
COCO est un ensemble de données à grande échelle pour la reconnaissance d'images, la segmentation et la légende dans les applications d'IA.
CoNLL 2003 est un ensemble de données utilisé pour évaluer les systèmes de reconnaissance d'entités nommées en traitement du langage naturel.
Un ensemble de données DROP est une collection de données utilisée pour entraîner des modèles d'IA, en se concentrant sur des tâches de raisonnement et de résolution de problèmes.
DuReader est un ensemble de données de compréhension de lecture en chinois à grande échelle, conçu pour entraîner des modèles d'IA.
HotpotQA est un ensemble de données de référence pour évaluer les modèles d'IA sur des tâches de réponse à des questions multi-étapes.
JaQuAD est un ensemble de données conçu pour évaluer les systèmes de réponse aux questions en utilisant le langage naturel.
KorQuAD est un ensemble de données en coréen pour les tâches de question-réponse en traitement du langage naturel.
LAION-400M est un ensemble de données à grande échelle contenant 400 millions de paires image-texte pour la formation et la recherche en IA.
LAION-5B est un ensemble de données à grande échelle pour l'entraînement de modèles d'IA, comprenant 5 milliards de paires image-texte.
Le jeu de données LFW est une collection d'images faciales étiquetées utilisée pour la recherche en reconnaissance faciale.
MNIST est un ensemble de données de chiffres manuscrits utilisé pour entraîner des systèmes de traitement d'images.
Le chiffre MNIST fait référence aux chiffres manuscrits dans un ensemble de données standard utilisé pour entraîner des systèmes de traitement d'images.
MS COCO est un ensemble de données à grande échelle pour la reconnaissance d'images et la segmentation dans la recherche en IA.
Le dataset MUMFORD est une collection d'images annotées pour évaluer les modèles d'apprentissage automatique dans les tâches de vision par ordinateur.
Le Open Images Dataset est une grande collection d'images annotées pour l'entraînement de modèles de vision par ordinateur.
OpenWebText est un ensemble de données conçu pour entraîner des modèles linguistiques d'IA en utilisant du contenu provenant du web.
Le jeu de données RACE est un ensemble de données à grande échelle pour évaluer la compréhension en lecture dans les modèles d'IA.
The Pile est un grand ensemble de données utilisé pour entraîner des modèles linguistiques d'IA, composé de textes divers issus d'Internet.
TriviaQA est un ensemble de données à grande échelle pour entraîner des modèles d'IA à répondre à des questions en domaine ouvert en utilisant des questions de trivia.
Visual Genome est un ensemble de données à grande échelle pour entraîner l'IA à la compréhension des images et au raisonnement visuel.
L'ensemble de données Waymo Open est un ensemble de données à grande échelle pour la recherche sur les véhicules autonomes, comprenant des données de capteurs diverses et des scénarios étiquetés.