Explora 24 términos de IA en Conjuntos de Datos
BoolQ es un conjunto de datos para evaluar modelos de aprendizaje automático en preguntas de sí/no basadas en pasajes.
El conjunto de datos C4 es un conjunto de datos a gran escala y curado para entrenar modelos de lenguaje, derivado del contenido web.
CIFAR es un conjunto de datos ampliamente utilizado para entrenar modelos de aprendizaje automático en tareas de visión por computadora.
COCO es un conjunto de datos a gran escala para reconocimiento de imágenes, segmentación y generación de leyendas en aplicaciones de IA.
CoNLL 2003 es un conjunto de datos utilizado para evaluar sistemas de reconocimiento de entidades nombradas en procesamiento de lenguaje natural.
Un conjunto de datos DROP es una colección de datos utilizados para entrenar modelos de IA, centrándose en tareas de razonamiento y resolución de problemas.
DuReader es un conjunto de datos de comprensión de lectura en chino a gran escala diseñado para entrenar modelos de IA.
HotpotQA es un conjunto de datos de referencia para evaluar modelos de IA en tareas de respuesta a preguntas de múltiples pasos.
JaQuAD es un conjunto de datos diseñado para evaluar sistemas de respuesta a preguntas utilizando lenguaje natural.
KorQuAD es un conjunto de datos en coreano para tareas de preguntas y respuestas en procesamiento de lenguaje natural.
LAION-400M es un conjunto de datos a gran escala que contiene 400 millones de pares de imagen y texto para entrenamiento e investigación en IA.
LAION-5B es un conjunto de datos a gran escala para entrenar modelos de IA, que consiste en 5 mil millones de pares de imagen-texto.
El Conjunto de Datos LFW es una colección de imágenes faciales etiquetadas utilizadas para investigación en reconocimiento facial.
MNIST es un conjunto de datos de dígitos escritos a mano utilizado para entrenar sistemas de procesamiento de imágenes.
MNIST Digit se refiere a dígitos escritos a mano en un conjunto de datos estándar utilizado para entrenar sistemas de procesamiento de imágenes.
MS COCO es un conjunto de datos a gran escala para reconocimiento y segmentación de imágenes en investigación de IA.
El conjunto de datos MUMFORD es una colección de imágenes anotadas para evaluar modelos de aprendizaje automático en tareas de visión por computadora.
El conjunto de datos Open Images es una gran colección de imágenes anotadas para entrenar modelos de visión por computadora.
OpenWebText es un conjunto de datos diseñado para entrenar modelos de lenguaje de IA utilizando contenido de la web.
El conjunto de datos RACE es un conjunto de datos a gran escala para evaluar la comprensión de lectura en modelos de IA.
The Pile es un conjunto de datos grande utilizado para entrenar modelos de lenguaje de IA, que consiste en textos diversos de internet.
TriviaQA es un conjunto de datos a gran escala para entrenar modelos de IA en respuestas a preguntas de dominio abierto utilizando preguntas de trivia.
Genome Visual es un conjunto de datos a gran escala para entrenar a la IA en la comprensión de imágenes y razonamiento visual.
El conjunto de datos abierto de Waymo es un conjunto de datos a gran escala para la investigación en vehículos autónomos, que presenta datos de sensores diversos y escenarios etiquetados.