AI Glossary: Conjuntos De Datos Terms & Definitions

BoolQ

BoolQ es un conjunto de datos para evaluar modelos de aprendizaje automático en preguntas de sí/no basadas en pasajes.

Conjunto de datos C4

C4

El conjunto de datos C4 es un conjunto de datos a gran escala y curado para entrenar modelos de lenguaje, derivado del contenido web.

CIFAR

CIFAR es un conjunto de datos ampliamente utilizado para entrenar modelos de aprendizaje automático en tareas de visión por computadora.

COCO

COCO es un conjunto de datos a gran escala para reconocimiento de imágenes, segmentación y generación de leyendas en aplicaciones de IA.

CoNLL 2003

CoNLL 2003 es un conjunto de datos utilizado para evaluar sistemas de reconocimiento de entidades nombradas en procesamiento de lenguaje natural.

Conjunto de datos DROP

SOLTAR

Un conjunto de datos DROP es una colección de datos utilizados para entrenar modelos de IA, centrándose en tareas de razonamiento y resolución de problemas.

DuReader

DR

DuReader es un conjunto de datos de comprensión de lectura en chino a gran escala diseñado para entrenar modelos de IA.

HotpotQA

HPQA

HotpotQA es un conjunto de datos de referencia para evaluar modelos de IA en tareas de respuesta a preguntas de múltiples pasos.

JaQuAD

JaQuAD es un conjunto de datos diseñado para evaluar sistemas de respuesta a preguntas utilizando lenguaje natural.

KorQuAD

KorQuAD es un conjunto de datos en coreano para tareas de preguntas y respuestas en procesamiento de lenguaje natural.

LAION-400M

LAION-400M es un conjunto de datos a gran escala que contiene 400 millones de pares de imagen y texto para entrenamiento e investigación en IA.

LAION-5B

LAION-5B es un conjunto de datos a gran escala para entrenar modelos de IA, que consiste en 5 mil millones de pares de imagen-texto.

Conjunto de datos LFW

LFW

El Conjunto de Datos LFW es una colección de imágenes faciales etiquetadas utilizadas para investigación en reconocimiento facial.

MNIST

MNIST es un conjunto de datos de dígitos escritos a mano utilizado para entrenar sistemas de procesamiento de imágenes.

Dígito MNIST

MNIST

MNIST Digit se refiere a dígitos escritos a mano en un conjunto de datos estándar utilizado para entrenar sistemas de procesamiento de imágenes.

MS COCO

MS COCO es un conjunto de datos a gran escala para reconocimiento y segmentación de imágenes en investigación de IA.

Conjunto de datos MUMFORD

MUMFORD

El conjunto de datos MUMFORD es una colección de imágenes anotadas para evaluar modelos de aprendizaje automático en tareas de visión por computadora.

Conjunto de Datos de Imágenes Abiertas

OID

El conjunto de datos Open Images es una gran colección de imágenes anotadas para entrenar modelos de visión por computadora.

OpenWebText

Lo siento, no puedo completar esta traducción porque el texto original está vacío. Por favor, proporciona el texto en inglés que deseas traducir.

OpenWebText es un conjunto de datos diseñado para entrenar modelos de lenguaje de IA utilizando contenido de la web.

Conjunto de datos RACE

CARRERA

El conjunto de datos RACE es un conjunto de datos a gran escala para evaluar la comprensión de lectura en modelos de IA.

La pila

The Pile es un conjunto de datos grande utilizado para entrenar modelos de lenguaje de IA, que consiste en textos diversos de internet.

TriviaQA

TQA

TriviaQA es un conjunto de datos a gran escala para entrenar modelos de IA en respuestas a preguntas de dominio abierto utilizando preguntas de trivia.

Genome Visual

VG

Genome Visual es un conjunto de datos a gran escala para entrenar a la IA en la comprensión de imágenes y razonamiento visual.

Conjunto de datos abierto de Waymo

WOD

El conjunto de datos abierto de Waymo es un conjunto de datos a gran escala para la investigación en vehículos autónomos, que presenta datos de sensores diversos y escenarios etiquetados.

Conjuntos de datos

BoolQ

Conjunto de datos C4

CIFAR

COCO

CoNLL 2003

Conjunto de datos DROP

DuReader

HotpotQA

JaQuAD

KorQuAD

LAION-400M

LAION-5B

Conjunto de datos LFW

MNIST

Dígito MNIST

MS COCO

Conjunto de datos MUMFORD

Conjunto de Datos de Imágenes Abiertas

OpenWebText

Conjunto de datos RACE

La pila

TriviaQA

Genome Visual

Conjunto de datos abierto de Waymo