Explore 24 termos de IA em Conjuntos de Dados
BoolQ é um conjunto de dados para avaliar modelos de aprendizado de máquina em perguntas de sim/não baseadas em trechos.
O Conjunto de Dados C4 é um conjunto de dados de grande escala, curado, para treinar modelos de linguagem, derivado de conteúdo da web.
CIFAR é um conjunto de dados amplamente utilizado para treinar modelos de aprendizado de máquina em tarefas de visão computacional.
COCO é um conjunto de dados de grande escala para reconhecimento de imagens, segmentação e legendagem em aplicações de IA.
CoNLL 2003 é um conjunto de dados usado para avaliar sistemas de reconhecimento de entidades nomeadas em processamento de linguagem natural.
O conjunto de dados DROP é uma coleção de dados usada para treinar modelos de IA, com foco em tarefas de raciocínio e resolução de problemas.
DuReader é um conjunto de dados de compreensão de leitura em chinês em grande escala, projetado para treinar modelos de IA.
HotpotQA é um conjunto de dados de referência para avaliar modelos de IA em tarefas de resposta a perguntas de múltiplos passos.
JaQuAD é um conjunto de dados projetado para avaliar sistemas de resposta a perguntas usando linguagem natural.
KorQuAD é um conjunto de dados em coreano para tarefas de perguntas e respostas em processamento de linguagem natural.
LAION-400M é um conjunto de dados em grande escala contendo 400 milhões de pares de imagem e texto para treinamento e pesquisa em IA.
LAION-5B é um conjunto de dados de grande escala para treinamento de modelos de IA, composto por 5 bilhões de pares de imagem e texto.
Conjunto de Dados LFW é uma coleção de imagens de faces rotuladas usadas para pesquisa em reconhecimento facial.
MNIST é um conjunto de dados de dígitos manuscritos usado para treinar sistemas de processamento de imagem.
Dígito MNIST refere-se a dígitos escritos à mão em um conjunto de dados padrão usado para treinar sistemas de processamento de imagem.
MS COCO é um conjunto de dados em grande escala para reconhecimento e segmentação de imagens na pesquisa de IA.
O Conjunto de Dados MUMFORD é uma coleção de imagens anotadas para avaliar modelos de aprendizado de máquina em tarefas de visão computacional.
O Open Images Dataset é uma grande coleção de imagens anotadas para treinar modelos de visão computacional.
OpenWebText é um conjunto de dados projetado para treinar modelos de linguagem de IA usando conteúdo da web.
O conjunto de dados RACE é um conjunto de dados em grande escala para avaliar a compreensão de leitura em modelos de IA.
The Pile é um grande conjunto de dados usado para treinar modelos de linguagem de IA, composto por textos diversos da internet.
TriviaQA é um conjunto de dados em grande escala para treinar modelos de IA em respostas a perguntas de domínio aberto usando perguntas de trivia.
O Genome Visual é um conjunto de dados de grande escala para treinar IA em compreensão de imagens e raciocínio visual.
O Waymo Open Dataset é um conjunto de dados em grande escala para pesquisa de veículos autônomos, apresentando dados de sensores diversos e cenários rotulados.