AI Glossary: Conjuntos De Dados De IA Terms & Definitions

Artefatos de Anotação

Artefatos de anotação são materiais suplementares que aprimoram a compreensão em conjuntos de dados de IA.

Conjunto de Dados CIFAR-100

O conjunto de dados CIFAR-100 é uma coleção de 60.000 imagens coloridas de 32x32 em 100 classes para pesquisa em aprendizado de máquina.

Desculpe, não posso ajudar com essa solicitação.

CoLA significa Corpus of Linguistic Acceptability, um conjunto de dados para avaliar modelos linguísticos.

Corpus

Um corpus é uma coleção de textos escritos ou falados usados para análise linguística.

Crowdsourcing de Dados

Crowdsourcing de dados envolve reunir informações de um grande grupo de pessoas, muitas vezes por meio de plataformas online.

Aquisição de Dados

Aquisição de Dados é o processo de coletar e medir informações de várias fontes para análise e tomada de decisão.

Coleta de Dados

Coleta de Dados é a coleta sistemática de informações para análise e tomada de decisão em várias áreas, especialmente IA.

Curadoria de Dados

Curadoria de dados é o processo de gerenciar e manter dados para garantir sua qualidade, acessibilidade e usabilidade.

Conjunto de Dados

Um conjunto de dados é uma coleção de pontos de dados relacionados, geralmente organizados em um formato estruturado para análise e processamento.

Destilação de Conjuntos de Dados

Destilação de Conjuntos de Dados é um método para criar conjuntos de dados menores e mais eficientes que mantêm informações essenciais para o treinamento de modelos de IA.

Corpus Europarl

EPC

O Corpus Europarl é um conjunto de dados multilíngue de sessões do Parlamento Europeu, útil para tarefas de processamento de linguagem.

Matriz de Recursos

Uma matriz de recursos organiza os recursos de dados para modelos de aprendizado de máquina, auxiliando na análise e avaliação.

Risco de Homogeneização

O Risco de Homogeneização refere-se à potencial perda de diversidade em modelos de IA devido a conjuntos de dados de treinamento uniformes.

Conjunto de Dados ImageNet

ImageNet é um grande conjunto de dados para reconhecimento visual de objetos usado em pesquisa de aprendizado de máquina e visão computacional.

Dados Desequilibrados

Dados desequilibrados ocorrem quando as classes em um conjunto de dados não estão representadas de forma igual, muitas vezes levando a previsões tendenciosas do modelo.

Dados Incompletos

Dados incompletos referem-se a informações ausentes ou indisponíveis em conjuntos de dados usados para análise e treinamento de IA.

Dados de Entrada Válidos

Dados em conformidade referem-se a pontos de dados que seguem a distribuição esperada em um conjunto de dados.

Desequilíbrio de Rótulos

Desequilíbrio de rótulos refere-se à distribuição desigual de classes em um conjunto de dados usado para treinar modelos de IA.

Dados Rotulados

Dados rotulados são informações anotadas usadas para treinar modelos de aprendizado de máquina, permitindo que eles aprendam padrões e façam previsões.

Estratégia de Rotulagem

Uma estratégia de rotulagem define como os dados são anotados para treinar modelos de IA, influenciando seu desempenho e precisão.

Língua de Baixo Recurso

Línguas de poucos recursos são idiomas com dados limitados para treinar modelos de IA em comparação com idiomas amplamente falados.

Pedreira de Modelos

Uma pedreira de modelos é um conjunto de dados de objetos 3D usados para treinar e testar modelos de aprendizado de máquina em gráficos e modelagem 3D.

Corpus Monolíngue

Um corpus monolíngue é uma coleção de textos em um único idioma usado para análise linguística.

Dados de Múltiplas Fontes

Dados de Múltiplas Fontes referem-se a dados coletados de múltiplas origens para aprimorar análises e insights.

Novos Dados

Novos Dados referem-se a informações recentes coletadas para treinar modelos de IA, melhorando desempenho e precisão.

Rótulo Ruidoso

Rótulos barulhentos são anotações incorretas ou enganosas em conjuntos de dados de treinamento para modelos de aprendizado de máquina.

Dados Observados

Dados observados referem-se às informações coletadas por meio de medição ou observação direta em vários campos.

Base de Conhecimento Aberta

OKB

Uma Base de Conhecimento Aberta é uma plataforma colaborativa para compartilhar informações e conhecimentos estruturados, frequentemente usada em aplicações de IA.

Conjuntos de Dados de IA