Explore 36 termos de IA em Conjuntos de Dados de IA
Artefatos de anotação são materiais suplementares que aprimoram a compreensão em conjuntos de dados de IA.
O conjunto de dados CIFAR-100 é uma coleção de 60.000 imagens coloridas de 32x32 em 100 classes para pesquisa em aprendizado de máquina.
CoLA significa Corpus of Linguistic Acceptability, um conjunto de dados para avaliar modelos linguísticos.
Um corpus é uma coleção de textos escritos ou falados usados para análise linguística.
Crowdsourcing de dados envolve reunir informações de um grande grupo de pessoas, muitas vezes por meio de plataformas online.
Aquisição de Dados é o processo de coletar e medir informações de várias fontes para análise e tomada de decisão.
Coleta de Dados é a coleta sistemática de informações para análise e tomada de decisão em várias áreas, especialmente IA.
Curadoria de dados é o processo de gerenciar e manter dados para garantir sua qualidade, acessibilidade e usabilidade.
Um conjunto de dados é uma coleção de pontos de dados relacionados, geralmente organizados em um formato estruturado para análise e processamento.
Destilação de Conjuntos de Dados é um método para criar conjuntos de dados menores e mais eficientes que mantêm informações essenciais para o treinamento de modelos de IA.
O Corpus Europarl é um conjunto de dados multilíngue de sessões do Parlamento Europeu, útil para tarefas de processamento de linguagem.
Uma matriz de recursos organiza os recursos de dados para modelos de aprendizado de máquina, auxiliando na análise e avaliação.
O Risco de Homogeneização refere-se à potencial perda de diversidade em modelos de IA devido a conjuntos de dados de treinamento uniformes.
ImageNet é um grande conjunto de dados para reconhecimento visual de objetos usado em pesquisa de aprendizado de máquina e visão computacional.
Dados desequilibrados ocorrem quando as classes em um conjunto de dados não estão representadas de forma igual, muitas vezes levando a previsões tendenciosas do modelo.
Dados incompletos referem-se a informações ausentes ou indisponíveis em conjuntos de dados usados para análise e treinamento de IA.
Dados em conformidade referem-se a pontos de dados que seguem a distribuição esperada em um conjunto de dados.
Desequilíbrio de rótulos refere-se à distribuição desigual de classes em um conjunto de dados usado para treinar modelos de IA.
Dados rotulados são informações anotadas usadas para treinar modelos de aprendizado de máquina, permitindo que eles aprendam padrões e façam previsões.
Uma estratégia de rotulagem define como os dados são anotados para treinar modelos de IA, influenciando seu desempenho e precisão.
Línguas de poucos recursos são idiomas com dados limitados para treinar modelos de IA em comparação com idiomas amplamente falados.
Uma pedreira de modelos é um conjunto de dados de objetos 3D usados para treinar e testar modelos de aprendizado de máquina em gráficos e modelagem 3D.
Um corpus monolíngue é uma coleção de textos em um único idioma usado para análise linguística.
Dados de Múltiplas Fontes referem-se a dados coletados de múltiplas origens para aprimorar análises e insights.
Novos Dados referem-se a informações recentes coletadas para treinar modelos de IA, melhorando desempenho e precisão.
Rótulos barulhentos são anotações incorretas ou enganosas em conjuntos de dados de treinamento para modelos de aprendizado de máquina.
Dados observados referem-se às informações coletadas por meio de medição ou observação direta em vários campos.
Uma Base de Conhecimento Aberta é uma plataforma colaborativa para compartilhar informações e conhecimentos estruturados, frequentemente usada em aplicações de IA.