Explore 84 termos de IA em Ética de IA
Uma Rede de Atores é um conceito em sociologia que descreve as relações interconectadas entre entidades humanas e não humanas.
Risco de IA refere-se às possíveis consequências negativas decorrentes do desenvolvimento e implantação de sistemas de inteligência artificial.
Viés algorítmico refere-se à discriminação sistemática e injusta nos processos de tomada de decisão algorítmica.
AI Alinhada refere-se a sistemas de inteligência artificial projetados para alinhar-se com valores e objetivos humanos.
Imposto de Alinhamento refere-se aos custos adicionais incorridos para garantir que os sistemas de IA estejam alinhados com os valores e ética humanos.
Uma estrutura que categoriza sistemas de IA com base em seu alinhamento com valores e intenções humanas.
Viés de ancoragem em IA refere-se à tendência cognitiva de confiar fortemente na primeira informação encontrada.
Anthropic refere-se a conceitos ou princípios relacionados à existência humana e às implicações para a segurança e ética da IA.
Incerteza antropica refere-se à incerteza sobre preferências e valores humanos no design de sistemas de IA.
Auditabilidade é a capacidade de verificar e rastrear processos ou dados dentro de um sistema para conformidade e responsabilidade.
A falácia da taxa base ocorre quando a taxa base (probabilidade a priori) é ignorada em favor de informações específicas.
Uma Política de Comportamento descreve as regras e expectativas para conduta aceitável em sistemas de IA.
Um Modelo Caixa-Preta é um sistema de IA cujos funcionamento interno não é acessível ou interpretável pelos usuários.
Claude 1 é um modelo de linguagem de IA desenvolvido pela Anthropic, focado em segurança e alinhamento em interações de IA.
O Comitê das Máquinas é uma estrutura teórica para entender os processos de tomada de decisão e ética da IA.
Viés de Confirmação em IA refere-se à tendência dos algoritmos de favorecer informações que confirmam crenças ou suposições existentes.
AI Constitucional refere-se a sistemas de IA projetados para aderir a diretrizes e princípios éticos, garantindo uma tomada de decisão responsável.
Prompting Constitucional é um método para garantir que o comportamento da IA esteja alinhado com valores humanos e diretrizes éticas.
Envenenamento de contexto é uma técnica adversarial que manipula o contexto fornecido aos modelos de IA para produzir resultados tendenciosos.
Counterfactuals refer to hypothetical scenarios exploring 'what if' questions about events that did not occur.
Espionagem de Dados refere-se ao uso indevido de métodos de análise de dados para encontrar padrões que não se generalizam para dados não vistos.
Desbiasar embeddings de palavras envolve técnicas para reduzir o viés em modelos de linguagem de IA.
Alinhamento Deliberativo garante que os sistemas de IA reflitam valores humanos por meio de processos colaborativos de tomada de decisão.
Risco de Uso Dual refere-se ao potencial de tecnologias serem usadas tanto para fins benéficos quanto prejudiciais.
O alinhamento de embeddings refere-se ao processo de garantir que as representações geradas por IA correspondam aos valores e intenções humanas.
A Enganação Emergente refere-se a sistemas de IA que geram informações enganosas ou falsas de forma não intencional durante as interações.
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
Avaliar IA envolve a análise de sistemas de IA para garantir eficácia, precisão e alinhamento com os objetivos pretendidos.