AI Glossary: Alinhamento De IA Terms & Definitions

Colapso do Agente

Colapso de Agente refere-se a uma falha em sistemas de IA onde os agentes deixam de funcionar de forma eficaz, muitas vezes devido a problemas de alinhamento.

IA Alinhada

AI Alinhada refere-se a sistemas de inteligência artificial projetados para alinhar-se com valores e objetivos humanos.

Imposto de Alinhamento

Imposto de Alinhamento refere-se aos custos adicionais incorridos para garantir que os sistemas de IA estejam alinhados com os valores e ética humanos.

Incerteza Antropica

Incerteza antropica refere-se à incerteza sobre preferências e valores humanos no design de sistemas de IA.

Alinhamento Deliberativo

Alinhamento Deliberativo garante que os sistemas de IA reflitam valores humanos por meio de processos colaborativos de tomada de decisão.

Generalização incorreta de metas

A generalização incorreta de metas ocorre quando sistemas de IA perseguem objetivos não intencionais devido a interpretações equivocadas de suas metas.

Troca entre Utilidade e Inofensividade

O Compromisso entre Utilidade e Inofensividade é um equilíbrio entre a IA fornecer assistência útil e os riscos de causar dano.

Explosão de Inteligência

Uma explosão de inteligência refere-se a um rápido aumento nas capacidades de inteligência artificial, muitas vezes levando à superinteligência.

Design de Recompensa Inversa

Design de Recompensa Inversa é uma técnica em aprendizado por reforço voltada a evitar comportamentos indesejados em sistemas de IA.

Alinhamento de Modelo

Alinhamento de modelos garante que os sistemas de IA operem de maneiras consistentes com os valores e intenções humanas.

Superalinhamento

RS

Superalinhamento refere-se a sistemas avançados de IA que estão perfeitamente alinhados com os valores e intenções humanas.

Alinhamento de IA