Éthique de l'IA

Explorez 84 termes liés à l'IA dans l'Éthique de l'IA

Réseau d'acteur

Un réseau d'acteurs est un concept en sociologie qui décrit les relations interconnectées entre des entités humaines et non humaines.

Risque lié à l'IA

Le risque lié à l'IA fait référence aux conséquences négatives potentielles découlant du développement et du déploiement de systèmes d'intelligence artificielle.

Biais algorithmique

Le biais algorithmique désigne une discrimination systématique et injuste dans les processus de prise de décision algorithmique.

IA alignée

L'IA alignée fait référence aux systèmes d'intelligence artificielle conçus pour s'aligner sur les valeurs et objectifs humains.

Taxe d'alignement

La taxe d'alignement fait référence aux coûts supplémentaires engagés pour garantir que les systèmes d'IA s'alignent avec les valeurs et l'éthique humaines.

Taxonomie d'alignement

AT

Un cadre classant les systèmes d'IA en fonction de leur alignement avec les valeurs et intentions humaines.

Biais d'ancrage (IA)

Le biais d'ancrage en IA fait référence à la tendance cognitive à s'appuyer fortement sur la première information rencontrée.

Anthropique

Anthropic fait référence à des concepts ou principes liés à l'existence humaine et aux implications pour la sécurité et l'éthique de l'IA.

Incertitude anthropique

L'incertitude anthropique désigne l'incertitude concernant les préférences et valeurs humaines dans la conception des systèmes d'IA.

Auditable

La traçabilité est la capacité de vérifier et de suivre les processus ou les données au sein d'un système pour assurer la conformité et la responsabilité.

Fallacie de taux de base

La fallacie de taux de base se produit lorsque le taux de base (probabilité a priori) est ignoré au profit d'informations spécifiques.

Politique de comportement

BP

Une politique de comportement décrit les règles et attentes concernant la conduite acceptable dans les systèmes d'IA.

Modèle de boîte noire

Un modèle boîte noire est un système d'IA dont le fonctionnement interne n'est pas accessible ou interprétable par les utilisateurs.

Claude 1

Claude 1 est un modèle de langage IA développé par Anthropic, axé sur la sécurité et l'alignement dans les interactions IA.

Comité des Machines

CoM

Le comité des machines est un cadre théorique pour comprendre les processus de prise de décision et l’éthique de l’IA.

Biais de confirmation dans l'IA

CBAI

Le biais de confirmation dans l'IA fait référence à la tendance des algorithmes à privilégier les informations qui confirment les croyances ou hypothèses existantes.

Intelligence Artificielle Constitutionnelle

CAI

L'intelligence artificielle constitutionnelle fait référence à des systèmes d'IA conçus pour respecter des lignes directrices et des principes éthiques, garantissant une prise de décision responsable.

Incitation constitutionnelle

La sollicitation constitutionnelle est une méthode pour garantir que le comportement de l'IA s'aligne avec les valeurs humaines et les lignes directrices éthiques.

Empoisonnement du contexte

La poisoning du contexte est une technique adversariale qui manipule le contexte fourni aux modèles d'IA pour produire des sorties biaisées.

Contrefactuels

Counterfactuals refer to hypothetical scenarios exploring 'what if' questions about events that did not occur.

Fouille de données

La fouille de données fait référence à l'utilisation abusive des méthodes d'analyse de données pour trouver des motifs qui ne se généralisent pas aux données non vues.

Débiaisage des Embeddings de Mots

La dé-biaisage des embeddings de mots implique des techniques pour réduire les biais dans les modèles linguistiques d'IA.

Alignement délibératif

L'Alignement Délibératif garantit que les systèmes d'IA reflètent les valeurs humaines par des processus de prise de décision collaboratifs.

Risque de double usage

Le risque à double usage fait référence au potentiel des technologies à être utilisées à la fois pour des fins bénéfiques et nuisibles.

Alignement d'intégration

EA

L'alignement des embeddings fait référence au processus consistant à garantir que les représentations générées par l'IA correspondent aux valeurs et intentions humaines.

Tromperie émergente

La tromperie émergente fait référence aux systèmes d'IA générant involontairement des informations trompeuses ou fausses lors des interactions.

Score d’humilité épistémique

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

Évaluer l'IA

Évaluer l'IA consiste à analyser les systèmes d'IA pour garantir leur efficacité, leur précision et leur conformité aux objectifs visés.

Back to All Terms
oEmbed (JSON) + /