AI Glossary: KI-Ethik Terms & Definitions

Akteur-Netzwerk

Ein Akteur-Netzwerk ist ein Konzept in der Soziologie, das die miteinander verbundenen Beziehungen zwischen menschlichen und nicht-menschlichen Entitäten beschreibt.

KI-Risiko

Das Risiko künstlicher Intelligenz bezieht sich auf potenzielle negative Folgen, die sich aus der Entwicklung und dem Einsatz von künstlichen Intelligenzsystemen ergeben können.

Algorithmische Verzerrung

Algorithmische Voreingenommenheit bezieht sich auf systematische und ungerechte Diskriminierung in algorithmischen Entscheidungsprozessen.

Ausgerichtete KI

Aligned AI bezieht sich auf künstliche Intelligenzsysteme, die darauf ausgelegt sind, mit menschlichen Werten und Zielen übereinzustimmen.

Ausrichtungssteuer

Alignment Tax bezeichnet die zusätzlichen Kosten, die entstehen, um sicherzustellen, dass KI-Systeme mit menschlichen Werten und Ethik übereinstimmen.

Ausrichtungs-Taxonomie

AT

Ein Rahmenwerk, das KI-Systeme basierend auf ihrer Übereinstimmung mit menschlichen Werten und Absichten kategorisiert.

Ankerverzerrung (KI)

Anchoring Bias in AI bezieht sich auf die kognitive Tendenz, sich stark auf die erste erhaltene Information zu stützen.

Anthropisch

Anthropic bezieht sich auf Konzepte oder Prinzipien im Zusammenhang mit menschlicher Existenz und den Implikationen für KI-Sicherheit und Ethik.

Anthropische Unsicherheit

Anthropic Uncertainty bezieht sich auf die Unsicherheit bezüglich menschlicher Präferenzen und Werte bei der Gestaltung von KI-Systemen.

Überprüfbarkeit

Nachvollziehbarkeit ist die Fähigkeit, Prozesse oder Daten innerhalb eines Systems auf Einhaltung und Verantwortlichkeit zu überprüfen und nachzuvollziehen.

Grundrate-Fehlschluss

Der Base Rate Fallacy tritt auf, wenn die Grundwahrscheinlichkeit (Prior-Wahrscheinlichkeit) zugunsten spezifischer Informationen ignoriert wird.

Verhaltensrichtlinie

BP

Eine Verhaltensrichtlinie umreißt die Regeln und Erwartungen für akzeptables Verhalten in KI-Systemen.

Black Box Modell

Ein Black Box Modell ist ein KI-System, dessen interne Funktionsweise für Nutzer nicht zugänglich oder interpretierbar ist.

Claude 1

Claude 1 ist ein KI-Sprachmodell, das von Anthropic entwickelt wurde und sich auf Sicherheit und Alignment in KI-Interaktionen konzentriert.

Komitee der Maschinen

CoM

Das Committee of Machines ist ein theoretischer Rahmen zum Verständnis von Entscheidungsprozessen und Ethik in KI.

Bestätigungsfehler in KI

Es tut mir leid, aber ich habe keine Informationen zu "CBAI". Könnten Sie bitte den vollständigen englischen Text bereitstellen, den Sie übersetzt haben möchten?

Bestätigungsfehler in KI bezieht sich auf die Tendenz von Algorithmen, Informationen zu bevorzugen, die bestehende Überzeugungen oder Annahmen bestätigen.

Verfassungsbasierte KI

Es tut mir leid, aber ich habe keinen englischen Text zum Übersetzen erhalten. Bitte geben Sie den zu übersetzenden Text ein.

Verfassungsbasierte KI bezieht sich auf KI-Systeme, die so konzipiert sind, dass sie ethischen Richtlinien und Prinzipien folgen, um verantwortungsvolle Entscheidungen zu gewährleisten.

Konstitutionelles Prompting

Konstitutionelles Prompting ist eine Methode, um sicherzustellen, dass das Verhalten von KI mit menschlichen Werten und ethischen Richtlinien übereinstimmt.

Kontextvergiftung

Kontextvergiftung ist eine adversariale Technik, die den Kontext, der KI-Modellen bereitgestellt wird, manipuliert, um voreingenommene Ausgaben zu erzeugen.

Gegenbeispiele

Counterfactuals refer to hypothetical scenarios exploring 'what if' questions about events that did not occur.

Daten-Spionage

Data Snooping bezeichnet den Missbrauch von Datenanalysemethoden, um Muster zu finden, die auf ungesehene Daten nicht generalisieren.

Entbiasing Wort-Embeddings

Debiasing von Wort-Einbettungen umfasst Techniken zur Reduzierung von Vorurteilen in KI-Sprachmodellen.

Überlegene Ausrichtung

Überlegene Ausrichtung stellt sicher, dass KI-Systeme menschliche Werte durch kollaborative Entscheidungsprozesse widerspiegeln.

Dual-Use-Risiko

Dual-Use-Risiko bezieht sich auf das Potenzial von Technologien, sowohl für nützliche als auch schädliche Zwecke verwendet zu werden.

Einbettungsangleichung

EA

Die Ausrichtung von Einbettungen bezieht sich auf den Prozess, sicherzustellen, dass von KI generierte Darstellungen mit menschlichen Werten und Absichten übereinstimmen.

Emergende Täuschung

Emergende Täuschung bezieht sich auf KI-Systeme, die unbeabsichtigt irreführende oder falsche Informationen während Interaktionen erzeugen.

Epistemische Demutskala

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

Bewertung von KI

Die Bewertung von KI umfasst die Beurteilung von KI-Systemen, um Wirksamkeit, Genauigkeit und Übereinstimmung mit den beabsichtigten Zielen sicherzustellen.