AI Glossary: AI倫理 Terms & Definitions

アクターネットワーク

Actor Networkは、人間と非人間のエンティティ間の相互関係を記述する社会学の概念です。

AIリスク

AIリスクとは、人工知能システムの開発と展開に伴う潜在的な悪影響を指します。

アルゴリズムバイアス

アルゴリズムの偏りは、アルゴリズムの意思決定過程において体系的かつ不公平な差別を指す。

アラインドAI

アラインドAIは、人間の価値観や目標に沿うように設計された人工知能システムを指します。

アラインメント税

アラインメント税は、AIシステムを人間の価値観や倫理に沿わせるためにかかる追加コストを指します。

アラインメント分類法

AT

人間の価値観や意図に基づいてAIシステムを分類する枠組み。

固着バイアス（AI）

AIにおけるアンカリングバイアスは、最初に得た情報に過度に依存する認知的傾向を指します。

アンソロピック

アンソロピックは、人間の存在に関連する概念や原則、そしてそれがAIの安全性と倫理に与える影響を指します。

アンソロピック不確実性

Anthropic Uncertaintyは、AIシステム設計における人間の嗜好や価値観に関する不確実性を指します。

監査可能性

監査可能性とは、コンプライアンスと説明責任のためにシステム内のプロセスやデータを検証し追跡できる能力です。

ベースレート誤謬

ベースレート誤認は、特定の情報を優先してベースレート（事前確率）を無視する場合に起こります。

行動ポリシー

BP

行動ポリシーは、AIシステムにおける許容される行動のルールと期待を概説します。

ブラックボックスモデル

Black Box Modelは、その内部動作がユーザーからアクセスできず、解釈できないAIシステムです。

Claude 1

Claude 1は、Anthropicによって開発されたAI言語モデルであり、安全性と整合性に焦点を当てたAIインタラクションを重視しています。

機械委員会

CoM

機械委員会は、AIの意思決定プロセスと倫理を理解するための理論的枠組みです。

AIにおける確証バイアス

申し訳ありませんが、翻訳する英語のテキストが提供されていません。「CBAI」は翻訳対象のテキストではなく、ブランド名や略語のように見受けられます。翻訳すべき英語のテキストを入力してください。

AIにおける確証バイアスは、既存の信念や仮定を確認する情報を優先するアルゴリズムの傾向を指します。

憲法AI

CAI

憲法AIは、倫理的ガイドラインと原則を遵守するように設計されたAIシステムを指し、責任ある意思決定を確保します。

憲法的プロンプト

憲法的プロンプトは、AIの行動が人間の価値観や倫理的ガイドラインに沿うようにする方法です。

コンテキスト・ポイゾニング

コンテキストポイズニングは、AIモデルに提供される文脈を操作して偏った出力を生成させる敵対的手法です。

反事実

Counterfactuals refer to hypothetical scenarios exploring 'what if' questions about events that did not occur.

データスヌーピング

データスヌーピングは、未見のデータに一般化しないパターンを見つけるためにデータ分析手法を誤用することを指します。

単語埋め込みの偏り除去

単語埋め込みの偏り除去は、AI言語モデルの偏りを減らす技術を指します。

熟議的整合性

Deliberative Alignmentは、協働的な意思決定プロセスを通じてAIシステムが人間の価値観を反映することを保証します。

デュアルユースリスク

デュアルユースリスクは、技術が有益な目的と有害な目的の両方に使用される可能性を指します。

埋め込み整列

EA

埋め込み整列は、AI生成の表現が人間の価値観や意図と一致するようにするプロセスです。

出現する欺瞞

出現的欺瞞は、AIシステムが相互作用中に誤解を招く情報や誤った情報を意図せず生成することです。

認識的謙虚さスコア

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

AIの評価

AIの評価は、AIシステムの効果性、正確性、目的との整合性を確保するための評価を含みます。