AI倫理に関する84のAI用語を探索
Actor Networkは、人間と非人間のエンティティ間の相互関係を記述する社会学の概念です。
AIリスクとは、人工知能システムの開発と展開に伴う潜在的な悪影響を指します。
アルゴリズムの偏りは、アルゴリズムの意思決定過程において体系的かつ不公平な差別を指す。
アラインドAIは、人間の価値観や目標に沿うように設計された人工知能システムを指します。
アラインメント税は、AIシステムを人間の価値観や倫理に沿わせるためにかかる追加コストを指します。
人間の価値観や意図に基づいてAIシステムを分類する枠組み。
AIにおけるアンカリングバイアスは、最初に得た情報に過度に依存する認知的傾向を指します。
アンソロピックは、人間の存在に関連する概念や原則、そしてそれがAIの安全性と倫理に与える影響を指します。
Anthropic Uncertaintyは、AIシステム設計における人間の嗜好や価値観に関する不確実性を指します。
監査可能性とは、コンプライアンスと説明責任のためにシステム内のプロセスやデータを検証し追跡できる能力です。
ベースレート誤認は、特定の情報を優先してベースレート(事前確率)を無視する場合に起こります。
行動ポリシーは、AIシステムにおける許容される行動のルールと期待を概説します。
Black Box Modelは、その内部動作がユーザーからアクセスできず、解釈できないAIシステムです。
Claude 1は、Anthropicによって開発されたAI言語モデルであり、安全性と整合性に焦点を当てたAIインタラクションを重視しています。
機械委員会は、AIの意思決定プロセスと倫理を理解するための理論的枠組みです。
AIにおける確証バイアスは、既存の信念や仮定を確認する情報を優先するアルゴリズムの傾向を指します。
憲法AIは、倫理的ガイドラインと原則を遵守するように設計されたAIシステムを指し、責任ある意思決定を確保します。
憲法的プロンプトは、AIの行動が人間の価値観や倫理的ガイドラインに沿うようにする方法です。
コンテキストポイズニングは、AIモデルに提供される文脈を操作して偏った出力を生成させる敵対的手法です。
Counterfactuals refer to hypothetical scenarios exploring 'what if' questions about events that did not occur.
データスヌーピングは、未見のデータに一般化しないパターンを見つけるためにデータ分析手法を誤用することを指します。
単語埋め込みの偏り除去は、AI言語モデルの偏りを減らす技術を指します。
Deliberative Alignmentは、協働的な意思決定プロセスを通じてAIシステムが人間の価値観を反映することを保証します。
デュアルユースリスクは、技術が有益な目的と有害な目的の両方に使用される可能性を指します。
埋め込み整列は、AI生成の表現が人間の価値観や意図と一致するようにするプロセスです。
出現的欺瞞は、AIシステムが相互作用中に誤解を招く情報や誤った情報を意図せず生成することです。
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
AIの評価は、AIシステムの効果性、正確性、目的との整合性を確保するための評価を含みます。