AI Glossary: AI評価指標 Terms & Definitions

絶対誤差

近似誤差（AE）

絶対誤差は、予測値と実際の値との差を測定し、モデルの精度を示します。

Akaike情報量基準

AIC

Akaike Information Criterion（AIC）は、統計モデルの品質を評価するのに役立ちます。

非対称損失

Asymmetric lossは、予測モデルにおいて誤りの種類や重大さに応じて異なるペナルティを課す損失関数です。

平均適合率スコア

APスコア

Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.

ベースライン精度

ベースライン精度は、モデルが効果的とみなされるために達成しなければならない最小の精度です。

ベイズ情報量規準

BIC

ベイズ情報量基準（BIC）は、モデル選択に用いられる統計的ツールです。

BERTスコア

BERTScoreは、BERTの埋め込みを使用してテキストの類似性を評価する自然言語処理の評価指標です。

Bleuスコア指標

BLEU

Bleuスコア指標は、機械生成されたテキストの品質を参照テキストと比較して評価します。

ブライアースコア

ブライアースコアは確率的予測の正確さを測定し、予測結果と実際の結果との平均二乗差を定量化します。

CIDErスコア

CIDEr

CIDErスコアは、人間が生成したキャプションとの合意に基づいて画像キャプションモデルを評価する指標です。

比較評価

比較評価は、定義された指標を用いてAIシステムの性能を比較する評価方法です。

信頼区間

信頼区間は、予測や推定の不確実性を定量化する統計的な限界です。

信頼度スコア

CS

A Confidence Score quantifies the certainty of an AI model's predictions.

混同行列の指標

混同行列の指標は、分類モデルの性能を評価するための指標（正確性、適合率、再現率、F1スコア）です。

発散度指標

発散尺度は、機械学習において2つの確率分布の違いを定量化します。

Earth Mover’s Distance

アースムーバー距離

Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.

認識的謙虚さスコア

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

等誤差率

EER

等エラー率（EER）は、生体認証システムの性能を評価する指標です。

F値

F1

F-Measureは、精度とリコールのバランスをとる分類モデルの性能を評価する指標です。

Fスコア

F1

F-Scoreは、二値分類モデルの正確性を評価する統計的指標です。

不正アクセス許容率

不正アクセス許容率は、システムが不正なユーザーを誤って許可されたユーザーと識別する可能性を測定します。

偽発見率

FDR

偽陽性率（FDR）は、統計的仮説検定において、陽性結果の中の誤った陽性の割合を示します。

誤陰性

偽陰性は、実際に存在する条件を誤って検出しない場合に発生します。

偽陽性率

FPR

The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.

誤拒否率

FRR

偽拒否率（FRR）は、無許可のユーザーを誤って受け入れる割合を示します。

予測誤差

予測誤差は、予測モデルにおける予測値と実際の値との差を指します。

フレシェ・イニクペクション距離

FID

Fréchet Inception Distance（FID）は、生成画像の品質を実際の画像の分布と比較して測定します。

ハミング損失

Hamming Lossは、多ラベル分類タスクにおいて誤ったラベルの割合を測定します。