AI評価指標における90のAI用語を探索
絶対誤差は、予測値と実際の値との差を測定し、モデルの精度を示します。
Akaike Information Criterion(AIC)は、統計モデルの品質を評価するのに役立ちます。
Asymmetric lossは、予測モデルにおいて誤りの種類や重大さに応じて異なるペナルティを課す損失関数です。
Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.
ベースライン精度は、モデルが効果的とみなされるために達成しなければならない最小の精度です。
ベイズ情報量基準(BIC)は、モデル選択に用いられる統計的ツールです。
BERTScoreは、BERTの埋め込みを使用してテキストの類似性を評価する自然言語処理の評価指標です。
Bleuスコア指標は、機械生成されたテキストの品質を参照テキストと比較して評価します。
ブライアースコアは確率的予測の正確さを測定し、予測結果と実際の結果との平均二乗差を定量化します。
CIDErスコアは、人間が生成したキャプションとの合意に基づいて画像キャプションモデルを評価する指標です。
比較評価は、定義された指標を用いてAIシステムの性能を比較する評価方法です。
信頼区間は、予測や推定の不確実性を定量化する統計的な限界です。
A Confidence Score quantifies the certainty of an AI model's predictions.
混同行列の指標は、分類モデルの性能を評価するための指標(正確性、適合率、再現率、F1スコア)です。
発散尺度は、機械学習において2つの確率分布の違いを定量化します。
Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
等エラー率(EER)は、生体認証システムの性能を評価する指標です。
F-Measureは、精度とリコールのバランスをとる分類モデルの性能を評価する指標です。
F-Scoreは、二値分類モデルの正確性を評価する統計的指標です。
不正アクセス許容率は、システムが不正なユーザーを誤って許可されたユーザーと識別する可能性を測定します。
偽陽性率(FDR)は、統計的仮説検定において、陽性結果の中の誤った陽性の割合を示します。
偽陰性は、実際に存在する条件を誤って検出しない場合に発生します。
The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.
偽拒否率(FRR)は、無許可のユーザーを誤って受け入れる割合を示します。
予測誤差は、予測モデルにおける予測値と実際の値との差を指します。
Fréchet Inception Distance(FID)は、生成画像の品質を実際の画像の分布と比較して測定します。
Hamming Lossは、多ラベル分類タスクにおいて誤ったラベルの割合を測定します。