評価指標における7つのAI用語を探索
BLEUスコアは、AIによって生成されたテキストの品質を評価し、参照翻訳と比較するための指標です。
CIDErは、人間が書いたリファレンスと比較して画像キャプションの品質を評価するために使用される指標です。
GIFA Lossは、生成モデルが現実的なサンプルを生成する能力に基づいて評価するための指標です。
Intersection over Union(IoU)は、物体検出において二つのバウンディングボックスの重なり具合を測定します。
パープレキシティは、言語モデルの性能を評価するために使用される測定値です。
精度とは、AIモデルの予測の正確さと一貫性を指します。
セーフティベンチマークは、AIシステムの安全性を評価するために使用される標準です。