AI Glossary: AIトレーニングデータ Terms & Definitions

カリキュラム中毒

カリキュラムポイズニングは、AIモデルの性能を低下させるようにトレーニングデータを操作することです。

データ注釈サービスは、画像認識や自然言語処理などのタスクに必要なラベル付きデータを提供します。

データ拡張パイプラインは、さまざまな変換を適用してトレーニングデータセットを強化し、AIモデルの性能を向上させます。

GC

グーテンベルクコーパスは、言語処理やAIトレーニングに使用されるProject Gutenbergのテキストのコレクションです。

入力空間は、AIモデルが受け入れ処理できるすべての可能な入力の範囲を指します。

入力ベクトルは、機械学習モデルに入力されるデータの数学的表現です。

ラベルバイアスは、データのラベリングにおける体系的な誤りを指し、AIモデルの性能に影響を与える可能性があります。

ラベルの不確実性は、AIモデルの訓練に使用されるデータのラベルにおける曖昧さを指します。

ラベル付きデータは、パターンを学習し予測を行うために使用される注釈付き情報です。

ラベリング関数は、機械学習タスクにおいてデータにラベルを付与するためのヒューリスティックです。

手動アノテーションは、AIモデルの訓練のためにデータにラベルを付ける手作業のプロセスであり、データセットの正確さと精度を確保します。

モデル入力とは、処理と予測のためにAIモデルに供給されるデータを指します。

ネガティブサンプルは、機械学習で非ターゲットクラスのインスタンスを表すために使用されるデータポイントです。

ネットワークトレーニングは、反復学習プロセスを通じてAIモデルにデータのパターンを認識させることを含みます。

観測データとは、さまざまな分野で直接測定または観察によって収集された情報を指します。