データ準備における7つのAI用語を探る
データクレンジングは、データセット内のエラーや不整合を特定し修正するプロセスです。
データ前処理は、生データを分析や機械学習に適した形式に整えるプロセスです。
データラングリングは、生データをクリーニングし分析に適した形式に変換するプロセスです。
例の選択は、AIモデルの訓練のために特定のデータポイントを選ぶプロセスです。
人間のアノテーションは、AIモデルのトレーニングと性能向上のために人間がデータにラベル付けを行うプロセスです。
モデル準備は、効果的なAIモデルのトレーニングと評価のためにデータを整理・洗練することです。
オーバーサンプリング技術は、データセットのクラス不均衡に対処するために、マイノリティクラスのインスタンス数を増やす方法です。