AI Glossary: モデル最適化 Terms & Definitions

ダイナミック量子化

DQ

ダイナミック量子化は、性能を維持しながらニューラルネットワークモデルのサイズを削減する技術です。

ダイナミック量子化器

DQ

ダイナミック量子化器は、効率的な計算のためにランタイム中にニューラルネットワークの重みの精度を調整します。

INT4量子化

INT4

INT4量子化は、重みを4ビット整数で表すことでモデルのサイズを削減し、AI計算の効率を向上させます。

INT8推論

INT8

INT8推論は、より高速で効率的なAIモデルの予測のために8ビット整数の精度を使用します。

反復修正

IC

反復修正は、AIにおいて出力を繰り返し調整することで洗練させる手法です。

知識蒸留

KD

知識蒸留は、大きなモデルから小さなモデルへ知識を転送する技術です。

ナレッジプルーニング

KP

Knowledge pruning is the process of reducing a model's complexity by removing unnecessary information or parameters.

レイヤープルーニング

LP

レイヤープルーニングは、性能を維持しながら効率を向上させるためにニューラルネットワークの層の数を減らす技術です。

学習率探索ツール

LRF

学習率探索器は、機械学習モデルの最適な学習率を特定するためのツールです。

リニアボトルネック

LB

線形ボトルネックは、計算効率を高めるために次元を削減するニューラルネットワークの層です。

低ランク適応

LoRAで見られることもあります

低ランク適応は、大規模なAIモデルをより少ないパラメータで効率的に微調整する方法です。

モデルの複雑さ

モデルの複雑さは、機械学習モデルの複雑さを指し、その性能と解釈性に影響します。

モデル圧縮

MC

モデル圧縮は、パフォーマンスを維持しながらAIモデルのサイズを縮小します。

モデル圧縮ツールキット

MCT

AIモデルのサイズを縮小し、効率を向上させるために設計されたツールのセット。

モデル蒸留

MD

Model Distillationは、複雑なモデルからより単純なモデルへ知識を移転する技術です。

モデルの堅牢化

MH

モデルの堅牢化は、攻撃や脆弱性に対してAIモデルを強化するプロセスです。

モデルプルーニング

モデルパラメータ

モデルプルーニングは、不要なパラメータを削除して機械学習モデルのサイズを縮小する技術です。

モデルスケーリング

MS

モデルスケーリングは、性能と効率を向上させるためにAIモデルのサイズや複雑さを調整することです。

モデルサイズ

モデルサイズは、AIモデルのパラメータ数を指し、その複雑さや性能に影響します。

モデルサブクラス

モデルサブクラスは、特定のタスクの性能向上を目的とした、より広範なAIモデルの特定のバリエーションです。

OpenVINO

OpenVINOは、Intelハードウェア上での高性能推論のために深層学習モデルを最適化するオープンソースのツールキットです。

ポストトレーニング量子化

PTQ

ポストトレーニング量子化は、トレーニング後にパラメータを低精度に変換することで、モデルのサイズを削減し、推論を高速化します。

プルーニング

プルーニングは、効率性とパフォーマンスを向上させるためにニューラルネットワークの不要な部分を取り除くプロセスです。

量子化認識訓練

QAT

訓練中に低精度を模擬することで、効率的な展開のためにニューラルネットワークを訓練する方法。

スナップショットアンサンブル

SE

スナップショットアンサンブルは、異なる時期に訓練された複数のモデルを組み合わせて予測精度を向上させる手法です。

構造的剪定

SP

構造化プルーニングは、パフォーマンスを維持しながらモデルのサイズを削減するための手法であり、全体の構造を取り除きます。

非構造的剪定

上

Unstructured pruning reduces a neural network's size by removing individual weights based on their importance.