音声処理における3つのAI用語を探る
音響モデルは、音声認識において音声信号と対応する音素または言語単位との関係を表します。
i-Vectorは、話者認識などの機械学習タスクで使用される音声や音響特徴のコンパクトな表現です。
Mel周波数ケプストラム係数(MFCC)は、音声処理や音声認識に使用される特徴量です。