機械翻訳における10のAI用語を探る
BLEUスコアは、AIによって生成されたテキストの品質を評価し、参照翻訳と比較するための指標です。
デトークナイゼーションは、トークンを自然言語のテキストに戻すプロセスです。
Europarlコーパスは、欧州議会の議事録の多言語データセットであり、言語処理タスクに役立ちます。
Flores-200は、自然言語処理におけるAIモデルの評価に使用されるベンチマークデータセットです。
言語翻訳は、AIモデルを利用してテキストをある言語から別の言語に変換することです。
Meteorスコアは、自然言語処理タスクにおけるAIモデルの性能を評価する指標です。
Neural Machine Translation (NMT)は、ニューラルネットワークを用いてテキストを自動的に一つの言語から別の言語に翻訳します。
OPUS Corpusは、自然言語処理タスクに使用される多言語並列コーパスのコレクションです。
パラレルコーパスは、2つ以上の言語のテキストを文やフレーズレベルで整列させたコレクションです。
SeamlessM4Tは、さまざまな言語間でのリアルタイム翻訳と文字起こしを目的とした多言語AIモデルです。