AI Glossary: コンピュータビジョン Terms & Definitions

3Dビジョン

3DV

3Dビジョンは、視覚情報を使用して三次元空間の奥行きと距離を知覚する能力を指します。

アクション認識

拡張現実（AR）

アクション認識は、AI技術を用いてビデオデータ内の特定の動作を識別するプロセスです。

アルベュメンテーションズ

なし

Albumentationsは、深層学習における画像拡張のためのPythonライブラリで、多様な画像変換を用いてモデルのトレーニングを強化します。

アルファポーズ

AP

AlphaPoseは、ディープラーニング技術を用いたリアルタイムの人間のポーズ推定フレームワークです。

アンカーボックス

AB

アンカーボックスは、画像内の物体を識別し位置を特定するのに役立つ、事前に定義されたバウンディングボックスです。

アンカーボックス回帰

アンカーボックス回帰は、物体検出において提案されたバウンディングボックスを洗練させる技術です。

ArcFace

ArcFaceは、特徴表現に角度距離を使用することで精度を向上させる顔認識アルゴリズムです。

アトラス畳み込み

自己相関

アトラス畳み込みは、拡張フィルターを使用してニューラルネットワーク内のマルチスケール特徴を捉える畳み込みの一種です。

アテンションメカニズム

午前

アテンションメカニズムは、AIモデルが入力データの関連部分に集中するのを助け、翻訳や画像認識などのタスクのパフォーマンスを向上させます。

アテンションプーリング

AP

アテンションプーリングは、AIにおいて、関連する部分に焦点を当てることでさまざまな入力特徴から情報を要約する技術です。

平均プーリング

平均プール

平均プーリングは、サブリージョンの平均値を取ることで特徴マップのサイズを縮小します。

コンピュータビジョンにおけるBag-of-wordsモデル

BoW

画像を視覚的特徴の集合として表現し、分析や分類に用いるモデルです。

BLIP

BLIPは、画像キャプション生成や視覚的質問応答などのタスクのために、視覚と言語処理を組み合わせたモデルです。

ブロブ検出

Blob detectionは、画像内の周囲の領域と異なる特性（輝度や色など）を持つ領域を識別します。

境界検出

BD

Boundary detectionは、画像やデータのエッジや遷移を識別し、物体認識や画像解析において重要です。

バウンディングボックスの座標

Bounding box coordinatesは、画像や3D空間内の物体の位置と大きさを定義します。

カプセルネットワークルーティング

カプセルネットワークルーティングは、深層学習において、ニューラルネットワークがデータの空間的階層を処理する方法を改善する技術です。

カプセルニューラルネットワーク

CapsNet

カプセルニューラルネットワークは、パターン認識と空間的階層を強化する高度なニューラルネットワークアーキテクチャです。

カスケード R-CNN

Cascade R-CNNは、複数の領域提案ネットワークの段階を経て精度を向上させる高度な物体検出フレームワークです。

CenterNet

CT

CenterNetは、ポイントとして物体を検出するオブジェクト検出フレームワークであり、検出プロセスを簡素化します。

CIFAR

CIFARは、コンピュータビジョンタスクにおいて機械学習モデルのトレーニングに広く使用されているデータセットです。

CIFAR-100データセット

CIFAR-100データセットは、機械学習研究のための100クラスに分類された60,000枚の32x32カラー画像のコレクションです。

Cityscapesデータセット

CS

都市の風景を理解し、都市環境内のオブジェクトをセグメント化するAIのトレーニングに使用される大規模なデータセット。

クラスアクティベーションマップ

CAM

Class Activation Maps (CAMs) は、CNNが分類のために特定の画像領域に焦点を当てる様子を可視化します。

クラスアクティベーションマッピング

CAM

Class Activation Mapping は、深層学習モデルの予測において重要な画像領域を強調します。

CLIP

CLIPは、画像とテキストを結び付けて理解と解釈を向上させるAIモデルです。

コーアテンションメカニズム

共注意機構

コーアテンションメカニズムは、モデルが2つの入力セットに同時に焦点を当てることを可能にし、その理解と表現を強化します。

ココ

COCOは、AIアプリケーションにおける画像認識、セグメンテーション、キャプション生成のための大規模なデータセットです。