コンピュータビジョンの300のAI用語を探索
3Dビジョンは、視覚情報を使用して三次元空間の奥行きと距離を知覚する能力を指します。
アクション認識は、AI技術を用いてビデオデータ内の特定の動作を識別するプロセスです。
Albumentationsは、深層学習における画像拡張のためのPythonライブラリで、多様な画像変換を用いてモデルのトレーニングを強化します。
AlphaPoseは、ディープラーニング技術を用いたリアルタイムの人間のポーズ推定フレームワークです。
アンカーボックスは、画像内の物体を識別し位置を特定するのに役立つ、事前に定義されたバウンディングボックスです。
アンカーボックス回帰は、物体検出において提案されたバウンディングボックスを洗練させる技術です。
ArcFaceは、特徴表現に角度距離を使用することで精度を向上させる顔認識アルゴリズムです。
アトラス畳み込みは、拡張フィルターを使用してニューラルネットワーク内のマルチスケール特徴を捉える畳み込みの一種です。
アテンションメカニズムは、AIモデルが入力データの関連部分に集中するのを助け、翻訳や画像認識などのタスクのパフォーマンスを向上させます。
アテンションプーリングは、AIにおいて、関連する部分に焦点を当てることでさまざまな入力特徴から情報を要約する技術です。
平均プーリングは、サブリージョンの平均値を取ることで特徴マップのサイズを縮小します。
画像を視覚的特徴の集合として表現し、分析や分類に用いるモデルです。
BLIPは、画像キャプション生成や視覚的質問応答などのタスクのために、視覚と言語処理を組み合わせたモデルです。
Blob detectionは、画像内の周囲の領域と異なる特性(輝度や色など)を持つ領域を識別します。
Boundary detectionは、画像やデータのエッジや遷移を識別し、物体認識や画像解析において重要です。
Bounding box coordinatesは、画像や3D空間内の物体の位置と大きさを定義します。
カプセルネットワークルーティングは、深層学習において、ニューラルネットワークがデータの空間的階層を処理する方法を改善する技術です。
カプセルニューラルネットワークは、パターン認識と空間的階層を強化する高度なニューラルネットワークアーキテクチャです。
Cascade R-CNNは、複数の領域提案ネットワークの段階を経て精度を向上させる高度な物体検出フレームワークです。
CenterNetは、ポイントとして物体を検出するオブジェクト検出フレームワークであり、検出プロセスを簡素化します。
CIFARは、コンピュータビジョンタスクにおいて機械学習モデルのトレーニングに広く使用されているデータセットです。
CIFAR-100データセットは、機械学習研究のための100クラスに分類された60,000枚の32x32カラー画像のコレクションです。
都市の風景を理解し、都市環境内のオブジェクトをセグメント化するAIのトレーニングに使用される大規模なデータセット。
Class Activation Maps (CAMs) は、CNNが分類のために特定の画像領域に焦点を当てる様子を可視化します。
Class Activation Mapping は、深層学習モデルの予測において重要な画像領域を強調します。
CLIPは、画像とテキストを結び付けて理解と解釈を向上させるAIモデルです。
コーアテンションメカニズムは、モデルが2つの入力セットに同時に焦点を当てることを可能にし、その理解と表現を強化します。
COCOは、AIアプリケーションにおける画像認識、セグメンテーション、キャプション生成のための大規模なデータセットです。