AI Glossary: クラスタリング Terms & Definitions

アフィニティ・プロパゲーション

アフィニティ・プロパゲーションは、類似性に基づいてメッセージを交換しながらデータポイントをグループ化するクラスタリングアルゴリズムです。

アグロメレーティブ・クラスタリング

凝集型クラスタリングは、データポイントの近接性に基づいてグループ化する階層的クラスタリング手法です。

バイクラスタリング

バイクラスタリングは、行と列のサブセットを同時に識別するデータ分析手法です。

クラスター分析

クラスター分析は、類似したデータポイントをグループ化するためのデータ分析手法です。

クラスタリング係数

クラスタリング係数は、グラフ内のノードがどの程度互いにクラスタリングしやすいかを測定します。

DBSCAN

DBSCANは、密度に基づいてポイントをグループ化し、さまざまな形状とサイズのクラスタを識別するクラスタリングアルゴリズムです。

DBScanアルゴリズム

DBScan

DBScanは、空間データ内のクラスタを識別する密度に基づくクラスタリングアルゴリズムです。

デンドログラム

デンドログラムは、階層的なデータや関係性を表すために使用される木構造の図であり、クラスタリングや系統学で一般的に使用されます。

密度に基づくクラスタリング

Density-Based Clusteringは、特徴空間内の密度に基づいてデータポイントをグループ化し、さまざまな形状とサイズのクラスタを識別します。

文書クラスタリング

文書クラスタリングは、類似した文書をグループ化し、大規模なデータセットの整理と検索を向上させます。

肘法

エルボー法は、データセット内の最適なクラスタ数を決定するための手法です。

ファジーC平均法

FCM

ファジーC平均法は、データポイントが複数のクラスタに異なる程度の所属度を持って属することを可能にするクラスタリングアルゴリズムです。

ファジィC平均クラスタリング

FCM

Fuzzy C-Means Clustering（ファジーC平均クラスタリング）は、データポイントが複数のクラスタに異なる度合いで属することを許すクラスタリングアルゴリズムです。

階層的凝集クラスタリング

HAC

階層的凝集クラスタリング（HAC）は、クラスタの階層を構築しようとするクラスタ分析の方法です。

クラスター間距離

インタークラス距離は、データセット内の異なるクラスタ間の分離度を測る指標です。

クラスター内距離

クラスター内距離は、クラスター内の点間の平均距離を測定し、一体性と密度を示します。

K-Means Plus Plus

K-Means++

K-Means Plus Plusは、K-Meansクラスタリングの初期化を高度化したアルゴリズムで、収束速度とクラスタリングの質を向上させます。

K-Means++

K-Means++は、より良い初期クラスタ中心の選択のためのK-Meansアルゴリズムの改良版です。

K-メドイド

KM

K-Medoidsは、データセットから代表的なデータポイント（メドイド）を特定するクラスタリングアルゴリズムです。

K-Medoidsクラスタリング

K-Medoidsクラスタリングは、データセットから代表的なオブジェクトを特定し、点間の距離を最小化するデータクラスタリング手法です。

Mean Shift アルゴリズム

Mean Shiftアルゴリズムは、データの密集領域を特定するために、データポイントを平均に向かって反復的に移動させるクラスタリング手法です。

ミニバッチK-Means

MBK-クラスタリング

Minibatch K-Meansは、少量のランダムなデータサブセットを使用して効率的に処理するK-Meansクラスタリングの高速バージョンです。

オーバーラップクラスタ

重なりクラスタは、複数のクラスタに同時に属するデータポイントのグループです。

ペアワイズ距離

ペアワイズ距離は、データセット内の点のペア間の距離を測定し、クラスタリングや類似性分析で一般的に使用されます。

ペアワイズ類似性

ペアワイズ類似度は、データセット内の2つのアイテムやデータポイント間の類似性を測定します。