クラスタリングにおける25のAI用語を探索
アフィニティ・プロパゲーションは、類似性に基づいてメッセージを交換しながらデータポイントをグループ化するクラスタリングアルゴリズムです。
凝集型クラスタリングは、データポイントの近接性に基づいてグループ化する階層的クラスタリング手法です。
バイクラスタリングは、行と列のサブセットを同時に識別するデータ分析手法です。
クラスター分析は、類似したデータポイントをグループ化するためのデータ分析手法です。
クラスタリング係数は、グラフ内のノードがどの程度互いにクラスタリングしやすいかを測定します。
DBSCANは、密度に基づいてポイントをグループ化し、さまざまな形状とサイズのクラスタを識別するクラスタリングアルゴリズムです。
DBScanは、空間データ内のクラスタを識別する密度に基づくクラスタリングアルゴリズムです。
デンドログラムは、階層的なデータや関係性を表すために使用される木構造の図であり、クラスタリングや系統学で一般的に使用されます。
Density-Based Clusteringは、特徴空間内の密度に基づいてデータポイントをグループ化し、さまざまな形状とサイズのクラスタを識別します。
文書クラスタリングは、類似した文書をグループ化し、大規模なデータセットの整理と検索を向上させます。
エルボー法は、データセット内の最適なクラスタ数を決定するための手法です。
ファジーC平均法は、データポイントが複数のクラスタに異なる程度の所属度を持って属することを可能にするクラスタリングアルゴリズムです。
Fuzzy C-Means Clustering(ファジーC平均クラスタリング)は、データポイントが複数のクラスタに異なる度合いで属することを許すクラスタリングアルゴリズムです。
階層的凝集クラスタリング(HAC)は、クラスタの階層を構築しようとするクラスタ分析の方法です。
インタークラス距離は、データセット内の異なるクラスタ間の分離度を測る指標です。
クラスター内距離は、クラスター内の点間の平均距離を測定し、一体性と密度を示します。
K-Means Plus Plusは、K-Meansクラスタリングの初期化を高度化したアルゴリズムで、収束速度とクラスタリングの質を向上させます。
K-Means++は、より良い初期クラスタ中心の選択のためのK-Meansアルゴリズムの改良版です。
K-Medoidsは、データセットから代表的なデータポイント(メドイド)を特定するクラスタリングアルゴリズムです。
K-Medoidsクラスタリングは、データセットから代表的なオブジェクトを特定し、点間の距離を最小化するデータクラスタリング手法です。
Mean Shiftアルゴリズムは、データの密集領域を特定するために、データポイントを平均に向かって反復的に移動させるクラスタリング手法です。
Minibatch K-Meansは、少量のランダムなデータサブセットを使用して効率的に処理するK-Meansクラスタリングの高速バージョンです。
重なりクラスタは、複数のクラスタに同時に属するデータポイントのグループです。
ペアワイズ距離は、データセット内の点のペア間の距離を測定し、クラスタリングや類似性分析で一般的に使用されます。
ペアワイズ類似度は、データセット内の2つのアイテムやデータポイント間の類似性を測定します。