J

ジャカード指数

JI

Jaccard Indexは、2つの集合の交差と和を比較して類似度を測定します。

その ジャカード指数, also known as the Jaccard類似度 coefficient, is a statistical measure used to quantify the similarity between two sets. It is defined as the size of the intersection divided by the size of the union of the two sets. This index is particularly useful in various fields such as データマイニング, ecology, and 機械学習.

数学的には、ジャッカード指数(J)は次のように表されます:

J(A, B) = |A ∩ B| / |A ∪ B|

ここで:

  • |A ∩ B|は、集合AとBの両方に共通する要素の数(交差部分)です。
  • |A ∪ B|は、集合AとBの両方に含まれるユニークな要素の総数(和集合)です。

ジャッカード指数の値は0から1の範囲です。0の値は、2つの集合が完全に互いに disjoint(共通要素なし)であることを示し、1の値は、2つの集合が完全に一致していることを示します。0から1の間の値は、さまざまな類似度を反映しています。

例えば、集合Aが{1, 2, 3}を含み、集合Bが{2, 3, 4}を含む場合、ジャッカード指数は次のようになります:

J(A, B) = |{2, 3}| / |{1, 2, 3, 4}| = 2 / 4 = 0.5

ジャカード指数は広く使用されています クラスタリングアルゴリズムにおいて重要です, レコメンデーションシステム, and analyzing the diversity of species in ecological studies. Its simplicity and effectiveness make it a popular choice for assessing similarity, especially in binary data.

コントロール + /