Fuzzy C-Means (FCM)
Fuzzy C-Means (FCM) is a popular clustering algorithm usadas em análise de dados and pattern recognition. Unlike traditional clustering methods, such as K-means, which assign each data point to a single cluster, FCM allows for a more flexible assignment. In FCM, each data point can belong to multiple clusters with different degrees of membership, represented by a value between 0 and 1.
O algoritmo funciona minimizando a variância ponderada dentro do grupo, que é definida como a soma das distâncias entre cada ponto de dado e os centróides dos grupos, elevada a uma potência (geralmente 2), e ponderada pelo grau de associação de cada ponto aos grupos. Os passos envolvidos no algoritmo FCM são os seguintes:
- Inicialização: Escolha o número de grupos (C) e inicialize os centróides dos grupos aleatoriamente.
- Cálculo de Associação: For each data point, calculate its degree of membership for each cluster based on its distance to the centroids.
- Atualização do Centróide: Update the centroids by calculating the weighted average of the data points, where weights are the degrees of membership.
- Verificação de Convergência: Repeat the membership calculation and centroid update steps until the changes in centroids or memberships fall below a specified threshold.
Fuzzy C-Means is particularly useful in scenarios where data is inherently ambiguous, such as segmentação de imagem, medical diagnosis, and customer segmentation. By allowing for partial membership in multiple clusters, FCM provides a more nuanced understanding of the underlying structure in the data.