La Pérdida de Hamming es una métrica utilizada para evaluar el rendimiento de aprendizaje automático models, particularly in clasificación multietiqueta tasks. It quantifies the number of incorrect labels predicted by a model compared to the true labels. The Hamming Loss is calculated as the average fraction of incorrect labels over all instances in the dataset.
Para calcular la Hamming Loss, generalmente se siguen los siguientes pasos:
- Para cada instancia, compara las etiquetas predichas con las etiquetas verdaderas.
- Cuenta el número de etiquetas que se predicen incorrectamente.
- Suma estos conteos en todas las instancias.
- Divide el número total de predicciones incorrectas por el número total de etiquetas en todas las instancias.
The resulting value will range from 0 to 1, where 0 indicates perfect predictions (no incorrect labels) and 1 indicates that all predictions are incorrect. It is particularly useful in scenarios where multiple labels can apply to a single instance, such as image etiquetado o categorización de textos.
La Pérdida de Hamming es ventajosa porque proporciona una comprensión intuitiva de rendimiento del modelo in multi-label settings, allowing for direct comparisons between models. However, it may not account for the varying importance of different labels, which could be a consideration in some applications.