Hamming Loss é uma métrica usada para avaliar o desempenho de aprendizado de máquina models, particularly in classificação multi-rótulo tasks. It quantifies the number of incorrect labels predicted by a model compared to the true labels. The Hamming Loss is calculated as the average fraction of incorrect labels over all instances in the dataset.
Para calcular o Hamming Loss, geralmente seguem-se os seguintes passos:
- Para cada instância, compare as etiquetas previstas com as etiquetas verdadeiras.
- Conte o número de etiquetas que foram incorretamente previstas.
- Some esses contagens em todas as instâncias.
- Divida o número total de previsões incorretas pelo número total de etiquetas em todas as instâncias.
The resulting value will range from 0 to 1, where 0 indicates perfect predictions (no incorrect labels) and 1 indicates that all predictions are incorrect. It is particularly useful in scenarios where multiple labels can apply to a single instance, such as image marcação ou categorização de textos.
Hamming Loss é vantajoso porque fornece uma compreensão intuitiva de desempenho do modelo in multi-label settings, allowing for direct comparisons between models. However, it may not account for the varying importance of different labels, which could be a consideration in some applications.