Perte logarithmique, also known as logistic loss or perte d'entropie croisée, is a performance metric used primarily in classification binaire problems where the predicted output is a probability value ranging between 0 and 1. It quantifies the difference between the predicted probabilities and the actual class labels (0 or 1). The objective of using log loss is to evaluate how well a classification model predicts probabilities for binary outcomes, with lower values indicating better performance du modèle.
Mathématiquement, la perte logarithmique est calculée à l'aide de la formule suivante :
Log Loss = -1/N * Σ [y * log(p) + (1 – y) * log(1 – p)]
Où :
- N est le nombre total de prédictions.
- y est l'étiquette réelle (0 ou 1).
- p est la probabilité prédite de la classe positive (1).
The Log Loss value ranges from 0 to infinity, where 0 indicates perfect predictions (model outputs probabilities of either 0 or 1 correctly) and larger values indicate worse performance. A model that predicts probabilities close to the true labels will have a lower log loss, while a model that predicts probabilities far à partir des vraies étiquettes entraînera une perte logarithmique plus élevée.
Log Loss is particularly useful in scenarios where the output is not just a hard classification but a probability, making it suitable for applications such as régression logistique, neural networks, and other probabilistic classifiers. It is also widely utilisé en apprentissage automatique compétitions, telles que celles organisées par Kaggle, pour évaluer la performance des modèles.