AI Glossary: What Is Multi-Label Classification (MLC)? Definition & Meaning

Classification multi-étiquette

Multi-étiquette classification is a type of apprentissage automatique task where each instance (or data point) can be associated with multiple labels or categories at the same time. This is different from traditional single-label classification, where each instance is assigned only one label from a predefined set.

In multi-label classification, the goal is to predict a set of labels for each input based on its features. For example, consider an classification d'image task where an image can contain multiple objects, such as a dog and a cat. In this case, the model would need to identify both labels as present in the image.

Les problèmes de classification multi-étiquette peuvent être rencontrés dans diverses applications, telles que :

La catégorisation de textes, où un document peut appartenir à plusieurs sujets.
Le balisage d'images, où une image peut être taguée avec plusieurs mots-clés.
Médical diagnostic, où un patient peut avoir plusieurs conditions concomitantes.

Pour gérer efficacement la classification multi-étiquette, différentes algorithms et techniques peuvent être employées. Certaines approches populaires incluent :

Relevance binaire : Treating each label as a separate classification binaire problème séparé.
Chaînes de classificateurs : Building a chain of binary classifiers, where each classifier considers its predecessors’ predictions.
Ensemble de labels (Label Powerset) : Treating each unique set of labels as a single label in a classification multi-classes problème séparé.

métriques d’évaluation for multi-label classification are also different from single-label tasks. Common metrics include Hamming Loss, F1 Score, and Jaccard Index, which help assess the model’s performance based on label predictions.