AI Glossary: What Is Multi-Label Classification (MLC)? Definition & Meaning

Classificação Multi-Rótulo

Multi-rótulo classification is a type of aprendizado de máquina task where each instance (or data point) can be associated with multiple labels or categories at the same time. This is different from traditional single-label classification, where each instance is assigned only one label from a predefined set.

In multi-label classification, the goal is to predict a set of labels for each input based on its features. For example, consider an classificação de imagens task where an image can contain multiple objects, such as a dog and a cat. In this case, the model would need to identify both labels as present in the image.

Problemas de classificação multi-label podem ser encontrados em várias aplicações, como:

Categorização de textos, onde um documento pode pertencer a múltiplos tópicos.
Marcação de imagens, onde uma imagem pode ser marcada com várias palavras-chave.
Médico diagnóstico, onde um paciente pode ter múltiplas condições simultâneas.

Para lidar efetivamente com a classificação multi-rótulo, diferentes algorithms e técnicas podem ser empregadas. Algumas abordagens populares incluem:

Relevância Binária: Treating each label as a separate classificação binária problema.
Cadeias de Classificadores: Building a chain of binary classifiers, where each classifier considers its predecessors’ predictions.
Conjunto de Rótulos (Label Powerset): Treating each unique set of labels as a single label in a tarefas de classificação multiclasse problema.

Métricas de avaliação for multi-label classification are also different from single-label tasks. Common metrics include Hamming Loss, F1 Score, and Jaccard Index, which help assess the model’s performance based on label predictions.