AI Glossary: What Is Multi-Label Classification (MLC)? Definition & Meaning

Clasificación Multietiqueta

Multi-etiqueta classification is a type of aprendizaje automático task where each instance (or data point) can be associated with multiple labels or categories at the same time. This is different from traditional single-label classification, where each instance is assigned only one label from a predefined set.

In multi-label classification, the goal is to predict a set of labels for each input based on its features. For example, consider an clasificación de imágenes task where an image can contain multiple objects, such as a dog and a cat. In this case, the model would need to identify both labels as present in the image.

Los problemas de clasificación multietiqueta se pueden encontrar en varias aplicaciones, como:

Categorización de textos, donde un documento puede pertenecer a múltiples temas.
Etiquetado de imágenes, donde una imagen puede ser etiquetada con varias palabras clave.
Médico diagnóstico, donde un paciente puede tener múltiples condiciones concurrentes.

Para manejar eficazmente la clasificación multietiqueta, se pueden emplear diferentes algorithms y técnicas. Algunas aproximaciones populares incluyen:

Relevancia Binaria: Treating each label as a separate clasificación binaria separado.
Cadenas de Clasificadores: Building a chain of binary classifiers, where each classifier considers its predecessors’ predictions.
Conjunto de Etiquetas (Label Powerset): Treating each unique set of labels as a single label in a clasificación multiclase separado.

Métricas de evaluación for multi-label classification are also different from single-label tasks. Common metrics include Hamming Loss, F1 Score, and Jaccard Index, which help assess the model’s performance based on label predictions.