L'apprentissage semi-supervisé sur graphe (SSGL) est une d'apprentissage automatique that utilizes both labeled and unlabeled data to enhance the learning process on graph-based structures. In many real-world applications, acquiring données étiquetées can be expensive and time-consuming, while unlabeled data is often abundant. SSGL leverages the relationships and connections between data points in a graph to improve classification ou des tâches de prédiction.
Dans SSGL, un graphe est construit où les nœuds représentent des points de données, et les arêtes représentent des relations ou similarités entre ces points. Les nœuds étiquetés contiennent des sorties ou catégories connues, tandis que les nœuds non étiquetés ne le sont pas. L'objectif de SSGL est de propager les étiquettes des nœuds étiquetés vers ceux non étiquetés en exploitant la structure du graphe.
Il existe différentes méthodes pour mettre en œuvre le SSGL, notamment :
- Réseaux de Convolution Graphiques (GCNs) : These apprentissage profond models apply convolutional operations on graph data, enabling the learning of node representations that incorporate information from neighboring nodes.
- Propagation de l'étiquette: This algorithm spreads labels from known to unknown nodes based on the graph’s connectivity, where nodes with similar features are more likely to share labels.
- Basé sur un graphe Régularisation: This technique encourages the model to maintain consistency between the predictions on connected nodes, reducing the risk of overfitting.
Le SSGL est particulièrement utile dans divers domaines, tels que l'analyse des réseaux sociaux, systèmes de recommandation, and biological network inference, where the underlying data can be represented as graphs. By effectively utilizing both labeled and unlabeled data, SSGL can achieve higher accuracy than traditional supervised learning models that rely solely on labeled data.