Aprendizado Semi-Supervisionado em Grafos (SSGL) é uma de aprendizado de máquina that utilizes both labeled and unlabeled data to enhance the learning process on graph-based structures. In many real-world applications, acquiring dados rotulados can be expensive and time-consuming, while unlabeled data is often abundant. SSGL leverages the relationships and connections between data points in a graph to improve classification ou tarefas de previsão.
No SSGL, um grafo é construído onde os nós representam pontos de dados, e as arestas representam relacionamentos ou similaridades entre esses pontos. Nós rotulados contêm saídas ou categorias conhecidas, enquanto nós não rotulados não. O objetivo do SSGL é propagar os rótulos dos nós rotulados para os não rotulados, explorando a estrutura do grafo.
Existem vários métodos para implementar o SSGL, incluindo:
- Redes Neurais Convolucionais de Grafos (GCNs): These aprendizado profundo models apply convolutional operations on graph data, enabling the learning of node representations that incorporate information from neighboring nodes.
- Propagação de Rótulos: This algorithm spreads labels from known to unknown nodes based on the graph’s connectivity, where nodes with similar features are more likely to share labels.
- Baseado em Grafos Regularização: This technique encourages the model to maintain consistency between the predictions on connected nodes, reducing the risk of overfitting.
SSGL é particularmente útil em vários domínios, como análise de redes sociais, sistemas de recomendação, and biological network inference, where the underlying data can be represented as graphs. By effectively utilizing both labeled and unlabeled data, SSGL can achieve higher accuracy than traditional supervised learning models that rely solely on labeled data.