O que é Aprendizado Dividido?
Split Learning é uma em aprendizado de máquina that allows multiple parties to collaborate on training a model without sharing their raw data. This method is particularly useful in scenarios where privacidade de dados is a concern, such as in healthcare ou finanças.
In traditional machine learning, a single entity collects and processes all the data to train a model. However, Split Learning changes this paradigm by splitting the arquitetura do modelo and the training process into two distinct parts. One party (often referred to as the client) mantém as camadas iniciais do modelo, enquanto a outra parte (a server) contém as camadas restantes.
During the training process, the client processes its local data through its portion of the model, generating intermediate outputs. These outputs are then sent to the server, which completes the forward pass with its layers and computes the loss function. The server can then send the gradients back to the client for updating its part of the model. This processo iterativo continua até que o modelo atinja um nível aceitável de desempenho.
Ao empregar o Aprendizado Dividido, as organizações podem manter uma privacidade rigorosa dos dados, já que os dados brutos nunca deixam o lado do cliente. Em vez disso, apenas os gradientes e atualizações do modelo são trocados, o que reduz significativamente o risco de expor informações sensíveis.
This approach not only enhances privacy but also allows for more efficient use of recursos computacionais, as it enables the sharing of model training across different devices or locations. Overall, Split Learning is an innovative solution that addresses the challenges of privacy and data security in collaborative machine learning.