AI Glossary: What Is Model Inversion (MI)? Definition & Meaning

Inversion de modèle is a en apprentissage automatique and confidentialité des données that allows an adversary to infer sensitive information about the données d'entraînement used to build a model. This is achieved by exploiting the outputs of a model to reconstruct features of the original dataset, often targeting personal or confidential information.

Dans le contexte de l'IA, les attaques par inversion de modèle peuvent se produire lorsqu'un modèle d'apprentissage automatique est accessible aux utilisateurs. Par exemple, si un modèle est entraîné sur des images de visages, un adversaire pourrait interroger le modèle avec diverses entrées et analyser les sorties pour reconstituer des informations sur les images originales, voire les reconstruire ou révéler des attributs sensibles.

Le processus consiste généralement à générer un ensemble de requêtes et à recevoir des sorties indiquant la probabilité que certaines caractéristiques soient présentes. En affinant systématiquement ces requêtes en fonction des réponses, l'attaquant peut construire progressivement une représentation des données sur lesquelles le modèle a été entraîné.

This poses significant privacy risks, particularly in applications involving personal data, such as healthcare or finance. To mitigate such risks, researchers and practitioners are developing techniques like confidentialité différentielle, which aims to provide guarantees that the inclusion or exclusion of a single data point does not significantly affect the output of the model.

Understanding model inversion is crucial for developing robust AI systems that respect user privacy and comply with legal standards, especially as concerns about sécurité des données continuer à croître à l'ère numérique.