January 1, 2022Open Access

Aprendizado federado para preservar a privacidade dos dados em pesquisas colaborativas de saúde

Key Points

Key points are not available for this paper at this time.

Abstract

Generalização, validade externa e reprodutibilidade são prioridades altas para aplicações de inteligência artificial na saúde. Abordagens tradicionais para abordar esses elementos envolvem o compartilhamento de dados de pacientes entre instituições ou configurações de prática, o que pode comprometer a privacidade dos dados (direito dos indivíduos de impedir o compartilhamento e a divulgação de informações sobre si mesmos) e a segurança dos dados (preservando simultaneamente a confidencialidade, precisão, fidelidade e disponibilidade dos dados). Este artigo descreve insights da implementação no mundo real de técnicas de aprendizado federado que oferecem oportunidades para manter tanto a privacidade quanto a disponibilidade dos dados por meio de aprendizado de máquina colaborativo que compartilha conhecimento, não dados. Modelos locais são treinados separadamente com dados locais. À medida que eles treinam, enviam atualizações dos modelos locais (por exemplo, coeficientes ou gradientes) para consolidação em um modelo global. Em alguns casos de uso, modelos globais superam modelos locais em novos conjuntos de dados locais previamente não vistos, sugerindo que o aprendizado colaborativo de um número maior de exemplos, incluindo um número maior de casos raros, pode melhorar o desempenho preditivo. Mesmo quando as atualizações dos modelos são compartilhadas em vez de dados, vazamentos de privacidade podem ocorrer quando adversários realizam ataques de inferência de propriedade ou de pertencimento que podem ser usados para obter informações sobre o conjunto de treinamento. Técnicas emergentes mitigam o risco de ataques adversariais, permitindo que investigadores mantenham tanto a privacidade quanto a disponibilidade dos dados nas pesquisas colaborativas de saúde. Quando a heterogeneidade dos dados entre os centros participantes é alta, algoritmos personalizados podem oferecer maior generalização, melhorando o desempenho em dados de centros com tamanhos de amostra de treinamento desproporcionalmente menores. Quando aplicados corretamente, os métodos de aprendizado federado têm o potencial de otimizar a reprodutibilidade e o desempenho do aprendizado colaborativo, enquanto preservam a segurança e a privacidade dos dados.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper