Publicação

Cross-Silo federated learning: an empirical study on learning gains

Detalhes bibliográficos
Resumo:	Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.
Autores principais:	Silva, Duarte Miguel Ferreira Moreira da
Assunto:	Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection
Ano:	2026
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade do Minho
Idioma:	inglês
Origem:	RepositóriUM - Universidade do Minho

Descrição
Resumo:	Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.