Publicação
Cross-Silo federated learning: an empirical study on learning gains
| Resumo: | Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização. |
|---|---|
| Autores principais: | Silva, Duarte Miguel Ferreira Moreira da |
| Assunto: | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| Ano: | 2026 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | inglês |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização. |
|---|