Publicação

Cross-Silo federated learning: an empirical study on learning gains

Ver documento

Detalhes bibliográficos
Resumo:Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.
Autores principais:Silva, Duarte Miguel Ferreira Moreira da
Assunto:Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection
Ano:2026
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade do Minho
Idioma:inglês
Origem:RepositóriUM - Universidade do Minho
_version_ 1866878336794361856
author Silva, Duarte Miguel Ferreira Moreira da
author_facet Silva, Duarte Miguel Ferreira Moreira da
author_role author
contributor_name_str_mv Patrício, Pedro
Boutet, Antoine
Universidade do Minho
country_str PT
creators_json_txt [{\"Person.name\":\"Silva, Duarte Miguel Ferreira Moreira da\"}]
datacite.contributors.contributor.contributorName.fl_str_mv Patrício, Pedro
Boutet, Antoine
Universidade do Minho
datacite.creators.creator.creatorName.fl_str_mv Silva, Duarte Miguel Ferreira Moreira da
datacite.date.Accepted.fl_str_mv 2026-04-01T00:00:00Z
datacite.rights.fl_str_mv http://purl.org/coar/access_right/c_abf2
datacite.subjects.subject.fl_str_mv Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
datacite.titles.title.fl_str_mv Cross-Silo federated learning: an empirical study on learning gains
dc.contributor.none.fl_str_mv Patrício, Pedro
Boutet, Antoine
Universidade do Minho
dc.creator.none.fl_str_mv Silva, Duarte Miguel Ferreira Moreira da
dc.date.Accepted.fl_str_mv 2026-04-01T00:00:00Z
dc.description.none.fl_str_mv Federated Learning (FL) is an essential approach for the collaborative training of Machine Learning (ML) models on distributed and sensitive data, being crucial for privacy protection in cross-silo scenarios. However, its adoption is widely limited by the uncertainty surrounding the learning gain, i.e., whether the global model offers better performance and generalization than a model exclusively trained locally. This uncertainty represents an incentive factor often overlooked in literature focused on security and heterogeneity challenges. To improve participant performance and motivation, this work proposes a novel two-stage learning scheme: FedFil (Filtered Federated Learning). FedFil operates through: 1) local data filtering, which employs Anomaly Detection to remove influential datapoints before FL training; and 2) post-FL Fine-Tuning, to personalize the global model to the specific characteristics of the client. This project, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, conducts a thorough empirical investigation to quantify the learning gain achieved with FedFil, identify which clients benefit most from collaboration, and evaluate whether local adaptation improves global accuracy gain. Our results indicate that FedFil, by filtering influential local datapoints before the learning rounds and personalizing the global model afterwards, achieves an average learning gain of around 8% on local evaluations and 6% on generalization evaluations.
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv https://hdl.handle.net/1822/101192
dc.language.none.fl_str_mv eng
dc.rights.cclincense.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.rights.copyright.fl_str_mv openAccess
dc.subject.none.fl_str_mv Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
dc.title.fl_str_mv Cross-Silo federated learning: an empirical study on learning gains
dc.type.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
description Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.
dirty 0
eu_rights_str_mv openAccess
format masterThesis
fulltext.url.fl_str_mv https://repositorium.uminho.pt/bitstreams/5e8152a9-c5f4-43c5-b96e-66a940932967/download
id rum_0bef9140efd0d91dcd67fd88cd073f6c
identifier.url.fl_str_mv https://hdl.handle.net/1822/101192
instacron_str repositorium
institution Universidade do Minho
instname_str Universidade do Minho
language eng
network_acronym_str rum
network_name_str RepositóriUM - Universidade do Minho
oai_identifier_str oai:repositorium.uminho.pt:1822/101192
organization_str_mv urn:organizationAcronym:repositorium
person_str_mv Silva, Duarte Miguel Ferreira Moreira da
publishDate 2026
reponame_str RepositóriUM - Universidade do Minho
repository_id_str urn:repositoryAcronym:rum
service_str_mv urn:repositoryAcronym:rum
spelling engporFederated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.engFederated Learning (FL) is an essential approach for the collaborative training of Machine Learning (ML) models on distributed and sensitive data, being crucial for privacy protection in cross-silo scenarios. However, its adoption is widely limited by the uncertainty surrounding the learning gain, i.e., whether the global model offers better performance and generalization than a model exclusively trained locally. This uncertainty represents an incentive factor often overlooked in literature focused on security and heterogeneity challenges. To improve participant performance and motivation, this work proposes a novel two-stage learning scheme: FedFil (Filtered Federated Learning). FedFil operates through: 1) local data filtering, which employs Anomaly Detection to remove influential datapoints before FL training; and 2) post-FL Fine-Tuning, to personalize the global model to the specific characteristics of the client. This project, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, conducts a thorough empirical investigation to quantify the learning gain achieved with FedFil, identify which clients benefit most from collaboration, and evaluate whether local adaptation improves global accuracy gain. Our results indicate that FedFil, by filtering influential local datapoints before the learning rounds and personalizing the global model afterwards, achieves an average learning gain of around 8% on local evaluations and 6% on generalization evaluations.application/pdfengCross-Silo federated learning: an empirical study on learning gainsSilva, Duarte Miguel Ferreira Moreira daPatrício, PedroBoutet, AntoineHostingInstitutionOrganizationalUniversidade do Minhoe-mailmailto:repositorium@usdb.uminho.ptrepositorium@usdb.uminho.ptURNurn:tid:2042909102026-04-012026-032026-04-01T00:00:00ZHandlehttps://hdl.handle.net/1822/101192http://purl.org/coar/access_right/c_abf2open accessCross-silo Federated LearningFiltragem de dadosDeteção de AnomaliasData FilteringAnomaly Detection7787756 bytesliteraturehttp://purl.org/coar/resource_type/c_bdccmaster thesis2026-04-01http://creativecommons.org/licenses/by-nc-nd/4.0/openAccesshttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://repositorium.uminho.pt/bitstreams/5e8152a9-c5f4-43c5-b96e-66a940932967/download
spellingShingle Cross-Silo federated learning: an empirical study on learning gains
Silva, Duarte Miguel Ferreira Moreira da
Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
status SINGLETON
subject.fl_str_mv Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
title Cross-Silo federated learning: an empirical study on learning gains
title_full Cross-Silo federated learning: an empirical study on learning gains
title_fullStr Cross-Silo federated learning: an empirical study on learning gains
title_full_unstemmed Cross-Silo federated learning: an empirical study on learning gains
title_short Cross-Silo federated learning: an empirical study on learning gains
title_sort Cross-Silo federated learning: an empirical study on learning gains
topic Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
topic_facet Cross-silo Federated Learning
Filtragem de dados
Deteção de Anomalias
Data Filtering
Anomaly Detection
url https://hdl.handle.net/1822/101192
visible 1