Publicação
Cross-Silo federated learning: an empirical study on learning gains
| Resumo: | Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização. |
|---|---|
| Autores principais: | Silva, Duarte Miguel Ferreira Moreira da |
| Assunto: | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| Ano: | 2026 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | inglês |
| Origem: | RepositóriUM - Universidade do Minho |
| _version_ | 1866878336794361856 |
|---|---|
| author | Silva, Duarte Miguel Ferreira Moreira da |
| author_facet | Silva, Duarte Miguel Ferreira Moreira da |
| author_role | author |
| contributor_name_str_mv | Patrício, Pedro Boutet, Antoine Universidade do Minho |
| country_str | PT |
| creators_json_txt | [{\"Person.name\":\"Silva, Duarte Miguel Ferreira Moreira da\"}] |
| datacite.contributors.contributor.contributorName.fl_str_mv | Patrício, Pedro Boutet, Antoine Universidade do Minho |
| datacite.creators.creator.creatorName.fl_str_mv | Silva, Duarte Miguel Ferreira Moreira da |
| datacite.date.Accepted.fl_str_mv | 2026-04-01T00:00:00Z |
| datacite.rights.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| datacite.subjects.subject.fl_str_mv | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| datacite.titles.title.fl_str_mv | Cross-Silo federated learning: an empirical study on learning gains |
| dc.contributor.none.fl_str_mv | Patrício, Pedro Boutet, Antoine Universidade do Minho |
| dc.creator.none.fl_str_mv | Silva, Duarte Miguel Ferreira Moreira da |
| dc.date.Accepted.fl_str_mv | 2026-04-01T00:00:00Z |
| dc.description.none.fl_str_mv | Federated Learning (FL) is an essential approach for the collaborative training of Machine Learning (ML) models on distributed and sensitive data, being crucial for privacy protection in cross-silo scenarios. However, its adoption is widely limited by the uncertainty surrounding the learning gain, i.e., whether the global model offers better performance and generalization than a model exclusively trained locally. This uncertainty represents an incentive factor often overlooked in literature focused on security and heterogeneity challenges. To improve participant performance and motivation, this work proposes a novel two-stage learning scheme: FedFil (Filtered Federated Learning). FedFil operates through: 1) local data filtering, which employs Anomaly Detection to remove influential datapoints before FL training; and 2) post-FL Fine-Tuning, to personalize the global model to the specific characteristics of the client. This project, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, conducts a thorough empirical investigation to quantify the learning gain achieved with FedFil, identify which clients benefit most from collaboration, and evaluate whether local adaptation improves global accuracy gain. Our results indicate that FedFil, by filtering influential local datapoints before the learning rounds and personalizing the global model afterwards, achieves an average learning gain of around 8% on local evaluations and 6% on generalization evaluations. |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | https://hdl.handle.net/1822/101192 |
| dc.language.none.fl_str_mv | eng |
| dc.rights.cclincense.fl_str_mv | http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.rights.none.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| dc.rights.rights.copyright.fl_str_mv | openAccess |
| dc.subject.none.fl_str_mv | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| dc.title.fl_str_mv | Cross-Silo federated learning: an empirical study on learning gains |
| dc.type.none.fl_str_mv | http://purl.org/coar/resource_type/c_bdcc |
| description | Federated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização. |
| dirty | 0 |
| eu_rights_str_mv | openAccess |
| format | masterThesis |
| fulltext.url.fl_str_mv | https://repositorium.uminho.pt/bitstreams/5e8152a9-c5f4-43c5-b96e-66a940932967/download |
| id | rum_0bef9140efd0d91dcd67fd88cd073f6c |
| identifier.url.fl_str_mv | https://hdl.handle.net/1822/101192 |
| instacron_str | repositorium |
| institution | Universidade do Minho |
| instname_str | Universidade do Minho |
| language | eng |
| network_acronym_str | rum |
| network_name_str | RepositóriUM - Universidade do Minho |
| oai_identifier_str | oai:repositorium.uminho.pt:1822/101192 |
| organization_str_mv | urn:organizationAcronym:repositorium |
| person_str_mv | Silva, Duarte Miguel Ferreira Moreira da |
| publishDate | 2026 |
| reponame_str | RepositóriUM - Universidade do Minho |
| repository_id_str | urn:repositoryAcronym:rum |
| service_str_mv | urn:repositoryAcronym:rum |
| spelling | engporFederated Learning (FL) é uma abordagem essencial para o treino colaborativo de modelos de Machine Learning (ML) em dados distribuídos e sensíveis, sendo crucial para a proteção da privacidade em cenários de cross-silo. No entanto, a sua adoção é amplamente limitada pela incerteza quanto ao ganho de aprendizagem (learning gain), ou seja, se o modelo global oferece melhor precisão e generalização do que um modelo exclusivamente treinado localmente, o que é um fator de incentivo frequentemente negligenciado na literatura que se foca em desafios de segurança e heterogeneidade. Para maximizar o desempenho e a motivação dos participantes, este trabalho propõe um novo esquema de aprendizagem em duas fases: FedFil (Filtered Federated Learning). O FedFil opera através de: 1) filtragem local de dados, que emprega Deteção de Anomalias para remover dados influentes antes do treino em FL; e 2) Fine-Tuning pós-FL, para personalizar o modelo global às características específicas do cliente. Este projeto, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, realiza uma investigação empírica aprofundada para quantificar o ganho de aprendizagem alcançado com o FedFil, identificar quais os clientes que mais beneficiam da colaboração e avaliar se a adaptação local melhora o ganho de precisão global. Os nossos resultados indicam que o FedFil, ao filtrar localmente os pontos influentes antes dos ciclos de treino federado e ao personalizar o modelo global posteriormente, alcança um learning gain médio de cerca de 8% nas avaliações locais dos clientes e de 6% nas avaliações de generalização.engFederated Learning (FL) is an essential approach for the collaborative training of Machine Learning (ML) models on distributed and sensitive data, being crucial for privacy protection in cross-silo scenarios. However, its adoption is widely limited by the uncertainty surrounding the learning gain, i.e., whether the global model offers better performance and generalization than a model exclusively trained locally. This uncertainty represents an incentive factor often overlooked in literature focused on security and heterogeneity challenges. To improve participant performance and motivation, this work proposes a novel two-stage learning scheme: FedFil (Filtered Federated Learning). FedFil operates through: 1) local data filtering, which employs Anomaly Detection to remove influential datapoints before FL training; and 2) post-FL Fine-Tuning, to personalize the global model to the specific characteristics of the client. This project, ”Cross-Silo Federated Learning: An Empirical Study on Learning Gains”, conducts a thorough empirical investigation to quantify the learning gain achieved with FedFil, identify which clients benefit most from collaboration, and evaluate whether local adaptation improves global accuracy gain. Our results indicate that FedFil, by filtering influential local datapoints before the learning rounds and personalizing the global model afterwards, achieves an average learning gain of around 8% on local evaluations and 6% on generalization evaluations.application/pdfengCross-Silo federated learning: an empirical study on learning gainsSilva, Duarte Miguel Ferreira Moreira daPatrício, PedroBoutet, AntoineHostingInstitutionOrganizationalUniversidade do Minhoe-mailmailto:repositorium@usdb.uminho.ptrepositorium@usdb.uminho.ptURNurn:tid:2042909102026-04-012026-032026-04-01T00:00:00ZHandlehttps://hdl.handle.net/1822/101192http://purl.org/coar/access_right/c_abf2open accessCross-silo Federated LearningFiltragem de dadosDeteção de AnomaliasData FilteringAnomaly Detection7787756 bytesliteraturehttp://purl.org/coar/resource_type/c_bdccmaster thesis2026-04-01http://creativecommons.org/licenses/by-nc-nd/4.0/openAccesshttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://repositorium.uminho.pt/bitstreams/5e8152a9-c5f4-43c5-b96e-66a940932967/download |
| spellingShingle | Cross-Silo federated learning: an empirical study on learning gains Silva, Duarte Miguel Ferreira Moreira da Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| status | SINGLETON |
| subject.fl_str_mv | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| title | Cross-Silo federated learning: an empirical study on learning gains |
| title_full | Cross-Silo federated learning: an empirical study on learning gains |
| title_fullStr | Cross-Silo federated learning: an empirical study on learning gains |
| title_full_unstemmed | Cross-Silo federated learning: an empirical study on learning gains |
| title_short | Cross-Silo federated learning: an empirical study on learning gains |
| title_sort | Cross-Silo federated learning: an empirical study on learning gains |
| topic | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| topic_facet | Cross-silo Federated Learning Filtragem de dados Deteção de Anomalias Data Filtering Anomaly Detection |
| url | https://hdl.handle.net/1822/101192 |
| visible | 1 |