Publicação
Qualidade dos dados & Machine Learning : uma nova abordagem aos censos populacionais e habitacionais
| Resumo: | O projeto realizado consiste no processo de recolha e preparação de dados manuscritos em papel, da aplicação do inquérito Censo Populacional e Habitacional a uma população de mais de vinte milhões de pessoas. Este é um tipo de inquérito que se faz à população de um país, tendo como objetivo retirar conclusões a nível geográfico tanto da população, como das suas condições de vida. Os Censos são realizados com alguma frequência, o que permite efetuar comparações e perceber a transformação da sociedade e de um país, ao longo dos anos. Com o objetivo de tornar os mais de vinte milhões de inquéritos manuscritos em informação útil e de qualidade acerca de um país e de uma população foi necessário dividir o trabalho em três fases, a fase recolha de dados e da sua conversão de imagem para um formato digital onde o texto possa ser editável, a fase de limpeza e tratamento dos dados e, por último, a fase de análise e classificação dos mesmos. De acordo com cada fase, foram utilizadas diversas metodologias e tecnologias, como é o caso do OCR (Optical Character Recognition), NLP (Natural Language Processing) e Machine Learning, respetivamente. Estas abordagens permitiram uma melhor, mais rápida e mais fiável análise de resultados. |
|---|---|
| Autores principais: | Lopes, Inês Margarida Silva Paz |
| Assunto: | Processamento de Linguagem Natural Censos Distância de Levenshtein Machine Learning Modelo de Naïve Bayes Qualidade dos Dados Reconhecimento Ótico de Caracteres Census Data Quality Levenshtein Distance Natural Language Processing Optical Character Recognition Naïve Bayes Model |
| Ano: | 2019 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | português |
| Origem: | Repositório da Universidade de Lisboa |
Registos relacionados
school Modeling CNS receptor binding profiles of small molecules
por: Ferreira, Vânia Alexandra Conceição
Publicado em: (2015)
por: Ferreira, Vânia Alexandra Conceição
Publicado em: (2015)
article Retrato da juventude em Portugal: traços e tendências nos censos de 2001 e 2011
por: Vieira, Maria Manuel
Publicado em: (2015)
por: Vieira, Maria Manuel
Publicado em: (2015)
school Advanced Blacklisting: Aperfeiçoamento de Algoritmos para Deteção de Correspondências em Listas de Pessoas Politicamente Expostas (PEP)
por: Ferreira, Bárbara Filipa Felizardo
Publicado em: (2025)
por: Ferreira, Bárbara Filipa Felizardo
Publicado em: (2025)
school Padrões agroecológicos históricos em Portugal Continental: uma abordagem com Inteligência Artificial e SIG
por: Carvalho, Diogo Filipe Ferreira de
Publicado em: (2024)
por: Carvalho, Diogo Filipe Ferreira de
Publicado em: (2024)
article iNKT cells: innate lymphocytes with a diverse response
por: Monteiro, Marta
Publicado em: (2014)
por: Monteiro, Marta
Publicado em: (2014)
school The efficiency in Markowitz, minimum-variance and naïve portfolios applied to smi
por: Fernandes, Cristiano Mateus Cunha
Publicado em: (2015)
por: Fernandes, Cristiano Mateus Cunha
Publicado em: (2015)
school A eficiência nas Carteira Markowitz, Variância Mínima e Naïve aplicada ao índice AEX - 25
por: Nunes, David João de Arede
Publicado em: (2013)
por: Nunes, David João de Arede
Publicado em: (2013)
article Soils and landforms at Hope Bay, Antarctic Peninsula: formation, classification, distribution, and relationships
por: Reynaud Schaefer, Carlos Ernesto G.
Publicado em: (2015)
por: Reynaud Schaefer, Carlos Ernesto G.
Publicado em: (2015)
book Famílias nos censos 2011: diversidade e mudança
por: Delgado, Anabela
Publicado em: (2014)
por: Delgado, Anabela
Publicado em: (2014)
article IL-7-induced proliferation of human naive CD4 T-cells relies on continued thymic activity
por: Silva, Susana L.
Publicado em: (2017)
por: Silva, Susana L.
Publicado em: (2017)
article Anchoring in a Social Context: How the Possibility of Being Misinformed by Others Impacts One's Judgment
por: Reis, Joana
Publicado em: (2023)
por: Reis, Joana
Publicado em: (2023)
article Reprint of: Chlorophyll enhancement in the central region of the Bay of Biscay as a result of internal tidal wave interaction
por: Muacho, S.
Publicado em: (2015)
por: Muacho, S.
Publicado em: (2015)
article SARS‐CoV‐2 clearance after breakthrough infection correlates with fit and happy T cells
por: Veldhoen, Marc
Publicado em: (2023)
por: Veldhoen, Marc
Publicado em: (2023)
school Flexible plan execution using temporal planning and probabilistic models
por: Ribeiro, Tomás Rei dos Santos
Publicado em: (2020)
por: Ribeiro, Tomás Rei dos Santos
Publicado em: (2020)
book Teorema de Bayes, Quantificação da Confirmação de uma Hipótese pela Evidência e Actualização de Crenças
por: Zilhão, António
Publicado em: (2007)
por: Zilhão, António
Publicado em: (2007)
article Conservation Genetic Assessment of Savannah Elephants (Loxodonta africana) in the Greater Kruger Biosphere, South Africa
por: Santos, Teresa L
Publicado em: (2019)
por: Santos, Teresa L
Publicado em: (2019)
article Measuring evidence for mediation in the presence of measurement error
por: Laghaie, Arash
Publicado em: (2023)
por: Laghaie, Arash
Publicado em: (2023)
article Shoreline change rates and land to sea sediment and soil organic carbon transfer in eastern Parry Peninsula from 1965 to 2020 (Amundsen Gulf, Canada)
por: Tanguy, Rodrigue
Publicado em: (2023)
por: Tanguy, Rodrigue
Publicado em: (2023)
article CD4+ recent thymic emigrants are infected by HIV in vivo, implication for pathogenesis
por: Fabre-Mersseman, Véronique
Publicado em: (2011)
por: Fabre-Mersseman, Véronique
Publicado em: (2011)
article Human naïve regulatory T-cells feature high steady-state turnover and are maintained by IL-7
por: Silva, Susana L.
Publicado em: (2016)
por: Silva, Susana L.
Publicado em: (2016)
school Robotic manipulation of objects through physical simulation
por: Alves, Juliana Bispo Proença Nunes
Publicado em: (2025)
por: Alves, Juliana Bispo Proença Nunes
Publicado em: (2025)
article The World's Most Isolated and Distinct Whale Population? Humpback Whales of the Arabian Sea
por: Pomilla, Cristina
Publicado em: (2014)
por: Pomilla, Cristina
Publicado em: (2014)
article Good news and bad news are still news
por: Coutts, Alexander
Publicado em: (2019)
por: Coutts, Alexander
Publicado em: (2019)
draft O censo das famílias, pessoas, habitações e actividades económicas : projecto de construção de um Observatório de Bem-estar do Bairro de Quelele
por: Sangreman, Carlos
Publicado em: (2011)
por: Sangreman, Carlos
Publicado em: (2011)
school Recognizing Emotions in Short Texts
por: Vieira, Iolanda Mafalda Dias Pastor
Publicado em: (2022)
por: Vieira, Iolanda Mafalda Dias Pastor
Publicado em: (2022)
article Naive and stem cell memory T cell subset recovery reveals opposing reconstitution patterns in CD4 and CD8 T cells in chronic graft vs. host disease
por: Soares, Maria Vieira
Publicado em: (2019)
por: Soares, Maria Vieira
Publicado em: (2019)
school Evolução genética da raça bovina charolesa em Portugal nos últimos 23 anos
por: Franco, Filipa Susana Martins
Publicado em: (2021)
por: Franco, Filipa Susana Martins
Publicado em: (2021)
article Human–climate interaction during the Early Upper Paleolithic: testing the hypothesis of an adaptive shift between the Proto-Aurignacian and the Early Aurignacian
por: Banks, William E.
Publicado em: (2013)
por: Banks, William E.
Publicado em: (2013)
school Status of mangrove ecosystem conservation in Mozambique: contribution to minimising the effects of climate change
por: Cuamba, Ezídio da Lúcia
Publicado em: (2024)
por: Cuamba, Ezídio da Lúcia
Publicado em: (2024)
school Investigating CD31 and Wnt driven signals in naïve CD4 T cell homeostasis
por: Silva, Patrícia Nicole Guilherme
Publicado em: (2024)
por: Silva, Patrícia Nicole Guilherme
Publicado em: (2024)
school Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
por: Viegas, Catarina Correia
Publicado em: (2020)
por: Viegas, Catarina Correia
Publicado em: (2020)
school 1-year performance of optimal portfolios: a comparison against an Index Tracker ETF
por: Vieira, Carlos José Martins
Publicado em: (2021)
por: Vieira, Carlos José Martins
Publicado em: (2021)
school Turismo de e para sustento
por: Fonseca, Inês Valério
Publicado em: (2018)
por: Fonseca, Inês Valério
Publicado em: (2018)
school Estudo das necessidades investimento em saneamento básico na Província de Kuanza Sul - Angola
por: Tainha, Cátia Sofia Pedrosa
Publicado em: (2012)
por: Tainha, Cátia Sofia Pedrosa
Publicado em: (2012)
school Investimentos portugueses no Brasil: o caso das pequenas e médias empresas
por: Nunes, Filipa Moreira
Publicado em: (2012)
por: Nunes, Filipa Moreira
Publicado em: (2012)
school Unsupervised neural machine translation between the Portuguese language and the Chinese and Korean languages
por: Ferreira, Catarina Francisca Nunes da Cruz
Publicado em: (2023)
por: Ferreira, Catarina Francisca Nunes da Cruz
Publicado em: (2023)
school Portuguese-Chinese neural machine translation
por: Santos, Rodrigo Soares dos
Publicado em: (2019)
por: Santos, Rodrigo Soares dos
Publicado em: (2019)
school Verbal lemmatization and featurization of Portuguese with ambiguity resolution in context
por: Nunes, Filipe Varela
Publicado em: (2007)
por: Nunes, Filipe Varela
Publicado em: (2007)
school Detecting Web Vulnerabilities in an Intermediate Language by Resorting to Machine Learning Techniques
por: Fidalgo, Ana Maria Dias
Publicado em: (2020)
por: Fidalgo, Ana Maria Dias
Publicado em: (2020)
school The Base-Rate fallacy in Artificial Intelligence systems
por: Costa, Sofia Margarida Nogueira Santiago e
Publicado em: (2024)
por: Costa, Sofia Margarida Nogueira Santiago e
Publicado em: (2024)
Registos relacionados
-
school Modeling CNS receptor binding profiles of small molecules
por: Ferreira, Vânia Alexandra Conceição
Publicado em: (2015) -
article Retrato da juventude em Portugal: traços e tendências nos censos de 2001 e 2011
por: Vieira, Maria Manuel
Publicado em: (2015) -
school Advanced Blacklisting: Aperfeiçoamento de Algoritmos para Deteção de Correspondências em Listas de Pessoas Politicamente Expostas (PEP)
por: Ferreira, Bárbara Filipa Felizardo
Publicado em: (2025) -
school Padrões agroecológicos históricos em Portugal Continental: uma abordagem com Inteligência Artificial e SIG
por: Carvalho, Diogo Filipe Ferreira de
Publicado em: (2024) -
article iNKT cells: innate lymphocytes with a diverse response
por: Monteiro, Marta
Publicado em: (2014)