Publicação

Testing the cosmological principle with AI reconstruction methods

Detalhes bibliográficos
Resumo:	A ideia de que vivemos num Universo homogéneo e isotrópico é uma hipótese chamada de princípio cosmológico (CP) 1 . O CP está no centro da cosmologia moderna. Combinado com as equações de campo de Einstein conduz aos populares modelos homogéneos e isotrópicos de Friedmann-LemaitreRobertson-Walker (FLRW) que se tornaram no atual paradigma base para analisar e prever observações cosmológicas a grandes escalas. Apesar de alvo de várias críticas, o CP não é usualmente considerado uma causa das tensões cosmológicas que surgem no contexto dos modelos FLRW. No entanto faz todo o sentido, que este princípio mereça a nossa atenção pois podemos estar a basear quase toda a cosmologia numa hipótese que pode não ser válida a escalas cosmológicas. Para testar o CP podem-se considerar modelos não homogéneos. Em particular, nesta tese, nós vamos considerar os modelos cosmológicos de Lemaître–Tolman–Bondi (LTB). Os modelos LTB são modelos isotrópicos, simetricamente esféricos e não homogéneos. Estes modelos são usalmente estudados como uma alternativa à energia escura. Em geral, os modelos LTB ditam que nós vivemos dentro de uma zona com baixa densidade de matéria e isso é a causa da expansão acelerada que observamos hoje. É de notar que a expansão acelerada do Universo, segundo os modelos LTB, também poderia existir caso vivessemos numa zona de alta densidade de matéria, contudo as observações sugerem que os modelos LTB mais viáveis são os que preveem não homogeneidades de baixa densidade de matéria. Ainda que os modelos LTB sejam uma alternativa interessante aos modelos FLRW, alguns destes modelos não estão em total acordo com observações a grandes escalas, o que levou à criação dos modelos ΛLTB. Estes modelos são em tudo análogos aos modelos LTB, à excecção de considerarem um componente adicional no Universo, a energia escura. Porém, a qualidade dos dados cosmológicos atual não é suficiente para fazer distinções entre modelos FLRW e ΛLTB. Por outro lado, existe uma ampla variedade de modelos LTB que ainda não foram testados com dados observacionais. Em particular, nesta tese focamo-nos em dois tipos de modelos LTB, os modelos de Clifton-Ferreira-Land (CFL) e os modelos de Garcia-Bellido-Haugbølle (GBH), e num tipo de modelo FLRW, denominado ΛCDM, que é conhecido como o modelo padrão da cosmologia. À medida que aumentam os avanços na precisão dos dados cosmológicos, estes permitir-nos-ão fazer melhores constrangimentos em ambos os modelos FLRW e LTB e possivelmente descartar, pelo menos, um dos dois. Porém, falta-nos ainda perceber qual será a melhor maneira de analisar os dados cosmológicos. Tradicionalmente, em cosmologia, utilizam-se métodos paramétricos que ajustam os dados com funções que dependem do modelo em estudo, por essa razão, os nossos resultados estão naturalmente enviesados pelo modelo que usamos para os analisar. Esta abordagem obviamente limita o conhecimento científico e pode ser uma possível causa para as tensões presentes nos modelos FLRW pois diferentes dados de diferentes sondas cosmológicas podem dar paramêtros diferentes para a mesma função. Um dos principais objetivos desta tese é perceber qual será a melhor maneira de analisar dados cosmológicos. Os métodos paramétricos são dependentes do modelo que estamos a estudar, isto porque eles ajustam paramêtros de funções já conhecidas, desses mesmos modelos. Contudo, à medida que grandes volumes de dados de elevada precisão e o poder computacional aumentam devem-se considerar outros métodos, denominados não paramétricos, que permitem reconstruir as funções cosmológicas sem assumir a priori a forma dessas funções. Ao contrário dos métodos paramétricos, os métodos não paramétricos são completamente independentes do modelo, portanto, eles não enviesam os resultados. Em vez de nos darem os melhores paramêtros para uma dada função cosmológica, estes métodos dão-nos a função que melhor descreve os dados juntamente com os seus paramêtros. Isto faz com que os métodos não paramétricos nos pareçam a melhor abordagem quando se trata de analisar dados cosmológicos. Ainda assim, nós precisamos de perceber se estes métodos serão ou não a melhor alternativa em relação aos métodos paramétricos tendo em conta a atual precisão dos dados. Neste trabalho, usamos um conhecido método paramétrico que consiste em combinar métodos de Markov Chain Monte Carlo (MCMC) com estatística Bayesiana. Os métodos MCMC são usados para tirar amostras de uma distribuição de probabilidades enquanto que a estatística Bayesiana é uma teoria para intrepertar dados observados. Combinando estes dois tópicos, temos um poderoso método paramétrico capaz de constranger os paramêtros de qualquer função cosmológica no contexto de um dado modelo. Além disso, para uma melhor compreensão dos métodos não paramétricos e se eles podem atualmente substituir os métodos paramétricos nós vamos usar algoritmos de inteligência artificial para reconstruir funções cosmológicas usando tanto dados simulados como dados reais e aplicados a modelos FLRW e LTB. Mais especificamente, o algoritmo de inteligência artificial (AI) que vamos utilizar é conhecido como programação genética (GP). O algoritmo GP foi inspirado pela seleção natural e resolve problemas de regressão simbólica. Regressão simbólica é uma técnica de aprendizagem automática usada para encontrar uma expressão matemática que melhor descreve uma relação entre grandezas de um conjunto de dados. Desta forma, não precisamos de escolher um modelo de antemão, em vez disso, deixamos que os dados nos digam qual o modelo que melhor os descreve. O mecanismo principal do GP consiste numa população em que cada indivíduo é um possível candidato à solução do problema. Os indíviduos vão evoluir ao longo de várias gerações através de operações características destes algoritmos, como por exemplo, a mutação e o cruzamento entre dois indivíduos. Nesta tese, além de testarmos formas de tentar distinguir modelos FLRW de modelos LTB, começamos por tentar perceber se os métodos não paramétricos podem ser atualmente uma boa alternativa aos métodos paramétricos. Para isso, em primeiro lugar, propomos comparar os métodos paramétricos com os não paramétricos, para perceber se estes últimos têm uma precisão análoga e, portanto, se poderão ser uma alternativa aos métodos tradicionais. No seguimento deste estudo, concluimos que os não métodos paramétricos fornecem resultados análogos aos dos paramétricos na reconstrução de várias funções cosmológicas. O primeiro passo deste estudo foi tentar compreender a natureza estocástica dos GP. A maneira como fazemos isso é tentando replicar os mesmos resultados obtidos por outro código GP para o mesmo conjunto de dados cosmológicos. Como esperado, não conseguimos replicar exatamente a mesma função usando códigos diferentes. É de notar que resultados diferentes não significam necessariamente maus resultados, em vez disso mostram-nos o quão estocástico um algoritmo GP pode ser. É importante salientar que isto acontece não só quando usamos códigos GP diferentes, mas também quando executamos o mesmo código várias vezes. O segundo passo foi perceber até que ponto o nível de ruído nos dados cosmológicos pode ser um problema na reconstrução de funções cosmológicas. Para isso, aplicamos vários níveis de ruído e tentamos reconstruir a mesma função teórica. Isto é de enorme importância porque os dados cosmológicos são sempre acompanhados de ruído. Desta forma pudemos concluir que a atual precisão dos dados cosmológicos não é suficiente para reconstruir de forma exata as funções teóricas usadas. No final, propomos uma observação da variação do redshift que irá ajudar a distinguir modelos FLRW de modelos LTB e que poderá descartar um dos dois modelos. Isto fornecerá um teste observacional ao CP e será um importante passo para que o CP se torne mais que um princípio não testado.
Autores principais:	Gonçalves, Maria Alexandra Martins
Assunto:	Cosmologia Princípio Cosmológico Inteligência Artificial Programação genética Modelos de Lemaître–Tolman–Bondi Teses de mestrado - 2023
Ano:	2023
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade de Lisboa
Idioma:	inglês
Origem:	Repositório da Universidade de Lisboa

Descrição
Resumo:	A ideia de que vivemos num Universo homogéneo e isotrópico é uma hipótese chamada de princípio cosmológico (CP) 1 . O CP está no centro da cosmologia moderna. Combinado com as equações de campo de Einstein conduz aos populares modelos homogéneos e isotrópicos de Friedmann-LemaitreRobertson-Walker (FLRW) que se tornaram no atual paradigma base para analisar e prever observações cosmológicas a grandes escalas. Apesar de alvo de várias críticas, o CP não é usualmente considerado uma causa das tensões cosmológicas que surgem no contexto dos modelos FLRW. No entanto faz todo o sentido, que este princípio mereça a nossa atenção pois podemos estar a basear quase toda a cosmologia numa hipótese que pode não ser válida a escalas cosmológicas. Para testar o CP podem-se considerar modelos não homogéneos. Em particular, nesta tese, nós vamos considerar os modelos cosmológicos de Lemaître–Tolman–Bondi (LTB). Os modelos LTB são modelos isotrópicos, simetricamente esféricos e não homogéneos. Estes modelos são usalmente estudados como uma alternativa à energia escura. Em geral, os modelos LTB ditam que nós vivemos dentro de uma zona com baixa densidade de matéria e isso é a causa da expansão acelerada que observamos hoje. É de notar que a expansão acelerada do Universo, segundo os modelos LTB, também poderia existir caso vivessemos numa zona de alta densidade de matéria, contudo as observações sugerem que os modelos LTB mais viáveis são os que preveem não homogeneidades de baixa densidade de matéria. Ainda que os modelos LTB sejam uma alternativa interessante aos modelos FLRW, alguns destes modelos não estão em total acordo com observações a grandes escalas, o que levou à criação dos modelos ΛLTB. Estes modelos são em tudo análogos aos modelos LTB, à excecção de considerarem um componente adicional no Universo, a energia escura. Porém, a qualidade dos dados cosmológicos atual não é suficiente para fazer distinções entre modelos FLRW e ΛLTB. Por outro lado, existe uma ampla variedade de modelos LTB que ainda não foram testados com dados observacionais. Em particular, nesta tese focamo-nos em dois tipos de modelos LTB, os modelos de Clifton-Ferreira-Land (CFL) e os modelos de Garcia-Bellido-Haugbølle (GBH), e num tipo de modelo FLRW, denominado ΛCDM, que é conhecido como o modelo padrão da cosmologia. À medida que aumentam os avanços na precisão dos dados cosmológicos, estes permitir-nos-ão fazer melhores constrangimentos em ambos os modelos FLRW e LTB e possivelmente descartar, pelo menos, um dos dois. Porém, falta-nos ainda perceber qual será a melhor maneira de analisar os dados cosmológicos. Tradicionalmente, em cosmologia, utilizam-se métodos paramétricos que ajustam os dados com funções que dependem do modelo em estudo, por essa razão, os nossos resultados estão naturalmente enviesados pelo modelo que usamos para os analisar. Esta abordagem obviamente limita o conhecimento científico e pode ser uma possível causa para as tensões presentes nos modelos FLRW pois diferentes dados de diferentes sondas cosmológicas podem dar paramêtros diferentes para a mesma função. Um dos principais objetivos desta tese é perceber qual será a melhor maneira de analisar dados cosmológicos. Os métodos paramétricos são dependentes do modelo que estamos a estudar, isto porque eles ajustam paramêtros de funções já conhecidas, desses mesmos modelos. Contudo, à medida que grandes volumes de dados de elevada precisão e o poder computacional aumentam devem-se considerar outros métodos, denominados não paramétricos, que permitem reconstruir as funções cosmológicas sem assumir a priori a forma dessas funções. Ao contrário dos métodos paramétricos, os métodos não paramétricos são completamente independentes do modelo, portanto, eles não enviesam os resultados. Em vez de nos darem os melhores paramêtros para uma dada função cosmológica, estes métodos dão-nos a função que melhor descreve os dados juntamente com os seus paramêtros. Isto faz com que os métodos não paramétricos nos pareçam a melhor abordagem quando se trata de analisar dados cosmológicos. Ainda assim, nós precisamos de perceber se estes métodos serão ou não a melhor alternativa em relação aos métodos paramétricos tendo em conta a atual precisão dos dados. Neste trabalho, usamos um conhecido método paramétrico que consiste em combinar métodos de Markov Chain Monte Carlo (MCMC) com estatística Bayesiana. Os métodos MCMC são usados para tirar amostras de uma distribuição de probabilidades enquanto que a estatística Bayesiana é uma teoria para intrepertar dados observados. Combinando estes dois tópicos, temos um poderoso método paramétrico capaz de constranger os paramêtros de qualquer função cosmológica no contexto de um dado modelo. Além disso, para uma melhor compreensão dos métodos não paramétricos e se eles podem atualmente substituir os métodos paramétricos nós vamos usar algoritmos de inteligência artificial para reconstruir funções cosmológicas usando tanto dados simulados como dados reais e aplicados a modelos FLRW e LTB. Mais especificamente, o algoritmo de inteligência artificial (AI) que vamos utilizar é conhecido como programação genética (GP). O algoritmo GP foi inspirado pela seleção natural e resolve problemas de regressão simbólica. Regressão simbólica é uma técnica de aprendizagem automática usada para encontrar uma expressão matemática que melhor descreve uma relação entre grandezas de um conjunto de dados. Desta forma, não precisamos de escolher um modelo de antemão, em vez disso, deixamos que os dados nos digam qual o modelo que melhor os descreve. O mecanismo principal do GP consiste numa população em que cada indivíduo é um possível candidato à solução do problema. Os indíviduos vão evoluir ao longo de várias gerações através de operações características destes algoritmos, como por exemplo, a mutação e o cruzamento entre dois indivíduos. Nesta tese, além de testarmos formas de tentar distinguir modelos FLRW de modelos LTB, começamos por tentar perceber se os métodos não paramétricos podem ser atualmente uma boa alternativa aos métodos paramétricos. Para isso, em primeiro lugar, propomos comparar os métodos paramétricos com os não paramétricos, para perceber se estes últimos têm uma precisão análoga e, portanto, se poderão ser uma alternativa aos métodos tradicionais. No seguimento deste estudo, concluimos que os não métodos paramétricos fornecem resultados análogos aos dos paramétricos na reconstrução de várias funções cosmológicas. O primeiro passo deste estudo foi tentar compreender a natureza estocástica dos GP. A maneira como fazemos isso é tentando replicar os mesmos resultados obtidos por outro código GP para o mesmo conjunto de dados cosmológicos. Como esperado, não conseguimos replicar exatamente a mesma função usando códigos diferentes. É de notar que resultados diferentes não significam necessariamente maus resultados, em vez disso mostram-nos o quão estocástico um algoritmo GP pode ser. É importante salientar que isto acontece não só quando usamos códigos GP diferentes, mas também quando executamos o mesmo código várias vezes. O segundo passo foi perceber até que ponto o nível de ruído nos dados cosmológicos pode ser um problema na reconstrução de funções cosmológicas. Para isso, aplicamos vários níveis de ruído e tentamos reconstruir a mesma função teórica. Isto é de enorme importância porque os dados cosmológicos são sempre acompanhados de ruído. Desta forma pudemos concluir que a atual precisão dos dados cosmológicos não é suficiente para reconstruir de forma exata as funções teóricas usadas. No final, propomos uma observação da variação do redshift que irá ajudar a distinguir modelos FLRW de modelos LTB e que poderá descartar um dos dois modelos. Isto fornecerá um teste observacional ao CP e será um importante passo para que o CP se torne mais que um princípio não testado.