Publicação

Univariate and bivariate extremes in meteorology: an application to the Great Plains Low-Level Jet System

Ver documento

Detalhes bibliográficos
Resumo:Nesta tese, colocamo-nos no contexto do sistema do Great Plains Low-Level Jet (GPLLJ), que é um sistema de ventos muito fortes na troposfera inferior que transporta uma enorme quantidade de humidade do Golfo do México para as Grandes Planícies Americanas e está principalmente activo nos meses de Verão. Este trabalho tem dois objectivos: primeiro, analisar o comportamento extremo da humidade transportada da região de origem do GPLLJ para o domínio do jet; segundo, nos casos de humidade transportada baixa e alta, estudar a dependência global e extrema entre a cauda superior da precipitação na região do sumidouro do GPLLJ e a cauda inferior da estabilidade troposférica na região do sumidouro do GPLLJ (ómega). Para este efeito, são utilizadas as séries de observações diárias de humidade transportada, precipitação e "ómega" de todos os períodos de Junho-Julho-Agosto de 1980 a 2017, o que corresponde a 3496 observações. As observações de precipitação e "ómega" foram separadas em dois grupos consoante os valores observados de humidade transportada. Um valor de humidade transportada é considerado baixo, se for inferior ao correspondente quantil empírico de probabilidade 0.25 e alto, se exceder o quantil de probabilidade 0.75 dessa variável. No que diz respeito à parte teórica desta dissertação, em primeiro lugar são apresentados os conceitos fundamentais da Teoria Univariada de Valores Extremos. É relevante salientar a importância dos modelos de limiar, que são essenciais para ambos os objectivos da tese: realizar a análise univariada dos extremos de humidade transportada e como passo prévio necessário ao estudo dos extremos bivariados. A seguir, é possível encontrar alguns dos tópicos-chave da Teoria Bivariada de Valores Extremos, que foi utilizada para abordar a abordagem de extremos que constitui o segundo objectivo desta tese. São apresentadas as noções probabilísticas fundamentais e alguns dos modelos paramétricos mais importantes dos extremos bivariados, para além da metodologia estatística mais comum neste contexto. Particularmente importante é o método de verosimilhança censurada, que é utilizado para ajustar o Modelo de Limiar Bivariado de Excessos na modelação dos dados. Também é abordado o conceito de independência assintótica, que é uma situação que deve ser analisada quando se utiliza a metodologia apresentada nesta tese. A fim de obter uma imagem global da estrutura de dependência no contexto do segundo objectivo deste trabalho são utilizadas cópulas. É apresentado um resumo dos aspectos mais importantes da Teoria de Cópulas, tanto do ponto de vista probabilístico como do ponto de vista estatístico. Nomeadamente, introduzimos o conceito de copula, alguns dos modelos de cópulas mais comuns e apresentamos diferentes métodos de estimação (embora o foco seja a abordagem semi-paramétrica, que é usada na parte prática da tese), bem como algumas breves considerações sobre a selecção de modelos e testes de ajustamento das cópulas. Posteriormente, são apresentados o procedimento e os resultados relativamente à análise univariada de extremos de humidade transportada. Depois de realizar uma breve análise exploratória a fim de compreender melhor a série em estudo, são utilizados modelos de limiar para estudar o comportamento dos valores extremos dessa série. Utiliza-se a abordagem conhecida como Peaks Over Threshold (POT), traduzido para português como “Picos acima do limiar”. Através de dois dos métodos mais habituais de selecção de limiares, é decidido que u = 2 (mm/dia) é um limiar adequado. Como é claramente visível que os excessos em relação ao limiar escolhido não são independentes, é feito um processo de declustering (usando o método de "run-declustering") a fim de eliminar o mais possível essa dependência. O declustering foi realizado considerando quatro valores diferentes de run length (r), nomeadamente 1,2,3 e 4. Graficamente e por testes estatísticos, chegamos à conclusão de que o modelo exponencial é mais apropriado do que o modelo de Pareto Generalizado (GPD, pelo seu acrónimo em inglês) para modelar os máximos de clusters de excessos acima do limiar escolhido, para todos os valores de r considerados. Além disso, prova-se que no caso de r = 4 o modelo exponencial não estacionário é mais adequado do que o estacionário, no sentido em que se demonstra que o parâmetro de escala do modelo exponencial decresce com o tempo. Por esta razão e porque é o valor que garante melhor a independência entre os excessos, conclui-se que r = 4 é a melhor escolha. Também são calculados os níveis de retorno estimados de 38 anos, 50 anos e 100 anos para a série de humidade transportada utilizando o modelo exponencial não estacionário ajustado aos máximos dos clusters de excessos. É interessante referir que nesta abordagem o período "um ano" corresponde a "um verão" (meses de Junho, Julho e Agosto). Os resultados desses cálculos mostram que os três níveis de retorno estimados foram diminuindo com o tempo e que a diferença entre eles se tornou menor. Por conseguinte, é possível dizer que esperamos observar valores extremos mais baixos de humidade transportada no futuro. Por outro lado, são analisados os extremos bivariados de (-ómega,precipitação) nos casos de humidade transportada baixa e alta. Note-se que o sinal de "ómega" é trocado porque, em termos meteorológicos, o interesse é estudar o comportamento conjunto da cauda superior de precipitação e da cauda inferior de "ómega". As séries de precipitação e "-ómega" são desfasadas 1 dia em relação à série de humidade transportada devido à natureza temporal do sistema do GPLLJ. Após uma análise preliminar dos dados em estudo, inicia-se o processo de ajustamento do Modelo de Limiar Bivariado de Excessos. Para tal, é necessário previamente ajustar modelos univariados de limiar às margens. Conclui-se que, tanto nos casos de humidade transportada baixa como alta, um limiar adequado para "-ómega" é u1 = 0.03 (Pa/s) e, para precipitação, é adequado escolher u2 = 5.2 (mm/dia). Usando esses limiares, o modelo GPD é mais apropriado do que o exponencial no caso de "-ómega", verificando-se o contrário no caso da precipitação, tanto nos casos de humidade transportada baixa como alta. Tendo escolhido essas distribuições para os excessos acima do respectivo limiar em cada margem, é utilizado o método de verosimilhança censurada considerando oito diferentes modelos paramétricos. É demonstrado que, para todos esses modelos, a dependência extrema entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa. Os valores do critério de informação de Akaike (AIC, pelo seu acrónimo em inglês) correspondentes a cada um desses modelos são também calculados e o modelo mais parcimonioso no caso de humidade transportada baixa é o bilogístico, enquanto que no caso de ela ser alta, é o logístico. É apresentada a informação mais relevante sobre o modelo bilogístico ajustado no caso de humidade transportada baixa e o modelo logístico ajustado para o caso de ela ser alta. Apresentam-se as estimativas de máxima verosimilhança dos seus coeficientes, as suas correspondentes funções de dependência de Pickands, bem como algumas curvas de quantis estimadas que foram construídas utilizando estes modelos. Além disso, através dos gráficos destinados a esse fim, chega-se à conclusão de que podemos assumir que as variáveis são assimptoticamente dependentes, e portanto os modelos que são apresentados na parte teórica da tese são apropriados para este par de variáveis, tanto nos casos de humidade transportada baixa como alta. Por fim, são ajustadas cópulas ao par (-ómega,precipitação), tanto nos casos de humidade transportada baixa como alta. Chega-se à conclusão de que a dependência global entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa. Além disso, através das estimativas dos coeficientes de dependência de cauda, vemos que a dependência superior de cauda entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa, resultado que está em consonância com as conclusões obtidas a partir do estudo dos extremos bivariados. Além disso, utilizando cópulas, chega-se à mesma conclusão no que se refere à dependência inferior de cauda. De acordo com os testes de ajustamento realizados às cópulas t de Student e Gumbel em cada caso de humidade transportada baixa e alta, esses modelos mostraram ser apropriados em ambos os casos. De acordo com os valores de AIC, a cópula t de Student é o modelo mais adequado no caso de humidade transportada baixa e a cópula Gumbel quando ela é alta. Finalmente, usando estas duas cópulas ajustadas, traçaram-se as funções de densidade dos modelos ajustados. A comparação das pseudo-observações com dados simulados a partir das cópulas ajustadas permite-nos pensar que os modelos são adequados.
Autores principais:Sotelo, Luis Gimeno
Assunto:Extremos Univariados Declustering Extremos Bivariados Dependência Cópulas Teses de mestrado - 2021
Ano:2021
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:Nesta tese, colocamo-nos no contexto do sistema do Great Plains Low-Level Jet (GPLLJ), que é um sistema de ventos muito fortes na troposfera inferior que transporta uma enorme quantidade de humidade do Golfo do México para as Grandes Planícies Americanas e está principalmente activo nos meses de Verão. Este trabalho tem dois objectivos: primeiro, analisar o comportamento extremo da humidade transportada da região de origem do GPLLJ para o domínio do jet; segundo, nos casos de humidade transportada baixa e alta, estudar a dependência global e extrema entre a cauda superior da precipitação na região do sumidouro do GPLLJ e a cauda inferior da estabilidade troposférica na região do sumidouro do GPLLJ (ómega). Para este efeito, são utilizadas as séries de observações diárias de humidade transportada, precipitação e "ómega" de todos os períodos de Junho-Julho-Agosto de 1980 a 2017, o que corresponde a 3496 observações. As observações de precipitação e "ómega" foram separadas em dois grupos consoante os valores observados de humidade transportada. Um valor de humidade transportada é considerado baixo, se for inferior ao correspondente quantil empírico de probabilidade 0.25 e alto, se exceder o quantil de probabilidade 0.75 dessa variável. No que diz respeito à parte teórica desta dissertação, em primeiro lugar são apresentados os conceitos fundamentais da Teoria Univariada de Valores Extremos. É relevante salientar a importância dos modelos de limiar, que são essenciais para ambos os objectivos da tese: realizar a análise univariada dos extremos de humidade transportada e como passo prévio necessário ao estudo dos extremos bivariados. A seguir, é possível encontrar alguns dos tópicos-chave da Teoria Bivariada de Valores Extremos, que foi utilizada para abordar a abordagem de extremos que constitui o segundo objectivo desta tese. São apresentadas as noções probabilísticas fundamentais e alguns dos modelos paramétricos mais importantes dos extremos bivariados, para além da metodologia estatística mais comum neste contexto. Particularmente importante é o método de verosimilhança censurada, que é utilizado para ajustar o Modelo de Limiar Bivariado de Excessos na modelação dos dados. Também é abordado o conceito de independência assintótica, que é uma situação que deve ser analisada quando se utiliza a metodologia apresentada nesta tese. A fim de obter uma imagem global da estrutura de dependência no contexto do segundo objectivo deste trabalho são utilizadas cópulas. É apresentado um resumo dos aspectos mais importantes da Teoria de Cópulas, tanto do ponto de vista probabilístico como do ponto de vista estatístico. Nomeadamente, introduzimos o conceito de copula, alguns dos modelos de cópulas mais comuns e apresentamos diferentes métodos de estimação (embora o foco seja a abordagem semi-paramétrica, que é usada na parte prática da tese), bem como algumas breves considerações sobre a selecção de modelos e testes de ajustamento das cópulas. Posteriormente, são apresentados o procedimento e os resultados relativamente à análise univariada de extremos de humidade transportada. Depois de realizar uma breve análise exploratória a fim de compreender melhor a série em estudo, são utilizados modelos de limiar para estudar o comportamento dos valores extremos dessa série. Utiliza-se a abordagem conhecida como Peaks Over Threshold (POT), traduzido para português como “Picos acima do limiar”. Através de dois dos métodos mais habituais de selecção de limiares, é decidido que u = 2 (mm/dia) é um limiar adequado. Como é claramente visível que os excessos em relação ao limiar escolhido não são independentes, é feito um processo de declustering (usando o método de "run-declustering") a fim de eliminar o mais possível essa dependência. O declustering foi realizado considerando quatro valores diferentes de run length (r), nomeadamente 1,2,3 e 4. Graficamente e por testes estatísticos, chegamos à conclusão de que o modelo exponencial é mais apropriado do que o modelo de Pareto Generalizado (GPD, pelo seu acrónimo em inglês) para modelar os máximos de clusters de excessos acima do limiar escolhido, para todos os valores de r considerados. Além disso, prova-se que no caso de r = 4 o modelo exponencial não estacionário é mais adequado do que o estacionário, no sentido em que se demonstra que o parâmetro de escala do modelo exponencial decresce com o tempo. Por esta razão e porque é o valor que garante melhor a independência entre os excessos, conclui-se que r = 4 é a melhor escolha. Também são calculados os níveis de retorno estimados de 38 anos, 50 anos e 100 anos para a série de humidade transportada utilizando o modelo exponencial não estacionário ajustado aos máximos dos clusters de excessos. É interessante referir que nesta abordagem o período "um ano" corresponde a "um verão" (meses de Junho, Julho e Agosto). Os resultados desses cálculos mostram que os três níveis de retorno estimados foram diminuindo com o tempo e que a diferença entre eles se tornou menor. Por conseguinte, é possível dizer que esperamos observar valores extremos mais baixos de humidade transportada no futuro. Por outro lado, são analisados os extremos bivariados de (-ómega,precipitação) nos casos de humidade transportada baixa e alta. Note-se que o sinal de "ómega" é trocado porque, em termos meteorológicos, o interesse é estudar o comportamento conjunto da cauda superior de precipitação e da cauda inferior de "ómega". As séries de precipitação e "-ómega" são desfasadas 1 dia em relação à série de humidade transportada devido à natureza temporal do sistema do GPLLJ. Após uma análise preliminar dos dados em estudo, inicia-se o processo de ajustamento do Modelo de Limiar Bivariado de Excessos. Para tal, é necessário previamente ajustar modelos univariados de limiar às margens. Conclui-se que, tanto nos casos de humidade transportada baixa como alta, um limiar adequado para "-ómega" é u1 = 0.03 (Pa/s) e, para precipitação, é adequado escolher u2 = 5.2 (mm/dia). Usando esses limiares, o modelo GPD é mais apropriado do que o exponencial no caso de "-ómega", verificando-se o contrário no caso da precipitação, tanto nos casos de humidade transportada baixa como alta. Tendo escolhido essas distribuições para os excessos acima do respectivo limiar em cada margem, é utilizado o método de verosimilhança censurada considerando oito diferentes modelos paramétricos. É demonstrado que, para todos esses modelos, a dependência extrema entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa. Os valores do critério de informação de Akaike (AIC, pelo seu acrónimo em inglês) correspondentes a cada um desses modelos são também calculados e o modelo mais parcimonioso no caso de humidade transportada baixa é o bilogístico, enquanto que no caso de ela ser alta, é o logístico. É apresentada a informação mais relevante sobre o modelo bilogístico ajustado no caso de humidade transportada baixa e o modelo logístico ajustado para o caso de ela ser alta. Apresentam-se as estimativas de máxima verosimilhança dos seus coeficientes, as suas correspondentes funções de dependência de Pickands, bem como algumas curvas de quantis estimadas que foram construídas utilizando estes modelos. Além disso, através dos gráficos destinados a esse fim, chega-se à conclusão de que podemos assumir que as variáveis são assimptoticamente dependentes, e portanto os modelos que são apresentados na parte teórica da tese são apropriados para este par de variáveis, tanto nos casos de humidade transportada baixa como alta. Por fim, são ajustadas cópulas ao par (-ómega,precipitação), tanto nos casos de humidade transportada baixa como alta. Chega-se à conclusão de que a dependência global entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa. Além disso, através das estimativas dos coeficientes de dependência de cauda, vemos que a dependência superior de cauda entre "-ómega" e precipitação é mais forte no caso de humidade transportada alta do que quando ela é baixa, resultado que está em consonância com as conclusões obtidas a partir do estudo dos extremos bivariados. Além disso, utilizando cópulas, chega-se à mesma conclusão no que se refere à dependência inferior de cauda. De acordo com os testes de ajustamento realizados às cópulas t de Student e Gumbel em cada caso de humidade transportada baixa e alta, esses modelos mostraram ser apropriados em ambos os casos. De acordo com os valores de AIC, a cópula t de Student é o modelo mais adequado no caso de humidade transportada baixa e a cópula Gumbel quando ela é alta. Finalmente, usando estas duas cópulas ajustadas, traçaram-se as funções de densidade dos modelos ajustados. A comparação das pseudo-observações com dados simulados a partir das cópulas ajustadas permite-nos pensar que os modelos são adequados.