Publicação

Stochastic modelling of non-stationary financial assets

Detalhes bibliográficos
Resumo:	Nesta dissertação vamos propor um modelo que nos permite estudar a série temporal não estacionária do volume-preço de 2000 empresas cotadas no New York Stock Exchange. Estes dados foram recolhidos diretamente do Yahoo Finance entre 27/01/2011 e 06/04/2014, com uma frequência de amostragem de 10 minutos. O volume-preço num dado instante corresponde ao produto entre o preço de determinada ação pelo volume transacionado da mesma. Esta é uma variável muito importante na matemática financeira pois incorpora a interação existente entre o volume e o preço de uma ação. Por exemplo, volumes altos têm tendência a originar preços altos, enquanto volumes baixos estão habitualmente associados a preços mais baixos. Para além disso, quando uma pessoa decide comprar/vender uma ação, o preço da mesma não é a única variável importante. Também é necessário ter em conta o volume, visto que este está associado à liquidez do título, isto é, ao quão fácil ou difícil é comprar/vender a ação. Para além disso, a distribuição do volume-preço dá-nos informação sobre a quantidade de capital que está a ser transacionada no mercado. Apesar da série temporal do volume-pre_co ser n~ao estacion_aria, esta segue uma forma funcional constante ao longo do tempo. Já foi mostrado em trabalhos anteriores que, para cada janela temporal de 10 minutos, o modelo que melhor explica o volume-preço das 2000 empresas da bolsa de Nova Iorque é uma log-normal com parâmetros ø e θ. A média do logaritmo do volume-preço é representada pelo parâmetro ø enquanto o desvio-padrão do logaritmo do volume-preço é representado pelo parâmetro θ. É sabido da estatística clássica que é possível chegar a uma fórmula fechada para o n-ésimo momento de uma log-normal e que, sabendo a expressão de todos os momentos de uma distribuição, podemos chegar à sua função densidade de probabilidade usando transformadas de Fourier. Portanto, o nosso objetivo de estudar a série não estacionária do volume-preço resume-se a estudar as séries estacionárias dos parâmetros ø e θ. A nossa análise decompõe a evolução dos parâmetros ø e θ na soma dos seus padrões médios diários, ø e θ, com as flutuações em torno destes parâmetros, ø’ e θ’. Vamos modelar estas duas partes separadamente e utilizando abordagens diferentes. Modelar os padrões diários ø e θ é um procedimento simples, visto que ambos se podem descrever por uma função cúbica. A modelação das flutuações já tem que ser mais cuidadosa pois estamos perante séries temporais com um comportamento fortemente estocástico. Como tal, vamos modelar estas séries através de equações diferenciais estocásticas, também conhecidas como equações de Langevin. É importante referir que nós dividimos as séries temporais ø e θ em duas partes porque não é possível modelar dados que contenham algum tipo de periodicidade através de equações de Langevin. Portanto, tivemos que retirar a parte periódica dos nossos dados. Utilizámos a transformada rápida de Fourier para nos certificarmos de que não persistia nenhum tipo de periodicidade nas nossas séries temporais das flutuações. Começámos por modelar as flutuações assumindo que as séries ø’ e θ’ são independentes uma da outra. Apesar de isto não se verificar na realidade, o coeficiente de correlação entre as séries é muito baixo pelo que podemos supor, para um modelo mais simples, que é aproximadamente zero. Para além disso, na maior parte das situações da vida real, os modelos mais simples são preferíveis face aos mais complexos, visto que é mais fácil implementá-los e interpretar os seus resultados. Como tal, nós extraímos dos nossos dados os coeficientes que regem as duas equações de Langevin que modelam as flutuações dos nossos dados. Em ambos os casos, o coeficiente da parte determinística da equação, D(1), corresponde a uma função linear da variável em estudo, enquanto o coeficiente da parte estocástica, D(2), é uma função quadrática. Após esta primeira abordagem com um modelo mais simples, passámos para um modelo que incorpora a interação entre ø’ e θ’. Vamos descrever estas flutuações através de um sistema de duas equações Langevin acopladas. Agora o coeficiente da parte determinística, D(1), é na verdade um vetor de duas funções enquanto o coeficiente da parte estocástica, D(2), é uma matriz simétrica com três funções distintas. Visto que temos um sistema de equações que nos permite descrever a evolução de ø’ e θ’, podemos construir as nossas próprias séries temporais das flutuações. Somando estas séries teóricas ao padrão médio obtido pelas funções cúbicas, ficamos com séries temporais teóricas para o ø e para o θ . Por outras palavras, estes são os valores de ø e θ que o nosso modelo prevê. Comparámos estes valores teóricos das séries do ø e do θ com os valores empíricos que já tínhamos. Chegámos à conclusão de que o nosso modelo é capaz de explicar muito bem a evolução da série temporal do ø, visto que a densidade da série teórica e da série empírica são quase coincidentes. Contudo, a série do θ já não é tão bem explicada pelo nosso modelo. Isto já era esperado visto que, como o ø é um momento de primeira ordem, então é mais facilmente modelado do que um momento de segunda ordem. Notar que o θ é a raiz quadrada do segundo momento centrado. Como já vimos anteriormente, é possível chegar à fórmula fechada para o o n-ésimo momento da distribuição log-normal que depende apenas de ø e θ. Após termos esta fórmula, podemos substituir os valores de ø e θ pelos que obtivemos através do nosso modelo e obtemos a série temporal do n-ésimo momento teórico. Nós calculámos as séries dos primeiros quatro momentos teóricos. Para percebermos se os nossos resultados estavam de acordo com a realidade, fizemos um processo semelhante para as séries do ø e do θ empíricas. Finalmente, comparámos as funções densidade de probabilidade de ambas as séries e percebemos que o nosso modelo descreve muito bem os primeiros momentos da série do volume-preço. Mais uma vez, isto também já era esperado visto que os momentos de ordens superiores estão mais dependentes do θ do que aqueles de ordens inferiores. Há inúmeros modelos na literatura que nos permitem estudar séries temporais. Uma pergunta pertinente seria o porquê de termos escolhido esta análise de Langevin em detrimento dos outros modelos. Uma particularidade muito interessante sobre o nosso modelo é que ele não nos permite apenas descrever a evolução temporal da série do volume-preço. Para além disso, também podemos chegar a uma equação às derivadas parciais, de tipo Fokker-Plank, que nos dá a evolução da função densidade de probabilidade do volume-preço. A dedução desta equação não foi efetuada no âmbito desta tese, mas é um excelente ponto para ser desenvolvido em trabalhos futuros. Para terminar, o modelo que nós propusemos nesta tese pode ser aplicado à bolsa de valores de Nova Iorque para calcular medidas de risco como o Value at Risk. Uma das questões que se levantaram a partir da realização deste trabalho é se este modelo é adequado para fazer previsões sobre a evolução do volume-preço. Este seria um bom ponto de partida para trabalhos futuros. Para além disso, este modelo é suficientemente geral para poder ser aplicado a séries temporais de outras áreas científicas, como por exemplo no estudo da variabilidade cardíaca na fisiologia ou no estudo de séries sísmicas na geologia. Este trabalho proporcionou-nos uma visão bastante aprofundada do estudo das séries temporárias não estacionárias e permitiu-nos propor uma metodologia que será bastante útil em várias áreas.
Autores principais:	Estevens, Joana Ribeiro
Assunto:	Equações diferenciais estocásticas Não estacionariedade Séries temporais Movimento browniano Teses de mestrado - 2016
Ano:	2016
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade de Lisboa
Idioma:	inglês
Origem:	Repositório da Universidade de Lisboa

Descrição
Resumo:	Nesta dissertação vamos propor um modelo que nos permite estudar a série temporal não estacionária do volume-preço de 2000 empresas cotadas no New York Stock Exchange. Estes dados foram recolhidos diretamente do Yahoo Finance entre 27/01/2011 e 06/04/2014, com uma frequência de amostragem de 10 minutos. O volume-preço num dado instante corresponde ao produto entre o preço de determinada ação pelo volume transacionado da mesma. Esta é uma variável muito importante na matemática financeira pois incorpora a interação existente entre o volume e o preço de uma ação. Por exemplo, volumes altos têm tendência a originar preços altos, enquanto volumes baixos estão habitualmente associados a preços mais baixos. Para além disso, quando uma pessoa decide comprar/vender uma ação, o preço da mesma não é a única variável importante. Também é necessário ter em conta o volume, visto que este está associado à liquidez do título, isto é, ao quão fácil ou difícil é comprar/vender a ação. Para além disso, a distribuição do volume-preço dá-nos informação sobre a quantidade de capital que está a ser transacionada no mercado. Apesar da série temporal do volume-pre_co ser n~ao estacion_aria, esta segue uma forma funcional constante ao longo do tempo. Já foi mostrado em trabalhos anteriores que, para cada janela temporal de 10 minutos, o modelo que melhor explica o volume-preço das 2000 empresas da bolsa de Nova Iorque é uma log-normal com parâmetros ø e θ. A média do logaritmo do volume-preço é representada pelo parâmetro ø enquanto o desvio-padrão do logaritmo do volume-preço é representado pelo parâmetro θ. É sabido da estatística clássica que é possível chegar a uma fórmula fechada para o n-ésimo momento de uma log-normal e que, sabendo a expressão de todos os momentos de uma distribuição, podemos chegar à sua função densidade de probabilidade usando transformadas de Fourier. Portanto, o nosso objetivo de estudar a série não estacionária do volume-preço resume-se a estudar as séries estacionárias dos parâmetros ø e θ. A nossa análise decompõe a evolução dos parâmetros ø e θ na soma dos seus padrões médios diários, ø e θ, com as flutuações em torno destes parâmetros, ø’ e θ’. Vamos modelar estas duas partes separadamente e utilizando abordagens diferentes. Modelar os padrões diários ø e θ é um procedimento simples, visto que ambos se podem descrever por uma função cúbica. A modelação das flutuações já tem que ser mais cuidadosa pois estamos perante séries temporais com um comportamento fortemente estocástico. Como tal, vamos modelar estas séries através de equações diferenciais estocásticas, também conhecidas como equações de Langevin. É importante referir que nós dividimos as séries temporais ø e θ em duas partes porque não é possível modelar dados que contenham algum tipo de periodicidade através de equações de Langevin. Portanto, tivemos que retirar a parte periódica dos nossos dados. Utilizámos a transformada rápida de Fourier para nos certificarmos de que não persistia nenhum tipo de periodicidade nas nossas séries temporais das flutuações. Começámos por modelar as flutuações assumindo que as séries ø’ e θ’ são independentes uma da outra. Apesar de isto não se verificar na realidade, o coeficiente de correlação entre as séries é muito baixo pelo que podemos supor, para um modelo mais simples, que é aproximadamente zero. Para além disso, na maior parte das situações da vida real, os modelos mais simples são preferíveis face aos mais complexos, visto que é mais fácil implementá-los e interpretar os seus resultados. Como tal, nós extraímos dos nossos dados os coeficientes que regem as duas equações de Langevin que modelam as flutuações dos nossos dados. Em ambos os casos, o coeficiente da parte determinística da equação, D(1), corresponde a uma função linear da variável em estudo, enquanto o coeficiente da parte estocástica, D(2), é uma função quadrática. Após esta primeira abordagem com um modelo mais simples, passámos para um modelo que incorpora a interação entre ø’ e θ’. Vamos descrever estas flutuações através de um sistema de duas equações Langevin acopladas. Agora o coeficiente da parte determinística, D(1), é na verdade um vetor de duas funções enquanto o coeficiente da parte estocástica, D(2), é uma matriz simétrica com três funções distintas. Visto que temos um sistema de equações que nos permite descrever a evolução de ø’ e θ’, podemos construir as nossas próprias séries temporais das flutuações. Somando estas séries teóricas ao padrão médio obtido pelas funções cúbicas, ficamos com séries temporais teóricas para o ø e para o θ . Por outras palavras, estes são os valores de ø e θ que o nosso modelo prevê. Comparámos estes valores teóricos das séries do ø e do θ com os valores empíricos que já tínhamos. Chegámos à conclusão de que o nosso modelo é capaz de explicar muito bem a evolução da série temporal do ø, visto que a densidade da série teórica e da série empírica são quase coincidentes. Contudo, a série do θ já não é tão bem explicada pelo nosso modelo. Isto já era esperado visto que, como o ø é um momento de primeira ordem, então é mais facilmente modelado do que um momento de segunda ordem. Notar que o θ é a raiz quadrada do segundo momento centrado. Como já vimos anteriormente, é possível chegar à fórmula fechada para o o n-ésimo momento da distribuição log-normal que depende apenas de ø e θ. Após termos esta fórmula, podemos substituir os valores de ø e θ pelos que obtivemos através do nosso modelo e obtemos a série temporal do n-ésimo momento teórico. Nós calculámos as séries dos primeiros quatro momentos teóricos. Para percebermos se os nossos resultados estavam de acordo com a realidade, fizemos um processo semelhante para as séries do ø e do θ empíricas. Finalmente, comparámos as funções densidade de probabilidade de ambas as séries e percebemos que o nosso modelo descreve muito bem os primeiros momentos da série do volume-preço. Mais uma vez, isto também já era esperado visto que os momentos de ordens superiores estão mais dependentes do θ do que aqueles de ordens inferiores. Há inúmeros modelos na literatura que nos permitem estudar séries temporais. Uma pergunta pertinente seria o porquê de termos escolhido esta análise de Langevin em detrimento dos outros modelos. Uma particularidade muito interessante sobre o nosso modelo é que ele não nos permite apenas descrever a evolução temporal da série do volume-preço. Para além disso, também podemos chegar a uma equação às derivadas parciais, de tipo Fokker-Plank, que nos dá a evolução da função densidade de probabilidade do volume-preço. A dedução desta equação não foi efetuada no âmbito desta tese, mas é um excelente ponto para ser desenvolvido em trabalhos futuros. Para terminar, o modelo que nós propusemos nesta tese pode ser aplicado à bolsa de valores de Nova Iorque para calcular medidas de risco como o Value at Risk. Uma das questões que se levantaram a partir da realização deste trabalho é se este modelo é adequado para fazer previsões sobre a evolução do volume-preço. Este seria um bom ponto de partida para trabalhos futuros. Para além disso, este modelo é suficientemente geral para poder ser aplicado a séries temporais de outras áreas científicas, como por exemplo no estudo da variabilidade cardíaca na fisiologia ou no estudo de séries sísmicas na geologia. Este trabalho proporcionou-nos uma visão bastante aprofundada do estudo das séries temporárias não estacionárias e permitiu-nos propor uma metodologia que será bastante útil em várias áreas.