Document details

Stochastic modelling of non-stationary financial assets

Author(s): Estevens, Joana Ribeiro

Date: 2016

Persistent ID: http://hdl.handle.net/10451/25804

Origin: Repositório da Universidade de Lisboa

Subject(s): Equações diferenciais estocásticas; Não estacionariedade; Séries temporais; Movimento browniano; Teses de mestrado - 2016; Domínio/Área Científica::Ciências Naturais::Matemáticas


Description

Tese de mestrado em Matemática Financeira, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2016

Nesta dissertação vamos propor um modelo que nos permite estudar a série temporal não estacionária do volume-preço de 2000 empresas cotadas no New York Stock Exchange. Estes dados foram recolhidos diretamente do Yahoo Finance entre 27/01/2011 e 06/04/2014, com uma frequência de amostragem de 10 minutos. O volume-preço num dado instante corresponde ao produto entre o preço de determinada ação pelo volume transacionado da mesma. Esta é uma variável muito importante na matemática financeira pois incorpora a interação existente entre o volume e o preço de uma ação. Por exemplo, volumes altos têm tendência a originar preços altos, enquanto volumes baixos estão habitualmente associados a preços mais baixos. Para além disso, quando uma pessoa decide comprar/vender uma ação, o preço da mesma não é a única variável importante. Também é necessário ter em conta o volume, visto que este está associado à liquidez do título, isto é, ao quão fácil ou difícil é comprar/vender a ação. Para além disso, a distribuição do volume-preço dá-nos informação sobre a quantidade de capital que está a ser transacionada no mercado. Apesar da série temporal do volume-pre_co ser n~ao estacion_aria, esta segue uma forma funcional constante ao longo do tempo. Já foi mostrado em trabalhos anteriores que, para cada janela temporal de 10 minutos, o modelo que melhor explica o volume-preço das 2000 empresas da bolsa de Nova Iorque é uma log-normal com parâmetros ø e θ. A média do logaritmo do volume-preço é representada pelo parâmetro ø enquanto o desvio-padrão do logaritmo do volume-preço é representado pelo parâmetro θ. É sabido da estatística clássica que é possível chegar a uma fórmula fechada para o n-ésimo momento de uma log-normal e que, sabendo a expressão de todos os momentos de uma distribuição, podemos chegar à sua função densidade de probabilidade usando transformadas de Fourier. Portanto, o nosso objetivo de estudar a série não estacionária do volume-preço resume-se a estudar as séries estacionárias dos parâmetros ø e θ. A nossa análise decompõe a evolução dos parâmetros ø e θ na soma dos seus padrões médios diários, ø e θ, com as flutuações em torno destes parâmetros, ø’ e θ’. Vamos modelar estas duas partes separadamente e utilizando abordagens diferentes. Modelar os padrões diários ø e θ é um procedimento simples, visto que ambos se podem descrever por uma função cúbica. A modelação das flutuações já tem que ser mais cuidadosa pois estamos perante séries temporais com um comportamento fortemente estocástico. Como tal, vamos modelar estas séries através de equações diferenciais estocásticas, também conhecidas como equações de Langevin. É importante referir que nós dividimos as séries temporais ø e θ em duas partes porque não é possível modelar dados que contenham algum tipo de periodicidade através de equações de Langevin. Portanto, tivemos que retirar a parte periódica dos nossos dados. Utilizámos a transformada rápida de Fourier para nos certificarmos de que não persistia nenhum tipo de periodicidade nas nossas séries temporais das flutuações. Começámos por modelar as flutuações assumindo que as séries ø’ e θ’ são independentes uma da outra. Apesar de isto não se verificar na realidade, o coeficiente de correlação entre as séries é muito baixo pelo que podemos supor, para um modelo mais simples, que é aproximadamente zero. Para além disso, na maior parte das situações da vida real, os modelos mais simples são preferíveis face aos mais complexos, visto que é mais fácil implementá-los e interpretar os seus resultados. Como tal, nós extraímos dos nossos dados os coeficientes que regem as duas equações de Langevin que modelam as flutuações dos nossos dados. Em ambos os casos, o coeficiente da parte determinística da equação, D(1), corresponde a uma função linear da variável em estudo, enquanto o coeficiente da parte estocástica, D(2), é uma função quadrática. Após esta primeira abordagem com um modelo mais simples, passámos para um modelo que incorpora a interação entre ø’ e θ’. Vamos descrever estas flutuações através de um sistema de duas equações Langevin acopladas. Agora o coeficiente da parte determinística, D(1), é na verdade um vetor de duas funções enquanto o coeficiente da parte estocástica, D(2), é uma matriz simétrica com três funções distintas. Visto que temos um sistema de equações que nos permite descrever a evolução de ø’ e θ’, podemos construir as nossas próprias séries temporais das flutuações. Somando estas séries teóricas ao padrão médio obtido pelas funções cúbicas, ficamos com séries temporais teóricas para o ø e para o θ . Por outras palavras, estes são os valores de ø e θ que o nosso modelo prevê. Comparámos estes valores teóricos das séries do ø e do θ com os valores empíricos que já tínhamos. Chegámos à conclusão de que o nosso modelo é capaz de explicar muito bem a evolução da série temporal do ø, visto que a densidade da série teórica e da série empírica são quase coincidentes. Contudo, a série do θ já não é tão bem explicada pelo nosso modelo. Isto já era esperado visto que, como o ø é um momento de primeira ordem, então é mais facilmente modelado do que um momento de segunda ordem. Notar que o θ é a raiz quadrada do segundo momento centrado. Como já vimos anteriormente, é possível chegar à fórmula fechada para o o n-ésimo momento da distribuição log-normal que depende apenas de ø e θ. Após termos esta fórmula, podemos substituir os valores de ø e θ pelos que obtivemos através do nosso modelo e obtemos a série temporal do n-ésimo momento teórico. Nós calculámos as séries dos primeiros quatro momentos teóricos. Para percebermos se os nossos resultados estavam de acordo com a realidade, fizemos um processo semelhante para as séries do ø e do θ empíricas. Finalmente, comparámos as funções densidade de probabilidade de ambas as séries e percebemos que o nosso modelo descreve muito bem os primeiros momentos da série do volume-preço. Mais uma vez, isto também já era esperado visto que os momentos de ordens superiores estão mais dependentes do θ do que aqueles de ordens inferiores. Há inúmeros modelos na literatura que nos permitem estudar séries temporais. Uma pergunta pertinente seria o porquê de termos escolhido esta análise de Langevin em detrimento dos outros modelos. Uma particularidade muito interessante sobre o nosso modelo é que ele não nos permite apenas descrever a evolução temporal da série do volume-preço. Para além disso, também podemos chegar a uma equação às derivadas parciais, de tipo Fokker-Plank, que nos dá a evolução da função densidade de probabilidade do volume-preço. A dedução desta equação não foi efetuada no âmbito desta tese, mas é um excelente ponto para ser desenvolvido em trabalhos futuros. Para terminar, o modelo que nós propusemos nesta tese pode ser aplicado à bolsa de valores de Nova Iorque para calcular medidas de risco como o Value at Risk. Uma das questões que se levantaram a partir da realização deste trabalho é se este modelo é adequado para fazer previsões sobre a evolução do volume-preço. Este seria um bom ponto de partida para trabalhos futuros. Para além disso, este modelo é suficientemente geral para poder ser aplicado a séries temporais de outras áreas científicas, como por exemplo no estudo da variabilidade cardíaca na fisiologia ou no estudo de séries sísmicas na geologia. Este trabalho proporcionou-nos uma visão bastante aprofundada do estudo das séries temporárias não estacionárias e permitiu-nos propor uma metodologia que será bastante útil em várias áreas.

In this dissertation, we propose a framework to model the evolution of the non-stationary time series of the volume-price from 2000 companies from the New York Stock Exchange (NYSE). It was shown that for each 10 minutes window, the distribution that best fits our data is the log-normal distribution. Since the volume-price series is non-stationary, we treat the parameters ø and θ of the log-normal distribution as stochastic variables. We assume that all the time dependency of the volume-price series is included in the parameters, ø(t) and θ(t). Therefore, by describing the evolution of ø and θ we are able to model the volume-price series. Our analysis decomposes the parameters evolution into average daily patterns, ø and θ, and fluctuations around these patterns, ø’ and θ’. The daily patterns ø and θ are easily modelled using cubic curves. The fluctuations ø’ and θ’ are modelled using Langevin equations. We show that both parameters fluctuations, ø’ and θ’, are weakly correlated, which leads us to consider two different models. One, where we assume that the variables are not correlated and therefore yields two independent Langevin equations for our data. And another, two-dimensioned, where we take into account the correlation between the two variables ø’ and θ’ which leads to the derivation of a system of coupled Langevin equations. We used the first approach because most of the times, the simplest models are the ones used in the real world applications. However, we know that the variables are indeed correlated. Thus, we also followed the other approach where we took into account this correlation since we expect it to yield better results. Finally, we use the system of Langevin equations and the cubic curves describing the daily patterns to reconstruct two synthetic time series statistically reproducing the evolution of the parameters ø and θ, and show that they unequivocally determine the expected value of each statistical moment of the log-normal distribution of the volume-price. By comparing the probability density function of these expected values using the ø and θ time series obtained from our model versus the empirical ones, we arrive to the conclusion that our model describes well the first moments of the volume-price time series. This framework proposed by us is general enough to be applied to other fields of study where non-stationary stochastic variables need to be modelled, like biology, medicine, geology, among others. The data from the NYSE was collected directly from Yahoo Finance between January 2011 and April 2014, with a sampling frequency of 10 minutes, which give us a total of 976 days.

Document Type Master thesis
Language English
Advisor(s) Boto, João Pedro,1962-; Lind, Pedro Gonçalves,1976-
Contributor(s) Repositório da Universidade de Lisboa
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents