Document details

Digit analysis using Benford's Law : a bayesian approach

Author(s): Fonseca, Pedro Miguel Teles da

Date: 2016

Persistent ID: http://hdl.handle.net/10400.5/13105

Origin: Repositório da UTL

Subject(s): Análise da Frequência dos Dígitos; Calibração do Valor-P; Lei de Benford; Medidas Condicionais de Evidencia; Selecção Bayesiana de Modelos; Testes de Hipoteses; Bayesian Model Selection; Benford's Law; Conditional Measures of Evidence; Digit Analysis; Hypothesis Testing; P-Value Calibration


Description

Mestrado em Econometria Aplicada e Previsão

A lei de Benford, regularidade empírica segundo a qual muitos dos conjuntos de números gerados sem intervenção humana exibem um padrão de decaimento logarítmico nas frequências de ocorrência de primeiros dígitos, pode ser utilizada para, através da análise da frequência de dígitos, identificar conjuntos de números potencialmente erróneos ou fraudulentos. Devido ao elevado nível de potência alcançado pelos testes de hipóteses clássicos de dimensão fixa em amostras grandes, espera-se que, se a amostra for suficientemente grande, estes consigam identificar qualquer desvio em relação à lei de Benford, por mais pequeno que seja, como sendo estatisticamente significativo. Isto pode levar à rejeição da presença da lei de Benford em amostras onde o desvio em relação à mesma não tem significância prática e à identificação de amostras legitimas como sendo fraudulentas. Esta dissertação sugere uma abordagem baseada na seleção bayesiana de modelos. A metodologia proposta é aplicada num estudo empírico que utiliza estatísticas macroeconómicas de países da Zona Euro e explora o conflito entre o valor-p e as medidas bayesianas de evidência (fator de Bayes e probabilidades a posteriori) a nível do suporte por elas fornecido à presença da lei de Benford numa amostra. Conclui-se que os testes clássicos rejeitam frequentemente a presença da lei de Benford em amostras onde as medidas bayesianas são favoráveis à sua presença, e que mesmo limites inferiores destas medidas sobre largas famílias de distribuições a priori frequentemente fornecem bastante mais suporte à presença da lei de Benford do que o valor-p e os testes clássicos.

According to Benford's law, many of the collections of numbers which are generated without human intervention exhibit a logarithmically decaying pattern in leading digit frequencies. Through digit analysis, this empirical regularity can help identifying erroneous or fraudulent data. Due to the power that classical significance tests with fixed dimension attain in large samples, they produce small p-values and, if the sample is big enough, are able to identify any deviation from Benford's law, no matter how tiny, as statistically significant. This may result in the rejection of Benford's law in samples where the deviations from it are without practical importance, and consequently samples which are legit are likely to be classified as erroneous or fraudulent. This dissertation proposes a Bayesian model selection approach to digit analysis. An empirical application with macroeconomic statistics from Eurozone countries demonstrates the applicability of the suggested methodology and explores the conflict between the p-value and Bayesian measures of evidence (Bayes factors and posterior probabilities) in the support they provide to the presence of Benford's law in a given sample. It is concluded that classical significance tests often reject the presence of Benford's law in samples which are deemed to be in conformance to it by Bayesian measures, and that even lower bounds on such measures over wide classes of prior distributions often provide more evidence in favour of Benford's law than the p-value and classical significance tests seem to suggest.

Document Type Master thesis
Language English
Advisor(s) Paulo, Rui
Contributor(s) Repositório da Universidade de Lisboa
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents