compreendendo a distribuição de cauda gorda

na parte 1, discutimos o que significa para uma variável aleatória ter uma distribuição de cauda gorda.

longe? Gordo?Para entender a cauda gorda, precisamos responder às duas perguntas seguintes.

1. A que distância fica?
2. Quão gorda é a gordura?

Para falar sobre a cauda, precisamos determinar o quão longe é longe para decidir o quão longe do meio é o suficiente para dizer um ‘rabo’. Por outras palavras, onde começa a cauda? Depende! Infelizmente, não há uma única resposta.

considere a distribuição normal. Note que há duas caudas: direita e esquerda. Se queremos descrever a cauda “direita” da distribuição a partir do desvio padrão único da média, por exemplo, então a parte sombreada refere-se à cauda direita da distribuição normal.

a Figura. 1

Formalmente, podemos descrever a cauda da seguinte forma:

  • cauda direita : P(X>x)
  • cauda esquerda : P(X≤-x)

para um grande valor de ‘x’. Agora, conhecemos o conceito de “cauda”.


#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail

cada distribuição tem uma cauda?

pense sobre a distribuição uniforme sobre . Tem cauda? Neste blog, diz que nem todas as distribuições têm cauda.

If you want “the behavior of the tail” to describe the characteristics of the pdf when ‘ x ‘ gets large, then bounded distributions do not have tails. No entanto, algumas características das caudas podem ser quantificadas. Em particular, usando limites e comportamento assintótico você pode definir a noção de caudas pesadas. SAS blog

vou explicar a distribuição (exponencialmente) limitada / não limitada abaixo. Por favor, lembre-se da distribuição de uniformes quando chegar lá!Por que devemos nos preocupar com a parte “cauda” da distribuição?

a parte final da distribuição tem sido a principal preocupação para a gestão do risco. Por exemplo, as duas medidas de risco mais utilizadas para a distribuição da rendibilidade ou perda são o valor em risco (VaR) e o défice (ES) previsto (s)

por que razão a perda não é devolvida?

  • perda é literalmente menos (-) retorno
  • tomar o limite para o infinito negativo é não-intuitivo. Assim, tomamos o negativo dos valores de retorno, isto é, girando a distribuição sobre o eixo Y.

apenas veja como a quantidade VaR e ES estão relacionadas com a “cauda”. Não precisa entender a matemática ou o significado por trás deles.

” esteja ciente de que o gráfico abaixo é uma distribuição de perda não retorno!”

a Figura. 2 / / Fonte: Ch2, Quantitative Risk Management (seguidamente, QRM) by McNeil et al

Think about distribution of loss, L, equivalent (negative) return, on some asset over a given holding period. Para fins de entendimento, vamos supor que a variável aleatória de perdas de amanhã segue a distribuição normal:

Então, podemos calcular o VaR da seguinte forma:

Origem: Eric Zivot’s Lecture Notes

Through the second line, we can easily check that the VaR is just a quantity related to the fat tail. Para mais detalhes sobre o VaR, consulte o capítulo dois do livro “Quantitative Risk Management: Concepts, Techniques and Tools” e a nota de leitura de Eric Zivot em seu site.

alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)

da mesma forma, podemos ver que o esperado carência é uma quantidade relacionadas com a parte da cauda da distribuição:

Origem: Notas de leitura de Eric Zivot

na quarta linha, diz que ” ES é a perda esperada na “cauda” superior da distribuição de perdas. Semelhante ao VaR, no caso de distribuição normal, é conveniente calcular o ES agora que é apenas uma média de distribuição normal truncada.

Origem: Notas de leitura de Eric Zivot

alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))

se alguém curioso sobre por que nós dividimos por 1-α, isto é apenas uma constante normalizadora (ou fator de escala) para se certificar de que a integração da distribuição de perda truncada é uma, o que é um requisito para que ela seja uma distribuição de probabilidade.De volta à história de “cauda”, eu só queria enfatizar que as distribuições de cauda são amplamente utilizadas como ferramenta de gerenciamento de risco.Como é que a gordura é gorda? Quão pesado é?

uma vez que descobrimos o que a ‘cauda’ está na distribuição e onde é usada, agora é hora de falar sobre a parte ‘gordura’. Todos sabemos que a distribuição normal não tem rabo gordo. Em vez disso, fomos ensinados a usar a distribuição student-t e logar a distribuição normal ao modelar a série de retorno financeiro para levar em conta a propriedade “fat-tail”. Mas precisamos de saber a definição de rabo gordo. Infelizmente, não existe uma definição universal para o termo gordura.

vou tentar explicar a cauda gorda na linguagem do inglês, grafo e Matemática. Espero que aprecies pelo menos um dos três.Uma distribuição de cauda pesada tem caudas mais pesadas do que uma distribuição exponencial (Bryson, 1974)

  • a distribuição é dita ter uma cauda pesada quando a parte da cauda decai mais lentamente do que a distribuição exponencial.
  • porquê exponencial?

    é conveniente usar a distribuição exponencial como referência. O pdf da distribuição exponencial aproxima-se de zero ‘exponencialmente’ rápido. Ou seja, a cauda do pdf parece (mas se comporta de forma diferente) a distribuição exponencial.

    No idioma do gráfico,

    eu vou mostrar 4 tipos diferentes de gráficos que mostram o que acontece no extremo direito caudas de um conjunto de distribuições diferentes como abaixo:

    • distribuição Exponencial (exp)
    • lei de distribuição de Poder (PL)
    • distribuição Normal (N)
    • Log-distribuição Normal (LN).
    • distribuição t-Student
    • distribuição de Cauchy
    • Imposição de distribuição
    • distribuição Weibull

    eu não vou explicar cada uma dessas distribuições. Em vez disso, vamos apenas apreciar o gráfico dessas distribuições para sentir o que está acontecendo na parte da cauda. O primeiro gráfico mostra a parte do gráfico inteiro cujo ‘x’ encontra-se em

    a Figura. 5, R codes for this graph is provided at the end of the document

    With the figure 5 above, we cannot tell how the tail behaves. Mas, aqui estão algumas coisas que vale a pena mencionar

    • distribuições normais, student-t e Cauchy são distribuições de duas caudas. Todos os outros são distribuições de uma cauda
    • para PL (2.5) e PL(3.5), há uma passagem sobre o ponto perto de x=1.7, O que indica que PL(2.5) tem uma cauda mais espessa.

    let’s look at how it looks when ‘ x ‘ lies in . Esteja ciente de que os valores no eixo y ficam muito menores.

    a Figura. 6

    P: O que você vê neste gráfico?

    A: a linha mais alta teria a cauda mais espessa! (Mas não completamente!!!) And you will see why!

    de antemão, vamos examinar os fatos importantes da figura 6 acima.

    • Normal e exp(2) as distribuições estão rastejando perto de 0 quando x=5. Especialmente para a distribuição normal, seu valor pdf de 5 Desvio padrão é 0,000001486 (=pnorm (5)). Isto é cerca de 8.000 vezes menor do que a distribuição de Cauchy. Em outras palavras, 5 eventos sigma são 8000 vezes mais prováveis de acontecer sob a distribuição Cauchy do que a distribuição Normal.
    • na Figura 6, tenha em mente que a distribuição exp(0.2) situa-se muito acima das distribuições normais de log e de power law. Por favor, verifique Como é revertido nos gráficos a seguir, depois de alargar o intervalo de valores ‘x’.

    vamos ver como fica quando ‘ x ‘ está . Mais uma vez, esteja ciente de que os valores no eixo y ficam muito menores.

    a Figura. 7
    • Note que a linha azul exp (0.2) decai rapidamente ao cruzar os outros dois que são PL(2.5) e Cauchy. Isto é o que significa “decai mais lentamente do que a distribuição exponencial”
    • é surpreendente ver o que acontece perto de ‘x’ é igual a 100. Seu valor pdf é de 0,0005. Não admira que o primeiro e o segundo momento (média e variância) sejam infinitos para PL(1.5). Informações detalhadas sobre isso serão cobertas no próximo documento. Fiquem atentos!

    vamos ampliar o eixo y para ver como ele se comporta em detalhes!

    a Figura. 8
    • surpreendentemente, a linha azul exp (0.2) diminui atravessando o PL(3.5) e LN(0,1). Além disso, podemos ver que LN(0,1) decai mais rápido do que PL(3.5) agora que atravessa o PL(3.5) e vai por baixo dele.
    • PL (1.5), PL(2.5) e distribuições de impostos não são sequer indicadas neste gráfico.

    na Linguagem da Matemática,

    a distribuição de cauda gorda é uma subclasse da distribuição de cauda pesada. Significa que, embora toda distribuição de cauda gorda seja de cauda pesada, o reverso não é verdadeiro (por exemplo, Weibull). De acordo com as notas da palestra de Jay Taylor, ele diferenciou o pesado e gordo da seguinte maneira.

    Definição de cauda Pesada

    • Distribuição é a que tem direito pesado de cauda-se caudas “não” de forma exponencial limitado

    Equação 1

    Podemos interpretá-lo como quando ‘x’ fica grande, a velocidade aumentando exponencialmente é mais rápido do que a velocidade de diminuir a probabilidade pesada cauda direita. Leva tempo a pensar nisso!

    veja como ele se conecta à definição inglesa.

    • função de distribuição de probabilidade que decai mais lentamente do que uma exponencial são chamados de cauda pesada direita.

    quando exponencialmente limitado?

    se a cauda direita pesada não é suficientemente pesada, isto é, decai super rápido como ‘x’ vai para o infinito, então a equação 1 converge para zero. O exemplo óbvio é a distribuição uniforme, como já discutimos anteriormente. Uma vez que’ x ‘ excede o um, a probabilidade de X maior que um torna-se zero de modo que ele é exponencialmente limitado. Outro exemplo popular é a distribuição normal. Que o X seja normal. Desenhar uma série de gráficos para diferentes valores de lambda para obter

    a Figura. 3

    podemos ver que converge para zero de modo que as caudas da distribuição normal são exponencialmente limitadas.


    f_exp = function(x, lambda){return (exp(lambda*x))
    cdf_normal = function(x) pnorm(x)
    ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
    plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
    abline(v=1, lty = 'dashed')
    lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
    lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
    lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
    lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
    lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
    grid()
    legend(8, 0.15,
    legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
    col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)

    Definição da cauda gorda

    • Distribuição é a que tem o direito de gordura de cauda-se não é um expoente positivo (alfa), chamado de cauda índice tal que

    O ‘~’ significa o mesmo até constante. Ou a parte da cauda é proporcional à Lei do poder. Precisamente, significa o seguinte.

    Origem : e

    Sinta-se livre para ignorar, se a matemática é ‘pesado/gordura’ para você.

    portanto, a parte de cauda das distribuições de cauda gorda segue uma lei de poder (que é ‘x’ para a potência de menos Alfa). Para aqueles que não estão familiarizados com uma lei de poder, não se preocupem agora. Pense no gráfico quando alfa é igual a dois.

    a Figura. 4

    lembre-se que a parte traseira parece semelhante ao power-law como vimos nas figuras 5-8 acima. Vou explicar a lei do poder em mais detalhes a partir desta série.

    Summary

    we went over the concept ‘fat-tail’ in this document intuitively, graphically, and mathematically. Para compreender a “distribuição estável temperada”, é necessário ter uma compreensão fundamental da cauda gorda. Espero que este documento tenha sido útil para melhorar a sua compreensão. Por favor, comente abaixo se tiver alguma pergunta. Espero que esteja curioso sobre o que virá a seguir. Da próxima vez, estarei de volta com “jornada para distribuição estável temperada””


    f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
    f_power = function (x, k, x_min) {
    C = (k-1)*x_min^(k-1)
    return (C*x^(-k))
    }
    f_cauchy = function(x) dcauchy(x)
    f_levy = function(x) dlevy(x) # required package: 'rmulti'
    f_weibul = function(x) dweibull(x,shape=1)
    f_norm = function(x) dnorm(x)
    f_lnorm = function(x) dlnorm(x)
    f_t = function(x) dt(x,5)
    xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
    main='Distributions on ', cex.main=1,
    xlim=c(0,5),
    ylim=c(0,2.5))
    lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
    lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
    lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
    lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
    lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
    lines(xs,f_norm(xs),col='black', lwd=2)
    lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
    lines(xs,f_t(xs), col='deeppink', lwd=2)
    lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
    lines(xs, f_levy(xs), col='azure4', lwd=2)
    lines(xs, f_weibul(xs), col='springgreen', lwd=2)
    abline(v=2, lty = 'dashed')
    abline(v=3, lty = 'dashed')
    grid()
    legend(3.5, 2.5,
    legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
    col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)

    Jay Taylor, Heavy-tailed distribution (2013), Lecture notes,

    Eric Zivot, Risk Measures (2013), Lecture notes

    Aaron Clauset, inferência, Models and Simulation for Complex Systems (2011), Lecture notes

    https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html

    Deixe uma resposta

    O seu endereço de email não será publicado.