na parte 1, discutimos o que significa para uma variável aleatória ter uma distribuição de cauda gorda.
- longe? Gordo?Para entender a cauda gorda, precisamos responder às duas perguntas seguintes. 1. A que distância fica?2. Quão gorda é a gordura?
- cada distribuição tem uma cauda?
- por que razão a perda não é devolvida?
- porquê exponencial?
- No idioma do gráfico,
- P: O que você vê neste gráfico?
- vamos ampliar o eixo y para ver como ele se comporta em detalhes!
- na Linguagem da Matemática,
- Definição de cauda Pesada
- quando exponencialmente limitado?
- Definição da cauda gorda
- Summary
longe? Gordo?Para entender a cauda gorda, precisamos responder às duas perguntas seguintes.
1. A que distância fica?
2. Quão gorda é a gordura?
1. A que distância fica?
2. Quão gorda é a gordura?
Para falar sobre a cauda, precisamos determinar o quão longe é longe para decidir o quão longe do meio é o suficiente para dizer um ‘rabo’. Por outras palavras, onde começa a cauda? Depende! Infelizmente, não há uma única resposta.
considere a distribuição normal. Note que há duas caudas: direita e esquerda. Se queremos descrever a cauda “direita” da distribuição a partir do desvio padrão único da média, por exemplo, então a parte sombreada refere-se à cauda direita da distribuição normal.
Formalmente, podemos descrever a cauda da seguinte forma:
- cauda direita : P(X>x)
- cauda esquerda : P(X≤-x)
para um grande valor de ‘x’. Agora, conhecemos o conceito de “cauda”.
#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail
cada distribuição tem uma cauda?
pense sobre a distribuição uniforme sobre . Tem cauda? Neste blog, diz que nem todas as distribuições têm cauda.
If you want “the behavior of the tail” to describe the characteristics of the pdf when ‘ x ‘ gets large, then bounded distributions do not have tails. No entanto, algumas características das caudas podem ser quantificadas. Em particular, usando limites e comportamento assintótico você pode definir a noção de caudas pesadas. SAS blog
vou explicar a distribuição (exponencialmente) limitada / não limitada abaixo. Por favor, lembre-se da distribuição de uniformes quando chegar lá!Por que devemos nos preocupar com a parte “cauda” da distribuição?
a parte final da distribuição tem sido a principal preocupação para a gestão do risco. Por exemplo, as duas medidas de risco mais utilizadas para a distribuição da rendibilidade ou perda são o valor em risco (VaR) e o défice (ES) previsto (s)
por que razão a perda não é devolvida?
- perda é literalmente menos (-) retorno
- tomar o limite para o infinito negativo é não-intuitivo. Assim, tomamos o negativo dos valores de retorno, isto é, girando a distribuição sobre o eixo Y.
apenas veja como a quantidade VaR e ES estão relacionadas com a “cauda”. Não precisa entender a matemática ou o significado por trás deles.
” esteja ciente de que o gráfico abaixo é uma distribuição de perda não retorno!”
Think about distribution of loss, L, equivalent (negative) return, on some asset over a given holding period. Para fins de entendimento, vamos supor que a variável aleatória de perdas de amanhã segue a distribuição normal:
Então, podemos calcular o VaR da seguinte forma:
Through the second line, we can easily check that the VaR is just a quantity related to the fat tail. Para mais detalhes sobre o VaR, consulte o capítulo dois do livro “Quantitative Risk Management: Concepts, Techniques and Tools” e a nota de leitura de Eric Zivot em seu site.
alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)
da mesma forma, podemos ver que o esperado carência é uma quantidade relacionadas com a parte da cauda da distribuição:
na quarta linha, diz que ” ES é a perda esperada na “cauda” superior da distribuição de perdas. Semelhante ao VaR, no caso de distribuição normal, é conveniente calcular o ES agora que é apenas uma média de distribuição normal truncada.
alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))
se alguém curioso sobre por que nós dividimos por 1-α, isto é apenas uma constante normalizadora (ou fator de escala) para se certificar de que a integração da distribuição de perda truncada é uma, o que é um requisito para que ela seja uma distribuição de probabilidade.De volta à história de “cauda”, eu só queria enfatizar que as distribuições de cauda são amplamente utilizadas como ferramenta de gerenciamento de risco.Como é que a gordura é gorda? Quão pesado é?
uma vez que descobrimos o que a ‘cauda’ está na distribuição e onde é usada, agora é hora de falar sobre a parte ‘gordura’. Todos sabemos que a distribuição normal não tem rabo gordo. Em vez disso, fomos ensinados a usar a distribuição student-t e logar a distribuição normal ao modelar a série de retorno financeiro para levar em conta a propriedade “fat-tail”. Mas precisamos de saber a definição de rabo gordo. Infelizmente, não existe uma definição universal para o termo gordura.
vou tentar explicar a cauda gorda na linguagem do inglês, grafo e Matemática. Espero que aprecies pelo menos um dos três.Uma distribuição de cauda pesada tem caudas mais pesadas do que uma distribuição exponencial (Bryson, 1974)
porquê exponencial?
é conveniente usar a distribuição exponencial como referência. O pdf da distribuição exponencial aproxima-se de zero ‘exponencialmente’ rápido. Ou seja, a cauda do pdf parece (mas se comporta de forma diferente) a distribuição exponencial.
No idioma do gráfico,
eu vou mostrar 4 tipos diferentes de gráficos que mostram o que acontece no extremo direito caudas de um conjunto de distribuições diferentes como abaixo:
- distribuição Exponencial (exp)
- lei de distribuição de Poder (PL)
- distribuição Normal (N)
- Log-distribuição Normal (LN).
- distribuição t-Student
- distribuição de Cauchy
- Imposição de distribuição
- distribuição Weibull
eu não vou explicar cada uma dessas distribuições. Em vez disso, vamos apenas apreciar o gráfico dessas distribuições para sentir o que está acontecendo na parte da cauda. O primeiro gráfico mostra a parte do gráfico inteiro cujo ‘x’ encontra-se em
With the figure 5 above, we cannot tell how the tail behaves. Mas, aqui estão algumas coisas que vale a pena mencionar
- distribuições normais, student-t e Cauchy são distribuições de duas caudas. Todos os outros são distribuições de uma cauda
- para PL (2.5) e PL(3.5), há uma passagem sobre o ponto perto de x=1.7, O que indica que PL(2.5) tem uma cauda mais espessa.
let’s look at how it looks when ‘ x ‘ lies in . Esteja ciente de que os valores no eixo y ficam muito menores.
P: O que você vê neste gráfico?
A: a linha mais alta teria a cauda mais espessa! (Mas não completamente!!!) And you will see why!
de antemão, vamos examinar os fatos importantes da figura 6 acima.
- Normal e exp(2) as distribuições estão rastejando perto de 0 quando x=5. Especialmente para a distribuição normal, seu valor pdf de 5 Desvio padrão é 0,000001486 (=pnorm (5)). Isto é cerca de 8.000 vezes menor do que a distribuição de Cauchy. Em outras palavras, 5 eventos sigma são 8000 vezes mais prováveis de acontecer sob a distribuição Cauchy do que a distribuição Normal.
- na Figura 6, tenha em mente que a distribuição exp(0.2) situa-se muito acima das distribuições normais de log e de power law. Por favor, verifique Como é revertido nos gráficos a seguir, depois de alargar o intervalo de valores ‘x’.
vamos ver como fica quando ‘ x ‘ está . Mais uma vez, esteja ciente de que os valores no eixo y ficam muito menores.
- Note que a linha azul exp (0.2) decai rapidamente ao cruzar os outros dois que são PL(2.5) e Cauchy. Isto é o que significa “decai mais lentamente do que a distribuição exponencial”
- é surpreendente ver o que acontece perto de ‘x’ é igual a 100. Seu valor pdf é de 0,0005. Não admira que o primeiro e o segundo momento (média e variância) sejam infinitos para PL(1.5). Informações detalhadas sobre isso serão cobertas no próximo documento. Fiquem atentos!
vamos ampliar o eixo y para ver como ele se comporta em detalhes!
- surpreendentemente, a linha azul exp (0.2) diminui atravessando o PL(3.5) e LN(0,1). Além disso, podemos ver que LN(0,1) decai mais rápido do que PL(3.5) agora que atravessa o PL(3.5) e vai por baixo dele.
- PL (1.5), PL(2.5) e distribuições de impostos não são sequer indicadas neste gráfico.
na Linguagem da Matemática,
a distribuição de cauda gorda é uma subclasse da distribuição de cauda pesada. Significa que, embora toda distribuição de cauda gorda seja de cauda pesada, o reverso não é verdadeiro (por exemplo, Weibull). De acordo com as notas da palestra de Jay Taylor, ele diferenciou o pesado e gordo da seguinte maneira.
Definição de cauda Pesada
- Distribuição é a que tem direito pesado de cauda-se caudas “não” de forma exponencial limitado
Podemos interpretá-lo como quando ‘x’ fica grande, a velocidade aumentando exponencialmente é mais rápido do que a velocidade de diminuir a probabilidade pesada cauda direita. Leva tempo a pensar nisso!
veja como ele se conecta à definição inglesa.
- função de distribuição de probabilidade que decai mais lentamente do que uma exponencial são chamados de cauda pesada direita.
quando exponencialmente limitado?
se a cauda direita pesada não é suficientemente pesada, isto é, decai super rápido como ‘x’ vai para o infinito, então a equação 1 converge para zero. O exemplo óbvio é a distribuição uniforme, como já discutimos anteriormente. Uma vez que’ x ‘ excede o um, a probabilidade de X maior que um torna-se zero de modo que ele é exponencialmente limitado. Outro exemplo popular é a distribuição normal. Que o X seja normal. Desenhar uma série de gráficos para diferentes valores de lambda para obter
podemos ver que converge para zero de modo que as caudas da distribuição normal são exponencialmente limitadas.
f_exp = function(x, lambda){return (exp(lambda*x))
cdf_normal = function(x) pnorm(x)
ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
abline(v=1, lty = 'dashed')
lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
grid()
legend(8, 0.15,
legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)
Definição da cauda gorda
- Distribuição é a que tem o direito de gordura de cauda-se não é um expoente positivo (alfa), chamado de cauda índice tal que
O ‘~’ significa o mesmo até constante. Ou a parte da cauda é proporcional à Lei do poder. Precisamente, significa o seguinte.
Sinta-se livre para ignorar, se a matemática é ‘pesado/gordura’ para você.
portanto, a parte de cauda das distribuições de cauda gorda segue uma lei de poder (que é ‘x’ para a potência de menos Alfa). Para aqueles que não estão familiarizados com uma lei de poder, não se preocupem agora. Pense no gráfico quando alfa é igual a dois.
lembre-se que a parte traseira parece semelhante ao power-law como vimos nas figuras 5-8 acima. Vou explicar a lei do poder em mais detalhes a partir desta série.
Summary
we went over the concept ‘fat-tail’ in this document intuitively, graphically, and mathematically. Para compreender a “distribuição estável temperada”, é necessário ter uma compreensão fundamental da cauda gorda. Espero que este documento tenha sido útil para melhorar a sua compreensão. Por favor, comente abaixo se tiver alguma pergunta. Espero que esteja curioso sobre o que virá a seguir. Da próxima vez, estarei de volta com “jornada para distribuição estável temperada””
f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
f_power = function (x, k, x_min) {
C = (k-1)*x_min^(k-1)
return (C*x^(-k))
}
f_cauchy = function(x) dcauchy(x)
f_levy = function(x) dlevy(x) # required package: 'rmulti'
f_weibul = function(x) dweibull(x,shape=1)
f_norm = function(x) dnorm(x)
f_lnorm = function(x) dlnorm(x)
f_t = function(x) dt(x,5)
xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
main='Distributions on ', cex.main=1,
xlim=c(0,5),
ylim=c(0,2.5))
lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
lines(xs,f_norm(xs),col='black', lwd=2)
lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
lines(xs,f_t(xs), col='deeppink', lwd=2)
lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
lines(xs, f_levy(xs), col='azure4', lwd=2)
lines(xs, f_weibul(xs), col='springgreen', lwd=2)
abline(v=2, lty = 'dashed')
abline(v=3, lty = 'dashed')
grid()
legend(3.5, 2.5,
legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)
Jay Taylor, Heavy-tailed distribution (2013), Lecture notes,
Eric Zivot, Risk Measures (2013), Lecture notes
Aaron Clauset, inferência, Models and Simulation for Complex Systems (2011), Lecture notes
https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html