Comprensión de la distribución de cola gorda

En la parte 1, analizamos lo que significa que una variable aleatoria tenga una distribución de «cola gorda».¿

Lejos? ¿Gordo?

Para entender la cola gorda, necesitamos responder las siguientes dos preguntas.

1. ¿Qué tan lejos está?
2. ¿Qué tan gorda es la grasa?

Para hablar de la cola, necesitamos determinar qué tan lejos está lejos para decidir qué tan lejos del centro está lo suficientemente lejos como para decir que es una «cola». En otras palabras, ¿por dónde empieza la cola? Depende! Desafortunadamente, no hay una respuesta única.

Considere la distribución normal. Tenga en cuenta que hay dos colas: derecha e izquierda. Si queremos describir la cola ‘derecha’ de la distribución a partir de la desviación estándar de la media, por ejemplo, entonces la parte sombreada se refiere a la cola derecha de la distribución normal.

Figura. 1

Formalmente, podemos describir la cola de la siguiente manera:

  • cola derecha: P (X>x)
  • cola izquierda : P (X≤ – x)

para un valor grande de ‘x’. Ahora, conocemos el concepto de la «cola».


#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail

¿ cada distribución tiene una cola?

Piense en la distribución uniforme . ¿Tiene cola? En este blog, dice que no todas las distribuciones tienen cola.

Si desea que «el comportamiento de la cola» describa las características del pdf cuando ‘x’ se hace grande, entonces las distribuciones delimitadas no tienen colas. Sin embargo, algunas características de las colas se pueden cuantificar. En particular, al usar límites y comportamiento asintótico, puede definir la noción de colas pesadas. SAS blog

Explicaré la distribución limitada / no limitada (exponencialmente) a continuación. Por favor, recuerde la distribución uniforme cuando llegue allí!

¿Por qué deberíamos preocuparnos por la parte ‘cola’ de la distribución?

La parte de cola de la distribución ha sido la principal preocupación para la gestión de riesgos. Por ejemplo, las dos medidas de riesgo más utilizadas para la distribución de la rentabilidad o la pérdida son el Valor en riesgo (VaR) y el déficit esperado (ES)

¿Por qué la pérdida no es rentable?

  • la pérdida es literalmente menos ( – ) retorno
  • Tomar el límite a infinito negativo no es intuitivo. Así que tomamos el negativo de los valores de retorno, es decir, girando la distribución sobre el eje y.

Simplemente vea cómo la cantidad VaR y ES están relacionadas con ‘tail’. No es necesario entender las matemáticas o el significado detrás de ellos.

» ¡Tenga en cuenta que el siguiente gráfico es una distribución de Pérdida, no Retorno!»

Figura. 2 // Fuente: Ch2, Quantitative Risk Management (en lo sucesivo, QRM) por McNeil et al

Piense en la distribución de la pérdida, L, rendimiento equivalente (negativo), de algún activo durante un período de tenencia dado. Por el bien de la inteligencia, se asume que la variable aleatoria de las pérdidas en el día de mañana sigue la distribución normal:

Entonces, podemos calcular el VaR de la siguiente manera:

Fuente: Notas de conferencia de Eric Zivot

A través de la segunda línea, podemos comprobar fácilmente que el VaR es solo una cantidad relacionada con la cola gorda. Para obtener más detalles sobre el VaR, consulte el capítulo dos del libro «Quantitative Risk Management: Concepts, Techniques and Tools» y la nota de conferencia de Eric Zivot en su sitio web.

alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)

del mismo modo, podemos ver que espera que el déficit es una cantidad relativa a la parte trasera de la distribución:

Fuente: Notas de conferencia de Eric Zivot

En la cuarta línea, dice » ES es la pérdida esperada en la «cola» superior de la distribución de pérdidas. Similar a VaR, en el caso de la distribución normal, es conveniente calcular la ES ahora que es solo una media de distribución normal truncada.

Fuente: Notas de la Conferencia de Eric Zivot

alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))

Si alguien tiene curiosidad sobre por qué dividimos por 1-α, esto es solo una constante de normalización (o factor de escala) para asegurarse de que la integración de la distribución de pérdida truncada sea una, lo que es un requisito para que sea una distribución de probabilidad.

Volviendo a la historia de ‘tail’, solo quería enfatizar que las distribuciones tail se usan ampliamente como herramienta de gestión de riesgos.

¿Qué tan grasa es la grasa? ¿Qué tan pesado es Pesado?

Ya que descubrimos qué es la ‘ cola ‘en la distribución y dónde se usa, ahora es el momento de hablar de la parte’ gorda’. Todos sabemos que la distribución normal no tiene cola gorda. En su lugar, se nos enseñó a usar la distribución student-t y la distribución normal log al modelar la serie de rendimiento financiero para tener en cuenta la propiedad ‘cola gorda’. Pero necesitamos saber la definición de cola gorda. Desafortunadamente, no hay una definición universal para el término grasa.

Intentaré explicar la cola gorda en el idioma inglés, Gráfico y Matemáticas. Espero que disfrutes al menos de uno de los tres.

  • Una distribución de cola pesada tiene colas que son más pesadas que una distribución exponencial (Bryson, 1974)
  • Se dice que la distribución tiene una cola pesada cuando la parte de la cola decae más lentamente que la distribución exponencial.

¿Por qué exponencial?

Es conveniente utilizar la distribución exponencial como referencia. El pdf de la distribución exponencial se acerca a cero ‘exponencialmente’ rápidamente. Es decir, la cola del pdf se parece (pero se comporta de manera diferente) a la distribución exponencial.

En el lenguaje de graph,

Le mostraré 4 gráficos diferentes que muestran lo que sucede en las colas de la extrema derecha de un conjunto de distribuciones diferentes como se muestra a continuación:

  • Distribución exponencial (exp)
  • Distribución de ley de potencia (PL)
  • Distribución normal (N)
  • Distribución Log-Normal (LN)
  • Distribución Student-t
  • Distribución Cauchy
  • Distribución Levy
  • Distribución Weibull

No explicaré cada una de estas distribuciones. En su lugar, disfrutemos del gráfico de estas distribuciones para sentir lo que está pasando en la parte de cola. El primer gráfico muestra la parte de la totalidad de la gráfica, cuya ‘x’ se encuentra en

Figura. 5, los códigos R para este gráfico se proporcionan al final del documento

Con la figura 5 anterior, no podemos decir cómo se comporta la cola. Pero, aquí hay algunas cosas que vale la pena mencionar

  • Las distribuciones Normales, student-t y Cauchy son distribuciones de dos colas. Todas las demás son distribuciones de una cola
  • Para PL (2.5) y PL(3.5), hay un punto de cruce cerca de x=1.7, lo que indica que PL(2.5) tiene una cola más gruesa.

Veamos cómo se ve cuando se encuentra ‘x’. Tenga en cuenta que los valores en el eje y se vuelven mucho más pequeños.

Figura. 6

P: ¿Qué ves en este gráfico?

A: ¡La línea más alta tendría la cola más gruesa! (Pero no del todo!!! Y verás por qué!

De antemano, examinemos los hechos importantes de la figura 6 anterior.

  • Las distribuciones Normal y exp(2) se arrastran cerca de 0 cuando x=5. Especialmente para la distribución normal, su valor pdf de 5 desviación estándar es 0.000001486 (=pnorm(5)). Esto es alrededor de 8000 veces más pequeño que el de la distribución de Cauchy. En otras palabras, los eventos 5 sigma tienen 8000 veces más probabilidades de ocurrir bajo la distribución de Cauchy que la distribución normal.
  • En la figura 6, tenga en cuenta que la distribución exp(0.2) se ubica muy por encima de la distribución normal de registro y las distribuciones de leyes de potencia. Compruebe cómo se invierte en los siguientes gráficos después de ampliar el rango de valores ‘x’.

Veamos cómo se ve cuando se encuentra’ x’. Una vez más, tenga en cuenta que los valores en el eje y se vuelven mucho más pequeños.

Figura. 7
  • Tenga en cuenta que la línea azul exp(0.2) decae rápidamente al cruzar las otras dos que son PL(2.5) y Cauchy. Esto es lo que quiere decir con» decae más lento que la distribución exponencial «
  • Es sorprendente ver lo que sucede cerca de ‘ x ‘ es igual a 100. Su valor pdf de PL(1.5) es 0.0005. No es de extrañar que el primer y segundo momento(media y varianza) sean infinitos para PL (1.5). La información detallada al respecto se tratará en el siguiente documento. ¡Estén atentos!

¡Ampliemos el eje y para ver cómo se comporta en detalle!

Figura. 8
  • Sorprendentemente, la línea azul exp(0,2) disminuye al cruzar la PL(3,5) y la LN(0,1). Además, podemos ver que LN(0,1) decae más rápido que PL(3.5) ahora que cruza el PL (3.5) y pasa por debajo de él.
  • PL(1.5), PL(2.5) y distribuciones de gravámenes ni siquiera se muestran en este gráfico.

En el lenguaje de las matemáticas,

La distribución de cola gorda es una subclase de la distribución de cola pesada. Significa que aunque cada distribución de cola gorda es de cola pesada, lo contrario no es cierto (por ejemplo, Weibull). De acuerdo con las notas de la conferencia de Jay Taylor, diferenció lo pesado y lo gordo de la siguiente manera.

Definición de Cola pesada

  • Se dice que la distribución tiene una cola pesada derecha si las colas no están «delimitadas» exponencialmente

Ecuación 1

Podemos interpretarlo como cuando ‘ x ‘ se hace grande, la velocidad de aumento exponencial es más rápida que la velocidad de disminución de probabilidad en la cola derecha pesada. ¡Tómate el tiempo para pensarlo!

Vea cómo se conecta a la definición en inglés.

  • La función de distribución de probabilidad que decae más lentamente que una exponencial se llama cola pesada derecha.

Cuando exponencialmente limitada?

Si la cola derecha pesada no es lo suficientemente pesada, es decir, se descompone súper rápido cuando ‘ x ‘ llega al infinito, entonces la ecuación 1 converge a cero. El ejemplo obvio es la distribución uniforme como hemos discutido anteriormente. Una vez que’ x ‘ excede el uno, la probabilidad de X mayor que uno se convierte en cero de modo que está limitado exponencialmente. Otro ejemplo popular es la distribución normal. Sea X una normal estándar. Dibujar una serie de gráficos para los diferentes valores de lambda para obtener

Figura. 3

Podemos ver que converge a cero para que las colas de la distribución normal estén limitadas exponencialmente.


f_exp = function(x, lambda){return (exp(lambda*x))
cdf_normal = function(x) pnorm(x)
ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
abline(v=1, lty = 'dashed')
lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
grid()
legend(8, 0.15,
legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)

Definición de cola gorda

  • Se dice que la distribución tiene una cola gorda derecha si hay un exponente positivo (alfa) llamado índice de cola tal que

El ‘ ~ ‘ significa igual hasta constante. O la parte de cola es proporcional a la ley de potencia. Precisamente, significa lo siguiente.

Fuente : y

Siéntase libre saltar si la matemática es «pesado/grasa’ para usted.

Por lo tanto, la parte de cola de las distribuciones de cola gorda sigue una ley de potencia (que es ‘x’ a la potencia de menos alfa). Para aquellos que no están familiarizados con una ley de poder, no se preocupen ahora. Piense en el gráfico cuando alfa es igual a dos.

Figura. 4

Recuerde que la parte de la cola se ve similar a la ley de poder, como hemos visto en las figuras 5-8 anteriores. Explicaré la ley del poder con más detalle de esta serie.

Resumen

Repasamos el concepto ‘cola gorda’ en este documento de manera intuitiva, gráfica y matemática. Para entender la ‘distribución estable templada’, es necesario tener una comprensión fundamental de la cola gorda. Espero que este documento haya sido útil para mejorar su comprensión. Por favor, comente a continuación si tiene alguna pregunta. Espero que tenga curiosidad sobre lo que vendrá a continuación. La próxima vez, volveré con «Viaje a la Distribución Estable Templada»


f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
f_power = function (x, k, x_min) {
C = (k-1)*x_min^(k-1)
return (C*x^(-k))
}
f_cauchy = function(x) dcauchy(x)
f_levy = function(x) dlevy(x) # required package: 'rmulti'
f_weibul = function(x) dweibull(x,shape=1)
f_norm = function(x) dnorm(x)
f_lnorm = function(x) dlnorm(x)
f_t = function(x) dt(x,5)
xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
main='Distributions on ', cex.main=1,
xlim=c(0,5),
ylim=c(0,2.5))
lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
lines(xs,f_norm(xs),col='black', lwd=2)
lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
lines(xs,f_t(xs), col='deeppink', lwd=2)
lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
lines(xs, f_levy(xs), col='azure4', lwd=2)
lines(xs, f_weibul(xs), col='springgreen', lwd=2)
abline(v=2, lty = 'dashed')
abline(v=3, lty = 'dashed')
grid()
legend(3.5, 2.5,
legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)

Jay Taylor, Distribución de cola pesada (2013), Notas de clase,

Eric Zivot, Medidas de riesgo (2013), Notas de clase

Aaron Clauset, Inferencia, Modelos y Simulación para Sistemas Complejos (2011), Notas de clase

https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html

Deja una respuesta

Tu dirección de correo electrónico no será publicada.