pochopení distribuce tuku

v části 1 diskutujeme, co to znamená pro náhodnou proměnnou mít distribuci“ tuku-ocas“.

daleko? Tlustý?

abychom porozuměli tlustému ocasu, musíme odpovědět na následující dvě otázky.

1. Jak daleko je daleko?
2. Jak tuk je tuk?

mluvit o ocasu, musíme určit, jak daleko je, daleko se rozhodnout, jak daleko od středu je dost daleko na to říct ‚ocas‘. Jinými slovy, kde začíná ocas? To záleží! Bohužel neexistuje jediná odpověď.

zvažte normální rozdělení. Všimněte si, že existují dva ocasy: vpravo a vlevo. Chceme-li například popsat „pravý“ ocas rozdělení z jedné směrodatné odchylky od průměru, pak stínovaná část odkazuje na pravý ocas normálního rozdělení.

obrázek. 1

Formálně můžeme popsat ocas takto:

  • správný ocas : P(X>x)
  • ocas : P(X≤-x)

pro velké hodnoty „x“. Nyní známe pojem „ocas“.


#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail

má každá distribuce ocas?

Zamyslete se nad rovnoměrným rozdělením . Má ocas? V tomto blogu, říká, že ne každá distribuce má ocas.

Pokud chcete „chování ocas“, aby popsal vlastnosti pdf, když se ‚x‘ dostane velké, pak ohraničené distribuce nemají ocasy. Některé rysy ocasu však lze kvantifikovat. Zejména pomocí limitů a asymptotického chování můžete definovat pojem těžkých ocasů. SAS blog

vysvětlím níže (exponenciálně)ohraničené / neomezené rozdělení. Prosím, připomeňte si jednotné rozdělení, když se tam dostanete!

proč bychom se měli starat o „ocasní“ část distribuce?

zadní část distribuce byla hlavním zájmem o řízení rizik. Například dvě nejpoužívanější riziková opatření pro rozdělení návratnosti nebo ztráty jsou hodnota v riziku (Var) a očekávaný schodek (ES)

proč se ztráta nevrací?

  • ztráta je doslova mínus (-) návrat
  • přijetí limitu na záporné nekonečno je neintuitivní. Takže vezmeme mínus návratových hodnot, tj. otáčení distribuce přes osu y.

jen se podívejte, jak množství VaR a ES souvisí s „ocasem“. Nemusíte rozumět matematice nebo významu za nimi.

“ uvědomte si, že níže uvedený graf je rozdělení ztráty, které se nevrátí!“

obrázek. 2 / / Zdroj: Ch2, Kvantitativní Risk Management (dále QRM) McNeil et al

Myslím, že o rozložení hmotnosti, L, ekvivalentně (negativní) vrátit, na některých aktiv za dané udržovací období. Za účelem pochopení, budeme předpokládat, že náhodná proměnná ztrát na zítra následuje normální rozdělení:

Pak můžeme vypočítat VaR následujícím způsobem:

Zdroj: Poznámky k přednášce Erica zivota

prostřednictvím druhého řádku můžeme snadno zkontrolovat, že VaR je pouze množství související s tukovým ocasem. Další podrobnosti o VaR naleznete v druhé kapitole knihy „kvantitativní řízení rizik: koncepty, techniky a nástroje“ a přednášková poznámka Erica zivota na jeho webových stránkách.

alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)

Podobně, můžeme vidět, že očekává, že schodek je veličina vztahující se k ocasní části distribuce:

Zdroj: Poznámky k přednášce Erica zivota

ve čtvrtém řádku se říká: „ES je očekávaná ztráta v horním „ocasu“ rozdělení ztrát. Podobně jako VaR, v případě normálního rozdělení je vhodné vypočítat ES nyní, když se jedná pouze o průměr zkráceného normálního rozdělení.

zdroj: Eric Život je skripta

alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))

Pokud někdo zvědavý o tom, proč dělíme výrazem 1 — α , je to jen normalizační konstanta (nebo faktor měřítka), aby se ujistil, že integrace redukované ztráty distribuce je ten, který je podmínkou pro to, aby se rozdělení pravděpodobnosti.

zpět k příběhu „ocasu“ jsem chtěl jen zdůraznit, že distribuce ocasu jsou široce používány jako nástroj pro řízení rizik.

jak tuk je tuk? Jak těžké je těžké?

protože jsme zjistili, co je „ocas“ v distribuci a kde se používá, nyní je čas mluvit o „tukové“ části. Všichni víme, že normální distribuce nemá tučný ocas. Místo toho jsme se učili používat student-t rozdělení a lognormální rozdělení při modelování finanční návratnost série zohlednit ‚fat-tail‘ majetku. Ale musíme znát definici tučného ocasu. Bohužel neexistuje univerzální definice pojmu tuk.

pokusím se vysvětlit tuk-ocas v jazyce angličtiny, grafu a matematiky. Doufám, že si alespoň jeden ze tří.

  • těžký sledoval distribuci má ocasy, které jsou těžší než exponenciální rozdělení (Bryson, 1974)
  • Distribuce je řekl, aby měl těžký ocas, když se ocasní část se rozkládá pomaleji než exponenciální rozdělení.

proč exponenciální?

je vhodné použít exponenciální rozdělení jako referenci. Pdf exponenciální distribuce se blíží nule „exponenciálně“ rychle. To znamená, že ocas pdf vypadá (ale chová se jinak než) exponenciální rozdělení.

V jazyce graf,

ukážu vám 4 různé grafy, které ukazují, co se stane v pravé ocasy sada různých distribucí, jako je níže:

  • Exponenciální rozdělení (exp)
  • Power-law distribuce (PL)
  • Normální rozdělení (N)
  • Log-Normální rozdělení (LN)
  • Student-t distribuce
  • Cauchyho rozdělení,
  • Levy distribuce
  • Weibullova rozdělení

nebudu vysvětlovat, každý z těchto distribucí. Místo toho si užijme graf těchto distribucí, abychom cítili, co se děje v ocasní části. První graf ukazuje součástí celého grafu, jehož “ x “ spočívá v

Obr. 5, R kódy pro tento graf je uveden na konci dokumentu

S obrázek 5 výše, nemůžeme říct, jak ocas chová. Ale, zde je několik věcí, které stojí za zmínku,

  • Normální, student-t a Cauchyho rozdělení jsou dva-sledoval distribucemi. Všechny ostatní jsou jedním sledoval distribucemi
  • Pro PL(2.5) a PL(3.5), tam je přechod přes bod u x=1.7, což znamená, že PL(2.5) má silnější ocas.

podívejme se, jak to vypadá, když leží ‚x‘. Uvědomte si, že hodnoty v ose y jsou mnohem menší.

obrázek. 6

otázka: co vidíte v tomto grafu?

A: nejvíce horní linie by měla nejsilnější ocas! (Ale ne tak docela!!!) A uvidíte proč!

předem se podívejme na důležitá fakta z obrázku 6 výše.

  • normální a exp(2) distribuce se plazí poblíž 0, když x=5. Zejména pro normální rozdělení je jeho hodnota pdf 5 směrodatná odchylka 0,000001486 (=pnorm (5)). To je asi 8000 krát menší než u distribuce Cauchy. Jinými slovy, 5 sigma události jsou 8000 krát větší pravděpodobnost, že se stane v rámci Cauchy distribuce než normální distribuce.
  • Na obrázku 6, mějte na paměti, že exp(0.2) distribuce najde způsob, jak nad log normální rozdělení a výkon práva distribuce. Zkontrolujte, jak se v následujících grafech změní po rozšíření rozsahu hodnot „x“.

podívejme se, jak to vypadá, když leží ‚x‘. Opět si uvědomte, že hodnoty v ose y jsou mnohem menší.

obrázek. 7
  • Všimněte si, že modrá čára exp (0.2) se rychle rozpadá při překročení dalších dvou, které jsou PL(2.5) a Cauchy. To znamená „rozpadá se pomaleji než exponenciální distribuce“
  • je překvapivé vidět, co se děje poblíž “ x “ se rovná 100. Jeho hodnota pdf PL (1.5) je 0.0005. Není divu, že první a druhý okamžik (průměr a rozptyl) jsou nekonečné pro PL (1.5). Podrobné informace o tom budou uvedeny v dalším dokumentu. Zůstaňte naladěni!

pojďme přiblížit osu y, abychom viděli, jak se chová podrobně!

obrázek. 8
  • překvapivě modrá čára exp (0,2) klesá překročením pl (3,5) a LN (0,1). Také můžeme vidět, že LN(0,1) se rozpadá rychleji než PL(3.5), když překročí PL (3.5) a jde pod ním.
  • PL(1.5), pl (2.5) a Levy distribuce nejsou ani zobrazeny v tomto grafu.

v jazyce matematiky je

distribuce tlustého ocasu podtřídou distribuce těžkého ocasu. To znamená, že ačkoli každá distribuce tuku je těžká, opak není pravdou (např. Weibull). Podle přednášek Jay Taylora rozlišoval těžké a tlusté následujícím způsobem.

Definice Těžký ocas

  • Distribuce je řekl, aby měl právo heavy-tail, pokud ocasy jsou „ne“ exponenciálně omezená

Rovnice 1

Můžeme ji interpretovat jako když se ‚x‘ dostane velký, rychlost exponenciálně zvyšuje, je rychlejší než rychlost snižuje pravděpodobnost těžkých správný ocas. Udělejte si čas na přemýšlení!

podívejte se, jak se připojuje k anglické definici.

  • funkce distribuce pravděpodobnosti, která se rozkládá pomaleji než exponenciál, se nazývá pravý těžký ocas.

když je exponenciálně ohraničen?

v Případě, že těžká doprava ocas není dost těžký, tj. přeměňuje se super rychle, jak ‚x‘ jde k nekonečnu, pak rovnice 1 konverguje k nule. Zřejmým příkladem je rovnoměrné rozdělení, jak jsme diskutovali výše. Jakmile ‚ x ‚ překročí jedničku, pravděpodobnost X větší než jedna se stane nulovou, takže je exponenciálně ohraničená. Dalším populárním příkladem je normální distribuce. Nechť X je standardní normál. Nakreslete sérii grafů pro různé hodnoty lambda dostat

Obr. 3

vidíme, že konverguje k nule, takže ocasy normálního rozdělení jsou exponenciálně ohraničeny.


f_exp = function(x, lambda){return (exp(lambda*x))
cdf_normal = function(x) pnorm(x)
ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
abline(v=1, lty = 'dashed')
lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
grid()
legend(8, 0.15,
legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)

Definice ocas tuku

  • Distribuce je řekl, aby měl právo tuku ocas, pokud je kladný exponent (alfa) nazývá ocas index takový, že

‚~‘ Znamená stejný až na konstantu. Nebo ocasní část je úměrná mocenskému zákonu. Přesně to znamená následující.

Zdroj : a

klidně přeskočit, pokud je matematika ‚heavy/tuku.

ocasní část rozdělení tuku se proto řídí mocninovým zákonem (což je “ x “ na mocninu minus alfa). Pro ty, kteří nejsou obeznámeni s mocenským zákonem, nebojte se teď. Představte si graf, když se alfa rovná dvěma.

obrázek. 4

Připomeňte si, že ocasní část vypadá podobně jako power-law, jak jsme viděli na obrázcích 5-8 výše. Podrobněji vysvětlím mocenské právo z této série.

shrnutí

v tomto dokumentu jsme intuitivně, graficky a matematicky prošli konceptem „tlustý ocas“. Abychom porozuměli „temperované stabilní distribuci“, je nutné mít základní znalosti o tlustém ocasu. Doufám, že tento dokument byl užitečný pro zlepšení vašeho porozumění. Prosím komentář níže, pokud máte nějaké dotazy. Doufám, že jste zvědaví, co přijde dál. Příště už bude zpátky s „Cesta na Tvrzené Stabilní Distribuce“


f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
f_power = function (x, k, x_min) {
C = (k-1)*x_min^(k-1)
return (C*x^(-k))
}
f_cauchy = function(x) dcauchy(x)
f_levy = function(x) dlevy(x) # required package: 'rmulti'
f_weibul = function(x) dweibull(x,shape=1)
f_norm = function(x) dnorm(x)
f_lnorm = function(x) dlnorm(x)
f_t = function(x) dt(x,5)
xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
main='Distributions on ', cex.main=1,
xlim=c(0,5),
ylim=c(0,2.5))
lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
lines(xs,f_norm(xs),col='black', lwd=2)
lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
lines(xs,f_t(xs), col='deeppink', lwd=2)
lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
lines(xs, f_levy(xs), col='azure4', lwd=2)
lines(xs, f_weibul(xs), col='springgreen', lwd=2)
abline(v=2, lty = 'dashed')
abline(v=3, lty = 'dashed')
grid()
legend(3.5, 2.5,
legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)

Jay Taylor, Heavy-tailed distribuce (2013), Lecture notes,

Eric Život, Opatření proti Riziku (2013), Lecture notes

Aaron Clauset, Inference, Modely a Simulace pro Komplexní Systémy (2011), skripta

https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.