forståelse af fedt-tailed Distribution

I del 1 diskuterer vi, hvad det betyder for en tilfældig variabel at have en “fedt-hale” fordeling.

langt? Fedt?

for at forstå Fedthalen skal vi besvare følgende to spørgsmål.

1. Hvor langt er langt?
2. Hvor fedt er fedt?

For at tale om halen skal vi bestemme, hvor langt der er langt for at beslutte, hvor langt fra midten der er langt nok til at sige det en ‘hale’. Med andre ord, hvor starter halen? Det afhænger! Desværre er der ikke noget enkelt svar.

overvej normalfordelingen. Bemærk at der er to haler: højre og venstre. Hvis vi vil beskrive den ‘højre’ hale af fordelingen fra den ene standardafvigelse fra gennemsnittet, henviser den skraverede del til den højre hale af normalfordelingen.

figur. 1

formelt kan vi beskrive halen som følger:

  • højre hale: P (>)
  • venstre hale: P (

for en stor værdi af ‘H’. Nu kender vi begrebet ‘hale’.


#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail

har hver distribution en hale?

tænk på den ensartede fordeling over . Har den en hale? I denne blog står det ikke, at hver distribution har en hale.

Hvis du vil have “opførsel af halen” til at beskrive egenskaberne ved pdf ‘en, når’ h ‘ bliver stor, har afgrænsede distributioner ikke haler. Ikke desto mindre kan nogle funktioner i haler kvantificeres. Især ved at bruge grænser og asymptotisk adfærd kan du definere begrebet tunge haler. SAS blog

Jeg vil forklare den (eksponentielt) afgrænsede / ikke afgrænsede fordeling nedenfor. Husk dig selv på den ensartede fordeling, når du kommer derhen!

hvorfor skal vi bekymre os om ‘hale’ – delen af distributionen?

den bageste del af distributionen har været den største bekymring for risikostyring. For eksempel er de to mest anvendte risikomål til fordeling af afkast eller tab Value at Risk (VaR) og forventet underskud (er)

hvorfor tab ikke vender tilbage?

  • tab er bogstaveligt talt minus (-) afkast
  • at tage grænsen til negativ uendelighed er ikke-intuitiv. Så vi tager det negative af returværdier, dvs.at dreje fordelingen over y-aksen.

bare se, hvordan mængden VaR og ES er relateret til ‘hale’. Behøver ikke at forstå matematikken eller betydningen bag dem.

” vær opmærksom på, at nedenstående graf er en fordeling af tab ikke vende tilbage!”

figur. 2 / / kilde: Ch2, kvantitativ risikostyring (herefter KRM) af McNeil et al

tænk på fordeling af tab, l, ækvivalent (negativt) afkast på et eller andet aktiv over en given beholdningsperiode. Af hensyn til forståelsen antager vi, at den tilfældige variabel af tab i morgen følger normalfordelingen:

derefter kan vi beregne VaR på følgende måde:

kilde: Eric Sivots forelæsningsnotater

gennem den anden linje kan vi let kontrollere, at VaR kun er en mængde relateret til den fede hale. For flere detaljer om VaR, Se kapitel to i bogen “kvantitativ risikostyring: koncepter, teknikker og værktøjer” og Eric s forelæsningsnotat på hans hjemmeside.

alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)

Tilsvarende kan vi se, at forventet mangel er en mængde relateret til haledelen af fordelingen:

kilde: Eric Sivots forelæsningsnotater

i den fjerde linje står der “ES er det forventede tab i den øverste “hale” af tabsfordelingen. I lighed med VaR er det i tilfælde af normalfordeling praktisk at beregne ES nu, hvor det kun er et gennemsnit af afkortet normalfordeling.

kilde: Eric Sivots forelæsningsnotater

alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))

Hvis nogen er nysgerrig efter, hvorfor vi deler med 1 — kur , er dette bare en normaliserende konstant (eller skaleringsfaktor) for at sikre, at integrationen af den trunkerede tabsfordeling er en, hvilket er et krav for at det skal være en sandsynlighedsfordeling.

tilbage til historien om ‘tail’, jeg ville bare understrege, at halefordelingerne i vid udstrækning bruges som risikostyringsværktøj.

hvor fedt er fedt? Hvor tung er tung?

da vi fandt ud af, hvad ‘halen’ er i distribution, og hvor den bruges, er det nu tid til at tale om den ‘fede’ del. Vi ved alle, at normalfordeling ikke har en fedthale. I stedet blev vi lært at bruge student-t distribution og log normalfordeling, når vi modellerede den økonomiske afkastserie for at tage hensyn til ‘fat-tail’ – ejendommen. Men vi skal kende definitionen af fedt hale. Desværre er der ingen universel definition for udtrykket fedt.

Jeg vil forsøge at forklare Fedthalen på engelsk, graf og matematik. Håber du nyder mindst en af de tre.

  • en tung halefordeling har haler, der er tungere end en eksponentiel fordeling (Bryson, 1974)
  • Distribution siges at have en tung hale, når haledelen henfalder langsommere end den eksponentielle fordeling.

hvorfor eksponentiel?

Det er praktisk at bruge den eksponentielle fordeling som reference. Pdf ‘en for den eksponentielle fordeling nærmer sig nul’ eksponentielt ‘ hurtigt. Det vil sige, halen af pdf ligner (men opfører sig anderledes end) den eksponentielle fordeling.

på grafens sprog

Jeg vil vise dig 4 forskellige grafer, der viser, hvad der sker i de yderste højre haler af et sæt forskellige distributioner som nedenfor:

  • eksponentiel fordeling
  • magtfordeling (PL)
  • normalfordeling (N)
  • Log-normalfordeling (LN)
  • Student-t distribution
  • Cauchy distribution
  • Afgiftsfordeling
  • vægtfordeling

Jeg vil ikke forklare hver af disse distributioner. Lad os i stedet bare nyde grafen for disse distributioner for at føle, hvad der foregår i haledelen. Den første graf viser den del af hele grafen, hvis ‘ H ‘ ligger i

figur. 5, R-koder for denne graf findes i slutningen af dokumentet

med figuren 5 ovenfor kan vi ikke fortælle, hvordan halen opfører sig. Men her er et par ting, der er værd at nævne

  • Normal, student-t og Cauchy distributioner er to-tailed distributioner. Alle andre er en halefordeling
  • For PL(2.5) og PL(3.5) Er der en krydsning over punkt nær h=1.7, hvilket indikerer, at PL(2.5) har en tykkere hale.

lad os se på, hvordan det ser ud, når ‘S’ ligger i . Vær opmærksom på, at værdierne i y-aksen bliver meget mindre.

figur. 6

spørgsmål: Hvad ser du i denne graf?

A: den mest øverste linje ville have den tykkeste hale! (Men ikke helt!!!) Og du vil se hvorfor!

på forhånd, lad os undersøge de vigtige fakta i figur 6 ovenfor.

  • normale og eksp(2) fordelinger kravler nær 0, når=5. Især for normalfordeling er dens pdf-værdi på 5 standardafvigelse 0,000001486 (=pnorm (5)). Dette er omkring 8000 gange mindre end Cauchy distribution. Med andre ord er 5 Sigma-begivenheder 8000 gange mere tilbøjelige til at ske under Cauchy-distribution end normalfordeling.
  • i figur 6 skal du huske på, at eksp(0.2) distribution lokaliserer langt over log normalfordeling og magt lovfordelinger. Kontroller, hvordan det bliver vendt i de følgende grafer efter at have udvidet rækkevidden af ‘H’ værdier.

lad os se, hvordan det ser ud, når ‘S’ ligger i . Igen skal du være opmærksom på, at værdierne i y-aksen bliver meget meget mindre.

figur. 7
  • Bemærk, at den blå linje eksp(0.2) henfalder hurtigt, mens du krydser de to andre, der er PL(2.5) og Cauchy. Dette er hvad det betyder ved “henfalder langsommere end eksponentiel fordeling”
  • det er overraskende at se, hvad der sker i nærheden af ‘H’ er lig med 100. Dens pdf-værdi af PL (1.5) Er 0.0005. Ikke underligt, at første og andet øjeblik(middelværdi og varians) er uendelige for PL (1.5). Detaljerede oplysninger om dette vil blive dækket i det næste dokument. Stay tuned!

lad os forstørre y-aksen for at se, hvordan den opfører sig i detaljer!

figur. 8
  • overraskende nok falder den blå linje eksp(0.2) ved at krydse PL(3.5) og LN(0,1). Vi kan også se, at LN (0,1) falder hurtigere end PL(3.5) nu hvor den krydser PL(3.5) og går under den.
  • PL (1.5), pl (2.5) og Afgiftsfordelinger vises ikke engang i denne graf.

på matematikens sprog er

fedt halefordeling en underklasse af den tunge halefordeling. Det betyder, at selv om hver fedt-tailed distribution er tung-tailed, er det omvendte ikke sandt (f.eks. Ifølge Jay Taylors forelæsningsnotater differentierede han det tunge og fede på følgende måde.

Definition af tung hale

  • Distribution siges at have en ret tung hale, hvis haler er “ikke” eksponentielt afgrænset

ligning 1

Vi kan fortolke det som når ‘h’ bliver stor, hastigheden af eksponentielt stigende er hurtigere end hastigheden af faldende sandsynlighed på tunge højre hale. Tag dig tid til at tænke over det!

se, hvordan det forbinder til den engelske definition.

  • Sandsynlighedsfordelingsfunktion, der falder langsommere end en eksponentiel, kaldes højre tunge hale.

når eksponentielt afgrænset?

Hvis den tunge højre hale ikke er tung nok, dvs.den henfalder super hurtigt, når ‘h’ går til uendelig, konvergerer ligning 1 til nul. Det indlysende eksempel er ensartet fordeling over som vi diskuterede ovenfor. Når’ h ‘ overstiger den ene, bliver sandsynligheden for H større end en nul, så den er eksponentielt afgrænset. Et andet populært eksempel er normalfordelingen. Lad K være en standard normal. Tegn en række grafer for de forskellige lambda værdier for at få

figur. 3

Vi kan se, at det konvergerer til nul, så haler af normalfordelingen er eksponentielt afgrænset.


f_exp = function(x, lambda){return (exp(lambda*x))
cdf_normal = function(x) pnorm(x)
ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
abline(v=1, lty = 'dashed')
lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
grid()
legend(8, 0.15,
legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)

Definition af fedt hale

  • Distribution siges at have en ret fedthale, hvis der er en positiv eksponent (alfa) kaldet haleindekset sådan, at

den ‘ ~ ‘ betyder samme op til konstant. Eller haledelen er proportional med magtloven. Præcis betyder det følgende.

kilde: og

du er velkommen til at springe over, hvis matematik er ‘tung/fed’ for dig.

derfor følger haledelen af fedthale distributioner en magtlov (som er ‘H’ til kraften i minus alfa). For dem, der ikke er bekendt med en magtlov, skal du ikke bekymre dig nu. Tænk på grafen, når alfa er lig med to.

figur. 4

Mind dig selv om, at haledelen ligner magtloven, som vi har set i figur 5-8 ovenfor. Jeg vil forklare magt lov mere detaljeret Fra af denne serie.

Resume

Vi gennemgik konceptet ‘fat-tail’ i dette dokument intuitivt, grafisk og matematisk. For at forstå den ‘tempererede stabile fordeling’ er det nødvendigt at have en grundlæggende forståelse af Fedthalen. Håber dette dokument var nyttigt at forbedre din forståelse. Kommenter venligst nedenfor, hvis du har spørgsmål. Jeg håber, du er nysgerrig efter, hvad der kommer næste gang. Næste gang, jeg vil være tilbage med “rejse til hærdet stabil Distribution”


f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
f_power = function (x, k, x_min) {
C = (k-1)*x_min^(k-1)
return (C*x^(-k))
}
f_cauchy = function(x) dcauchy(x)
f_levy = function(x) dlevy(x) # required package: 'rmulti'
f_weibul = function(x) dweibull(x,shape=1)
f_norm = function(x) dnorm(x)
f_lnorm = function(x) dlnorm(x)
f_t = function(x) dt(x,5)
xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
main='Distributions on ', cex.main=1,
xlim=c(0,5),
ylim=c(0,2.5))
lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
lines(xs,f_norm(xs),col='black', lwd=2)
lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
lines(xs,f_t(xs), col='deeppink', lwd=2)
lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
lines(xs, f_levy(xs), col='azure4', lwd=2)
lines(xs, f_weibul(xs), col='springgreen', lwd=2)
abline(v=2, lty = 'dashed')
abline(v=3, lty = 'dashed')
grid()
legend(3.5, 2.5,
legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)

Jay Taylor, heavy-tailed distribution (2013), forelæsningsnotater,

Eric Sivot, risikoforanstaltninger (2013), forelæsningsnotater

Aaron Clauset, slutning, modeller og simulering for komplekse systemer (2011), forelæsningsnotater

https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.