Forstå Fat-tailed Distribusjon

i del 1 diskuterer vi hva det betyr for en tilfeldig variabel å ha en» fat-tail » distribusjon.

Langt? Fett?

for å forstå fetthalen må vi svare på følgende to spørsmål.

1. Hvor langt er langt?
2. Hvor fett er fett?

for å snakke om halen, må vi bestemme hvor langt er langt å bestemme hvor langt fra midten er langt nok til å si det en hale. Med andre ord, hvor begynner halen? Det avhenger! Dessverre er det ikke noe enkelt svar.

Vurder normalfordelingen. Legg merke til at det er to haler: høyre og venstre. Hvis vi for eksempel vil beskrive ‘høyre’ hale av fordelingen fra den ene standardavviket fra gjennomsnittet, refererer den skyggefulle delen til den høyre halen av normalfordelingen.

Figur. 1

Formelt kan vi beskrive halen som følger:

  • høyre hale: P (X> x)
  • venstre hale: P ( X≤ – x)

for en stor verdi av ‘x’. Nå kjenner vi begrepet ‘hale’.


#For normal distribution with value 'x=a'
a=1
1-pnorm(a) #right tail
pnorm(-a) #left tail

har hver distribusjon en hale?

Tenk på den ensartede fordeling over . Har den en hale? I denne bloggen står det ikke at hver distribusjon har en hale.

hvis du vil at «halenes oppførsel» skal beskrive egenskapene til pdf-filen når ‘ x ‘ blir stor, har begrensede distribusjoner ikke haler. Likevel kan noen funksjoner i haler kvantifiseres. Spesielt ved å bruke grenser og asymptotisk oppførsel kan du definere begrepet tunge haler. SAS blog

jeg vil forklare (eksponentielt) avgrenset / ikke avgrenset fordeling nedenfor. Vennligst minn deg selv på jevn fordeling når du kommer dit!

Hvorfor skal vi bry oss om ‘hale’ – delen av distribusjonen?

haledelen av distribusjonen har vært den største bekymringen for risikostyring. For eksempel er De to mest brukte risikotiltakene For fordeling av avkastning eller tap Value at Risk (Var) og Expected shortfall (ES)

Hvorfor tap ikke avkastning?

  • tap er bokstavelig talt minus (-) retur
  • Å Ta grensen til negativ uendelig er ikke-intuitiv. Så vi tar det negative av returverdier, dvs. snu fordelingen over y-aksen.

Bare se hvordan mengden VaR OG ES er relatert til ‘hale’. Trenger ikke å forstå matte eller mening bak dem.

» Vær oppmerksom på at under grafen er en fordeling Av Tap Ikke Tilbake!»

Figur. 2 / / Kilde: Ch2, Kvantitativ Risikostyring (heretter, QRM) Av McNeil et al

Tenk på fordeling av tap, l, ekvivalent (negativ) avkastning, på noen eiendel over en gitt holdeperiode. For forståelsens skyld antar vi at den tilfeldige variabelen av tap i morgen følger normalfordelingen:

deretter kan vi beregne VaR på følgende måte:

Kilde: Eric Zivots Forelesningsnotater

gjennom den andre linjen kan vi enkelt sjekke At VaR bare er en mengde relatert til fetthalen. For mer informasjon Om VaR, sjekk kapittel to i boken «Quantitative Risk Management: Concepts, Techniques and Tools» og Eric Zivots forelesningsnotat på hans nettside.

alpha = 0.95 #significant level
VaR.alpha = qnorm(alpha, mu, sigma)
VaR.alpha = mu + sigma*qnorm(alpha, 0, 1)

På Samme måte kan vi se at forventet mangel er en mengde relatert til haledelen av fordelingen:

Kilde: Eric Zivots Forelesningsnotater

i fjerde linje står DET «ES er det forventede tapet i øvre» hale » av tapsfordelingen. I likhet Med VaR, når det gjelder normalfordeling, er DET praktisk å beregne ES nå som DET bare er et middel for avkortet normalfordeling.

Kilde: Eric Zivots Forelesningsnotater

alpha = 0.95
q.alpha.z = qnorm(alpha)
ES.alpha = mu + sigma*(dnorm(q.alpha.z)/(1-alpha))

hvis noen lurer på hvorfor vi deler på 1-α, er dette bare en normaliserende konstant (eller skaleringsfaktor) for å sikre at integrasjonen av den avkortede tapsfordelingen er en, noe som er et krav for at den skal være en sannsynlighetsfordeling.

Tilbake til historien om ‘tail’, ville jeg bare understreke at halefordelingene er mye brukt som risikostyringsverktøy.

hvor fett er fett? Hvor Tung Er Tung?

siden vi fant ut hva halen er i distribusjon og hvor den brukes, er det nå på tide å snakke om den fete delen. Vi vet alle at normal fordeling ikke har en fetthale. I stedet ble vi lært å bruke student – t-distribusjonen og logge normalfordeling når vi modellerte financial return-serien for å ta hensyn til ‘fat-tail’ – egenskapen. Men vi trenger å vite definisjonen av fett hale. Dessverre er det ingen universell definisjon for begrepet fett.

jeg vil prøve å forklare fat-tail i språket engelsk, Graf og Matte. Håper du liker minst en av de tre.

  • en tung halefordeling har haler som er tyngre enn en eksponentiell fordeling (Bryson, 1974)
  • Fordelingen sies å ha en tung hale når haledelen henfaller saktere enn eksponentiellfordeling.

hvorfor eksponentiell?

det er praktisk å bruke eksponentiell fordeling som referanse. Pdf av eksponentiell distribusjon nærmer seg null ‘eksponentielt’ raskt. Det vil si at halen av pdf-filen ser ut (men oppfører seg annerledes enn) eksponentiell distribusjon.

i språket i grafen,

jeg vil vise deg 4 forskjellige grafer som viser hva som skjer i høyre haler av et sett med forskjellige distribusjoner som nedenfor:

  • Eksponentiell distribusjon (exp)
  • strømrettsfordeling (PL)
  • Normalfordeling (N)
  • Log-Normalfordeling (LN)
  • Student-T distribusjon
  • Cauchy distribusjon
  • Levy distribusjon
  • Weibull distribusjon

jeg vil ikke forklare hver av disse fordelingene. I stedet, la oss bare nyte grafen av disse fordelingene for å føle hva som skjer i halen. Den første grafen viser den delen av hele grafen som ‘x’ ligger i

Figur. 5, r koder for denne grafen er gitt på slutten av dokumentet

med figuren 5 ovenfor, kan vi ikke fortelle hvordan halen oppfører seg. Men her er noen ting som er verdt å nevne

  • Normal, student-t og Cauchy distribusjoner er to-tailed distribusjoner. Alle andre er en tailed distribusjoner
  • FOR PL(2.5) Og PL(3.5), er det et kryss over punkt nær x=1.7, noe som indikerer AT PL(2.5) har en tykkere hale.

La oss se på hvordan det ser ut når ‘x’ ligger i . Vær oppmerksom på at verdiene i y-aksen blir mye mindre.

Figur. 6

Q: Hva ser du i denne grafen?

A: den øverste linjen ville ha den tykkeste halen! (Men ikke helt!!!) Og du vil se hvorfor !

På Forhånd, la Oss undersøke de viktige fakta i figur 6 ovenfor.

  • Normal og exp(2) distribusjoner kryper nær 0 når x=5. Spesielt for normalfordeling er pdf-verdien av 5 standardavvik 0,000001486 (=pnorm (5)). Dette er rundt 8000 ganger mindre Enn Cauchy-distribusjonen. Med andre ord, 5 sigma hendelser er 8000 ganger mer sannsynlig å skje under cauchy distribusjon Enn Normal distribusjon.
  • i figur 6, husk at exp (0.2) distribusjon lokaliserer vei over log normalfordeling og power law distribusjoner. Vennligst sjekk hvordan det blir reversert i følgende grafer etter å ha utvidet rekkevidden av x-verdier.

La oss se hvordan det ser ut når ‘x’ ligger i . Igjen, vær oppmerksom på at verdiene i y-aksen blir mye mye mindre.

Figur. 7
  • Merk at den blå linjen exp (0.2) henfaller raskt mens krysset de to andre SOM ER PL(2.5) Og Cauchy. Dette er hva det betyr med «henfall langsommere enn eksponentiell distribusjon»
  • det er overraskende å se hva som skjer nær ‘x’ er lik 100. Pdf-verdien AV PL (1,5) er 0,0005. Ikke rart at første og andre øyeblikk (gjennomsnitt og varians) er uendelige FOR PL(1.5). Detaljert informasjon om dette vil bli dekket i neste dokument. Følg med!

la oss zoome inn y-aksen for å se hvordan den oppfører seg i detalj!

Figur. 8
  • Overraskende, den blå linjen exp(0.2) reduseres ved å krysse PL (3.5) OG LN (0,1). Vi kan også se AT LN(0,1) henfaller raskere ENN PL(3.5) nå som den krysser PL (3.5) og går under den.
  • PL (1.5), PL(2.5) og Levy distribusjoner vises ikke engang i denne grafen.

I Matematikkens språk er

Fat tail distribution en underklasse av den tunge tailed distribusjonen. Det betyr at selv om hver fett-tailed distribusjon er tung-tailed, er omvendt ikke sant(F. Eks. Ifølge Jay Taylors forelesningsnotater differensierte han det tunge og fete på følgende måte.

Definisjon Av Tung hale

  • Fordeling sies å ha en rett tung hale hvis haler er» ikke » eksponentielt avgrenset

Ligning 1

vi kan tolke det som når ‘x’ blir stor, er hastigheten på eksponentielt økende raskere enn hastigheten på å redusere sannsynligheten på tung høyre hale. Ta deg tid til å tenke på det!

Se hvordan den kobles til den engelske definisjonen.

  • Sannsynlighetsfordelingsfunksjon som henfaller langsommere enn en eksponentiell kalles høyre tunge hale.

når eksponentielt avgrenset?

hvis den tunge høyre halen ikke er tung nok, det vil si at den faller super fort som ‘x’ går til uendelig, så konvergerer ligning 1 til null. Det åpenbare eksemplet er jevn fordeling over som vi diskuterte ovenfor. Når’ x ‘ overskrider den ene, blir sannsynligheten For X større enn en null, slik at den eksponentielt er begrenset. Et annet eksempel er normalfordelingen. La X være en standard normal. Tegn en rekke grafer for de forskjellige lambda-verdiene for å få

Figur. 3

Vi kan se at den konvergerer til null slik at haler av normalfordelingen er eksponentielt begrenset.


f_exp = function(x, lambda){return (exp(lambda*x))
cdf_normal = function(x) pnorm(x)
ccdf_normal = function(x) {1-cdf_normal(x)}xs = seq(1,10,length=10000)
plot(xs, f_exp(xs,0.1)*ccdf_normal(xs), type='l', xlab='',ylab='', col='blue', lwd=2)
abline(v=1, lty = 'dashed')
lines(xs,f_exp(xs,0.5)*ccdf_normal(xs), col='purple', lwd=2)
lines(xs,f_exp(xs,1)*ccdf_normal(xs), col='red', lwd=2)
lines(xs,f_exp(xs,1.5)*ccdf_normal(xs), col='orange', lwd=2)
lines(xs,f_exp(xs,2)*ccdf_normal(xs), col='darkred', lwd=2)
lines(xs,f_exp(xs,3)*ccdf_normal(xs), col='darkblue', lwd=2)
grid()
legend(8, 0.15,
legend=c("0.1", "0.5","1","1.5","2","3"), title = "lambda",
col=c("blue",'purple', "red",'orange','darkred','darkblue'), lwd=2, cex=1)

Definisjon av fett hale

  • Fordeling sies å ha en rett fett hale hvis det er en positiv eksponent (alfa) kalt haleindeksen slik at

‘~’betyr samme opp til konstant. Eller halen er proporsjonal med kraftloven. Nøyaktig betyr det følgende.

Kilde :og

Du er velkommen til å hoppe over om matte er tung/fett for deg.

derfor følger haledelen av fett-tailed distribusjoner en kraftlov (som er ‘ x ‘ til kraften til minus alfa). For de som ikke er kjent med en maktlov, ikke bekymre deg nå. Tenk på grafen når alfa er lik to.

Figur. 4

Påminn deg selv om at halepartiet ligner på maktloven som vi har sett i figurene 5-8 ovenfor. Jeg vil forklare power law i mer detalj fra denne serien.

Sammendrag

vi gikk over konseptet ‘fat-tail’ i dette dokumentet intuitivt, grafisk og matematisk. For å forstå ‘herdet stabil distribusjon’, er det nødvendig å ha en grunnleggende forståelse av fett-halen. Håper dette dokumentet var nyttig for å forbedre din forståelse. Vennligst kommentere nedenfor hvis du har noen spørsmål. Jeg håper du er nysgjerrig på hva som kommer neste. Neste gang vil jeg være tilbake med «Journey To Tempered Stable Distribution»


f_exp = function(x, lambda, xmin) {lambda*exp(-lambda*(x-xmin))}
f_power = function (x, k, x_min) {
C = (k-1)*x_min^(k-1)
return (C*x^(-k))
}
f_cauchy = function(x) dcauchy(x)
f_levy = function(x) dlevy(x) # required package: 'rmulti'
f_weibul = function(x) dweibull(x,shape=1)
f_norm = function(x) dnorm(x)
f_lnorm = function(x) dlnorm(x)
f_t = function(x) dt(x,5)
xs = seq(0.1,100,length=1000)plot(xs, f_exp(xs,0.5,0.1),type='l',xlab='',ylab='', col='blue', lwd=2,
main='Distributions on ', cex.main=1,
xlim=c(0,5),
ylim=c(0,2.5))
lines(xs,f_exp(xs,1,0.1), col='purple', lwd=2)
lines(xs,f_exp(xs,2,0.1), col='bisque3', lwd=2)
lines(xs,f_power(xs,1.5, 1), col='red', lwd=2)
lines(xs,f_power(xs,2.5, 1), col='orange', lwd=2)
lines(xs,f_power(xs,3.5, 1), col='darkred', lwd=2)
lines(xs,f_norm(xs),col='black', lwd=2)
lines(xs,f_lnorm(xs), col='darkgreen', lwd=2)
lines(xs,f_t(xs), col='deeppink', lwd=2)
lines(xs, f_cauchy(xs), col='darkblue', lwd=2)
lines(xs, f_levy(xs), col='azure4', lwd=2)
lines(xs, f_weibul(xs), col='springgreen', lwd=2)
abline(v=2, lty = 'dashed')
abline(v=3, lty = 'dashed')
grid()
legend(3.5, 2.5,
legend=c("exp(0.2)", "exp(1)", 'exp(2)', "PL(1.5)", 'PL(2.5)', 'PL(3.5)', 'N(0,1)','LN(0,1)','student-t(5)','Cauchy','Levy','Weibull'),
col=c("blue",'purple', 'bisque3',"red",'orange','darkred', 'black','darkgreen','deeppink','darkblue', 'azure4','springgreen'), lwd=2, cex=0.8)

Jay Taylor, Heavy-tailed distribution (2013), Forelesningsnotater,

Eric Zivot, Risikotiltak (2013), Forelesningsnotater

Aaron Clauset, Slutning, Modeller og Simulering For Komplekse Systemer (2011), Forelesningsnotater

https://blogs.sas.com/content/iml/2014/10/13/fat-tailed-and-long-tailed-distributions.html

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.