PMC

normalitet

statistiske analysemetoder baseret på erhvervede data er opdelt i parametriske metoder og ikke-parametriske metoder i henhold til dataens normalitet. Når dataene opfylder normaliteten, viser den en sandsynlighedsfordelingskurve med den højeste frekvens af forekomst i midten, og frekvensen falder med afstand fra midten. Afstanden fra midten af kurven gør det lettere at statistisk afgøre, om de opnåede data ofte observeres. Da de fleste af dataene er samlet omkring middelværdien, afspejler det gruppens art og giver information om, hvorvidt der er forskel på grupper og størrelsen af forskellen. På den anden side, hvis dataene ikke følger den normale fordeling, er der ingen garanti for, at de er centreret om gennemsnittet. Derfor er sammenligningen af karakteristika mellem grupper ved hjælp af middelværdien ikke mulig. I dette tilfælde anvendes den ikke − parametriske test, hvor observationerne rangeres eller underskrives (f.eks. Den ikke-parametriske test er dog noget mindre kraftig end den parametriske test . Desuden er det kun muligt at opdage forskellen mellem værdierne af grupper, men ikke at sammenligne størrelsen af disse forskelle. Derfor anbefales det , at statistisk analyse udføres ved hjælp af den parametriske test, hvis det er muligt, og at normaliteten af dataene er den første ting, der bekræftes af den parametriske test. Hypotesen i normalitetstest er som følger:

H0: dataene følger en normalfordeling.

H1: dataene følger ikke en normalfordeling.

hvor mange prøver ville således være passende til at antage normalfordeling og udføre parametriske tests?

i henhold til central limit theorem har fordelingen af stikprøvegennemsnitsværdier en tendens til at følge den normale fordeling uanset befolkningsfordelingen, hvis stikprøvestørrelsen er stor nok . Af denne grund er der nogle bøger, der antyder, at hvis stikprøvestørrelsen pr.gruppe er stor nok, kan t-testen anvendes uden normalitetstesten. Strengt taget er dette ikke sandt. Selvom den centrale grænse sætning garanterer den normale fordeling af stikprøvens gennemsnitsværdier, garanterer den ikke den normale fordeling af prøver i befolkningen. Formålet med T-testen er at sammenligne visse karakteristika, der repræsenterer grupper, og middelværdierne bliver repræsentative, når befolkningen har en normal fordeling. Dette er grunden til, at tilfredshed med normalitetsantagelsen er afgørende i t-testen. Selv om prøvestørrelsen er tilstrækkelig, anbefales det derfor, at resultaterne af normalitetstesten kontrolleres først. Blandt de kendte metoder til normalitetstest er Shapiro–Vilks-testen og Kolmogorov-Smirnov-testen. Kan t-testen derfor udføres med en meget lille prøvestørrelse (f. eks. 3), hvis normalitetstesten er opfyldt?

i Shapiro–Vilks-testen, Der er kendt som en af de mest kraftfulde normalitetstest, er det teoretisk muligt at udføre normalitetstesten med tre prøver . Men selvom p-værdien er større end signifikansniveauet på 0,05, betyder det ikke automatisk, at dataene følger en normalfordeling. Type I-og type II-fejl forekommer i alle hypotesetests, som detekteres ved hjælp af signifikansniveauer og effekt. Generelt giver statistiske programmer kun en p-værdi for type i-fejlen som følge af normalitetstest og giver ikke strøm til type II-fejlen. Effekten af normalitetstesten indikerer evnen til at diskriminere ikke-normale fordelinger fra normale distributioner. Da der ikke er nogen formel, der kan beregne effekten af normalitetstesten direkte, estimeres den ved computersimulering. I simuleringen udtrækker computeren gentagne gange prøver af en bestemt størrelse fra fordelingen, der skal testes, og tester, om de ekstraherede prøver har en normalfordeling på et bestemt signifikansniveau. Kraften er den hastighed, hvormed nulhypotesen afvises fra de data, der opnås gennem simuleringer gentaget over flere hundrede gange. Hvis der kun er tre prøver, kan det være vanskeligt at sikre, at disse ikke distribueres normalt. Khan og Ahmad rapporterede magtændringen i henhold til stikprøvestørrelser under forskellige alternative ikke-normale fordelinger (Fig. 2). Faktisk er de typer distributioner, der er nævnt i figuren, ikke almindeligt observeret i kliniske studier og er ikke afgørende for at forstå denne figur. Vi har ikke forklaret i detaljer om, at fordidet går ud over vores rækkevidde. Det vil sige, at det er en af de mest almindelige metoder, der bruges til at bestemme antallet af prøver, der er taget ud af hver distributionstype, og at y-aksen repræsenterer effekten af normalitetstesten, der svarer til antallet af ekstraherede prøver. Fig. 2 viser, at selvom der er en vis grad af forskel afhængigt af fordelingsmønstrene, har effekten en tendens til at falde, når prøvestørrelsen falder, selvom signifikansniveauet er fastsat til 0,05. Under typiske omstændigheder, hvor populationens fordelingsmønster er ukendt, bør normalitetstesten derfor udføres med en tilstrækkelig stikprøvestørrelse.

en ekstern fil, der indeholder et billede, illustration osv. Objektnavn er kja-d-18-00292f2.jpg

effektresultater af Shapiro-Vilks test under forskellige alternative ikke-normale fordelinger ved kr = 0,05. Strømmen har tendens til at falde, når prøvestørrelsen falder. Logistisk distribution: alternativ logistisk (placering = 0, Skala = 1) distribution, vægtfordeling: alternativ vægt (skala = 2, Form = 3) distribution (modificeret fra Khan RA, Ahmad F. strøm sammenligning af forskellige Normalitetstest. Pakistan Journal of Statistics and Operation Research 2015; 11. Tilgængelig fra http://pjsor.com/index.php/pjsor/article/view/1082).

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.