PMC

normalitate

metodele de analiză statistică bazate pe datele obținute sunt împărțite în metode parametrice și metode neparametrice, în funcție de normalitatea datelor. Când datele satisfac normalitatea, arată o curbă de distribuție a probabilității cu cea mai mare frecvență de apariție la centru, iar frecvența scade odată cu distanța față de centru. Distanța de la centrul curbei facilitează determinarea statistică dacă datele obținute sunt observate frecvent. Deoarece majoritatea datelor sunt colectate în jurul valorii medii, aceasta reflectă natura grupului și oferă informații despre existența unei diferențe între grupuri și magnitudinea diferenței. Pe de altă parte, dacă datele nu respectă distribuția normală, nu există nicio garanție că acestea sunt centrate pe medie. Prin urmare, compararea caracteristicilor între grupuri folosind valoarea medie nu este posibilă. În acest caz, se utilizează testul neparametric, în care observațiile sunt clasate sau semnate (de exemplu, + sau −), iar sumele sunt comparate. Cu toate acestea, testul neparametric este ceva mai puțin puternic decât testul parametric . Mai mult, este posibilă doar detectarea diferenței dintre valorile grupurilor, dar nu și compararea magnitudinii acestor diferențe. Prin urmare , se recomandă ca analiza statistică să fie efectuată utilizând testul parametric, dacă este posibil, și ca normalitatea datelor să fie primul lucru confirmat de testul parametric. Ipoteza în testarea normalității este următoarea:

H0: datele urmează o distribuție normală.

H1: datele nu urmează o distribuție normală.

astfel, câte eșantioane ar fi adecvate pentru a presupune distribuția normală și pentru a efectua teste parametrice?

conform teoremei limitei centrale, distribuția valorilor medii ale eșantionului tinde să urmeze distribuția normală indiferent de distribuția populației dacă dimensiunea eșantionului este suficient de mare . Din acest motiv, există câteva cărți care sugerează că, dacă dimensiunea eșantionului pe grup este suficient de mare, testul t poate fi aplicat fără testul de normalitate. Strict vorbind, acest lucru nu este adevărat. Deși teorema limitei centrale garantează distribuția normală a valorilor medii ale eșantionului, nu garantează distribuția normală a eșantioanelor în populație. Scopul testului t este de a compara anumite caracteristici reprezentând grupuri, iar valorile medii devin reprezentative atunci când populația are o distribuție normală. Acesta este motivul pentru care satisfacția presupunerii normalității este esențială în testul T. Prin urmare, chiar dacă dimensiunea eșantionului este suficientă, se recomandă verificarea mai întâi a rezultatelor testului de normalitate. Metodele cunoscute de testare a normalității includ testul Shapiro-Wilks și testul Kolmogorov-Smirnov. Prin urmare, testul t poate fi efectuat cu o dimensiune foarte mică a eșantionului (de exemplu, 3) dacă testul de normalitate este îndeplinit?

în testul Shapiro–Wilks, care este cunoscut ca unul dintre cele mai puternice teste de normalitate, este teoretic posibil să se efectueze testul de normalitate cu trei probe . Cu toate acestea, chiar dacă valoarea P este mai mare decât nivelul de semnificație de 0,05, acest lucru nu înseamnă automat că datele urmează o distribuție normală. Erorile de tip I și de tip II apar în toate testele de ipoteză, care sunt detectate folosind nivelurile de semnificație și puterea. În general, programele statistice oferă doar o valoare P pentru eroarea de tip I ca urmare a testării normalității și nu furnizează energie pentru eroarea de tip II. Puterea testului de normalitate indică capacitatea de a discrimina distribuțiile non-normale de distribuțiile normale. Deoarece nu există o formulă care să poată calcula direct puterea testului de normalitate, aceasta este estimată prin simulare pe calculator. În simulare, computerul extrage în mod repetat probe de o anumită dimensiune din distribuția care urmează să fie testată și testează dacă probele extrase au o distribuție normală la un nivel de semnificație determinat. Puterea este rata la care ipoteza nulă este respinsă din datele obținute prin simulări repetate de peste câteva sute de ori. Dacă există doar trei eșantioane, poate fi dificil să se asigure că acestea nu sunt distribuite în mod normal. Khan și Ahmad au raportat schimbarea puterii în funcție de dimensiunile eșantionului în diferite distribuții alternative non-normale (Fig. 2). De fapt, tipurile de distribuții menționate în figură nu sunt observate frecvent în studiile clinice și nu sunt esențiale pentru a înțelege această cifră. Noi nu a explicat în detaliu despre asta, deoareceAcesta depășește domeniul nostru de aplicare. Axa x reprezintă numărul de probe extrase din fiecare tip de distribuție, iar axa y reprezintă puterea testului de normalitate corespunzător numărului de probe extrase. Fig. 2 arată că, deși există un anumit grad de diferență în funcție de modelele de distribuție, puterea tinde să scadă atunci când dimensiunea eșantionului scade chiar dacă nivelul de semnificație este fixat la 0,05. Prin urmare, în circumstanțe tipice în care modelul de distribuție al populației este necunoscut, testul de normalitate trebuie efectuat cu o dimensiune suficientă a eșantionului.

un fișier extern care deține o imagine, ilustrație, etc. Numele obiectului este kja-d-18-00292f2.jpg

rezultatele de putere ale testului Shapiro-Wilks sub diferite distribuții alternative non-normale la 0,05. Puterea tinde să scadă atunci când dimensiunea eșantionului scade. Distribuție logistică: distribuție logistică alternativă (locație = 0, scară = 1) distribuție, distribuție Weibull: distribuție alternativă Weibull (scară = 2, Formă = 3) distribuție (modificată din Khan RA, Ahmad F. compararea puterii diferitelor teste de normalitate. Pakistan Journal of Statistics and Operation Research 2015; 11. Disponibil de la http://pjsor.com/index.php/pjsor/article/view/1082).

Lasă un răspuns

Adresa ta de email nu va fi publicată.