PMC

normaalius

hankittuun aineistoon perustuvat tilastolliset analyysimenetelmät jaetaan parametrisiin ja ei -parametrisiin menetelmiin aineiston normaalisuuden mukaan. Kun aineisto täyttää normaaliuden, se näyttää todennäköisyysjakaumakäyrän, jonka esiintymistiheys on suurin keskipisteessä, ja taajuus pienenee etäisyyden kasvaessa keskipisteestä. Etäisyys käyrän keskipisteestä helpottaa tilastollisesti sen määrittämistä, havaitaanko saatu data usein. Koska suurin osa tiedoista on koottu keskiarvon ympärille, se kuvastaa ryhmän luonnetta ja antaa tietoa siitä, onko ryhmien välillä eroa ja kuinka suuri ero on. Toisaalta, jos aineisto ei noudata normaalijakaumaa, ei ole mitään takeita siitä, että se keskitetään keskiarvoon. Tämän vuoksi ryhmien ominaisuuksien vertailu keskiarvoa käyttäen ei ole mahdollista. Tällöin käytetään nonparametrista testiä, jossa havainnot asetetaan paremmuusjärjestykseen tai allekirjoitetaan (esim. + tai−) ja summia verrataan keskenään. Nonparametrinen testi on kuitenkin jonkin verran heikompi kuin parametrinen testi . Lisäksi on vain mahdollista havaita ryhmien arvojen ero, mutta ei verrata näiden erojen suuruutta. Siksi suositellaan, että tilastollinen analyysi tehdään parametrisella testillä , jos mahdollista, ja että tietojen normaalius on ensimmäinen parametrisella testillä vahvistettu asia. Hypoteesi normaalijakaumassa on seuraava:

H0: aineisto noudattaa normaalijakaumaa.

H1: tiedot eivät noudata normaalijakaumaa.

näin ollen, kuinka monta näytettä olisi sopiva normaalijakauman olettamiseksi ja parametristen testien tekemiseksi?

keskeisen raja-arvolauseen mukaan otoskeskiarvojen jakauma pyrkii noudattamaan normaalijakaumaa populaatiojakaumasta riippumatta, jos otoskoko on riittävän suuri . Tästä syystä on olemassa joitakin kirjoja, jotka viittaavat siihen, että jos otoskoko ryhmää kohti on tarpeeksi suuri, t-testiä voidaan soveltaa ilman normaaliuden testiä. Tarkkaan ottaen tämä ei pidä paikkaansa. Vaikka keskeinen raja-arvolause takaa otoskeskiarvojen normaalijakauman, se ei takaa otosten normaalijakaumaa perusjoukossa. T-testin tarkoituksena on verrata tiettyjä ryhmiä edustavia ominaisuuksia, ja keskiarvoista tulee edustavia, kun populaatiolla on normaalijakauma. Tämän vuoksi normaaliuskottavuuden tyydyttäminen on olennaista t-testissä. Vaikka otoskoko olisikin riittävä, on suositeltavaa tarkistaa ensin normaalitestin tulokset. Tunnettuja normaaliuden testausmenetelmiä ovat Shapiro–Wilksin testi ja Kolmogorov–Smirnovin testi. Voidaanko t-testi siis tehdä hyvin pienellä otoskoolla (esim. 3), Jos normaalisuustesti täyttyy?

Shapiro-Wilksin testissä, joka tunnetaan yhtenä tehokkaimmista normaalisuustesteistä, on teoriassa mahdollista suorittaa normaalisuustesti kolmella näytteellä . Vaikka P-arvo olisi suurempi kuin merkitsevyystaso 0,05, tämä ei kuitenkaan automaattisesti tarkoita, että tieto noudattaisi normaalijakaumaa. Tyypin I ja tyypin II virheitä esiintyy kaikissa hypoteesitesteissä, jotka havaitaan merkitsevyystasojen ja tehon avulla. Yleensä tilastolliset ohjelmat antavat vain p-arvon tyypin I virheelle normaaliuden testauksen seurauksena, eivätkä anna tehoa tyypin II virheelle. Normaalijakauman teho kertoo kyvystä erottaa normaalijakaumasta poikkeavia jakaumia. Koska ei ole kaavaa, jolla normaalitestin teho voitaisiin laskea suoraan, se arvioidaan tietokonesimulaatiolla. Simulaatiossa tietokone ottaa toistuvasti tietyn kokoisia näytteitä testattavasta jakaumasta ja testaa, onko otetuilla näytteillä normaalijakauma määritetyllä merkitsevyystasolla. Potenssi on nopeus, jolla nollahypoteesi hylätään useita satoja kertoja toistettujen simulaatioiden avulla saadusta datasta. Jos näytteitä on vain kolme, voi olla vaikea varmistaa, ettei niitä levitetä normaalisti. Khan ja Ahmad raportoivat vallanvaihdoksesta otoskokojen mukaan eri vaihtoehtoisilla ei-normaalijakaumilla (Kuva. 2). Itse asiassa kuvassa mainittuja jakaumatyyppejä ei ole yleisesti havaittu kliinisissä tutkimuksissa, eivätkä ne ole oleellisia tämän luvun ymmärtämiseksi. Emme ole selittäneet tätä yksityiskohtaisesti, koska se ylittää soveltamisalamme. X-akseli kuvaa kustakin jakaumatyypistä otettujen näytteiden määrää ja y-akseli normaalisuustestin tehoa, joka vastaa otettujen näytteiden määrää. Kuva. 2 osoittaa, että vaikka jakaumakuvioista riippuen on olemassa jonkin verran eroa, teho yleensä pienenee, kun otoskoko pienenee, vaikka merkitsevyystaso on vahvistettu 0,05: ksi. Sen vuoksi tyypillisissä olosuhteissa, joissa populaation jakautumistapaa ei tunneta, normaalisuustesti olisi tehtävä riittävällä otoskoolla.

ulkoinen tiedosto, jossa on kuva, kuvitus jne. Kohteen nimi on kja-d-18-00292f2.jpg

Shapiro–Wilks-testin Tehotulokset eri vaihtoehtoisilla ei-normaalijakaumilla α = 0, 05. Teho yleensä pienenee, kun otoskoko pienenee. Logistic distribution: Alternative Logistic (Location = 0, Scale = 1) distribution, Weibull distribution: alternate Weibull (Scale = 2, Shape = 3) distribution (Modified from Khan RA, Ahmad F. Power Comparison of Various Normality Tests. Pakistan Journal of Statistics and Operation Research 2015; 11. Saatavilla http://pjsor.com/index.php/pjsor/article/view/1082).

Vastaa

Sähköpostiosoitettasi ei julkaista.