PMC

Normalità

I metodi di analisi statistica basati sui dati acquisiti sono suddivisi in metodi parametrici e metodi non parametrici, in base alla normalità dei dati. Quando i dati soddisfano la normalità, mostra una curva di distribuzione di probabilità con la più alta frequenza di occorrenza al centro e la frequenza diminuisce con la distanza dal centro. La distanza dal centro della curva rende più facile determinare statisticamente se i dati ottenuti vengono osservati frequentemente. Poiché la maggior parte dei dati sono raccolti attorno al valore medio, riflette la natura del gruppo e fornisce informazioni sull’esistenza di una differenza tra i gruppi e l’entità della differenza. D’altra parte, se i dati non seguono la distribuzione normale, non vi è alcuna garanzia che sia centrato sulla media. Pertanto, il confronto delle caratteristiche tra gruppi utilizzando il valore medio non è possibile. In questo caso, viene utilizzato il test non parametrico, in cui le osservazioni sono classificate o firmate (ad esempio, + o−) e le somme vengono confrontate. Tuttavia, il test non parametrico è un po ‘ meno potente del test parametrico . Inoltre, è solo possibile rilevare la differenza tra i valori dei gruppi ma non confrontare l’entità di queste differenze. Pertanto, si raccomanda di eseguire l’analisi statistica utilizzando il test parametrico, se possibile, e che la normalità dei dati sia la prima cosa confermata dal test parametrico. L’ipotesi nel test di normalità è la seguente:

H0: I dati seguono una distribuzione normale.

H1: I dati non seguono una distribuzione normale.

Quindi, quanti campioni sarebbero appropriati per assumere una distribuzione normale ed eseguire test parametrici?

Secondo il teorema del limite centrale, la distribuzione dei valori medi del campione tende a seguire la distribuzione normale indipendentemente dalla distribuzione della popolazione se la dimensione del campione è abbastanza grande . Per questo motivo, ci sono alcuni libri che suggeriscono che se la dimensione del campione per gruppo è abbastanza grande, il t-test può essere applicato senza il test di normalità. A rigor di termini, questo non è vero. Sebbene il teorema del limite centrale garantisca la normale distribuzione dei valori medi del campione, non garantisce la normale distribuzione dei campioni nella popolazione. Lo scopo del t-test è quello di confrontare alcune caratteristiche che rappresentano gruppi e i valori medi diventano rappresentativi quando la popolazione ha una distribuzione normale. Questo è il motivo per cui la soddisfazione dell’assunzione di normalità è essenziale nel t-test. Pertanto, anche se la dimensione del campione è sufficiente, si raccomanda di controllare prima i risultati del test di normalità. Metodi noti di test di normalità includono il test Shapiro-Wilks e il test Kolmogorov-Smirnov. Quindi, il t-test può essere condotto con una dimensione del campione molto piccola (ad esempio, 3) se il test di normalità è soddisfatto?

Nel test Shapiro–Wilks, noto come uno dei più potenti test di normalità, è teoricamente possibile eseguire il test di normalità con tre campioni . Tuttavia, anche se il valore P è maggiore del livello di significatività di 0,05, ciò non significa automaticamente che i dati seguano una distribuzione normale. Gli errori di tipo I e di tipo II si verificano in tutti i test di ipotesi, che vengono rilevati utilizzando i livelli di significatività e potenza. In generale, i programmi statistici forniscono solo un valore P per l’errore di tipo I come risultato del test di normalità e non forniscono alimentazione per l’errore di tipo II. La potenza del test di normalità indica la capacità di discriminare le distribuzioni non normali dalle distribuzioni normali. Poiché non esiste una formula in grado di calcolare direttamente la potenza del test di normalità, viene stimata mediante simulazione al computer. Nella simulazione, il computer estrae ripetutamente campioni di una certa dimensione dalla distribuzione da testare e verifica se i campioni estratti hanno una distribuzione normale a un determinato livello di significatività. La potenza è la velocità con cui l’ipotesi nulla viene respinta dai dati ottenuti attraverso simulazioni ripetute più di diverse centinaia di volte. Se ci sono solo tre campioni, può essere difficile garantire che questi non siano normalmente distribuiti. Khan e Ahmad hanno riportato il cambiamento di potenza in base alle dimensioni del campione sotto diverse distribuzioni alternative non normali (Fig. 2). In effetti, i tipi di distribuzioni menzionati nella figura non sono comunemente osservati negli studi clinici e non sono essenziali per comprendere questa figura. Non abbiamo spiegato in dettaglio su questo perchéviene al di là del nostro campo di applicazione. L’asse x rappresenta il numero di campioni estratti da ciascun tipo di distribuzione e l’asse Y rappresenta la potenza del test di normalità corrispondente al numero di campioni estratti. Fico. 2 mostra che, sebbene vi sia un certo grado di differenza a seconda dei modelli di distribuzione, la potenza tende a diminuire quando la dimensione del campione diminuisce anche se il livello di significatività è fissato a 0,05. Pertanto, in circostanze tipiche in cui il modello di distribuzione della popolazione è sconosciuto, il test di normalità dovrebbe essere condotto con una dimensione del campione sufficiente.

Un file esterno che contiene un'immagine, illustrazione, ecc. Il nome dell'oggetto è kja-d-18-00292f2.jpg

Risultati di potenza del test di Shapiro-Wilks sotto diverse distribuzioni alternative non normali a α = 0,05. La potenza tende a diminuire quando la dimensione del campione diminuisce. Distribuzione logistica: logistica alternativa (Posizione = 0, Scala = 1) distribuzione, distribuzione Weibull: alternativa Weibull (Scala = 2, Forma = 3) distribuzione (modificato da Khan RA, Ahmad F. Confronto di potenza di vari test di normalità. Pakistan Journal of Statistics and Operation Research 2015; 11. Disponibile da http://pjsor.com/index.php/pjsor/article/view/1082).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.