PMC

Normalidad

Los métodos de análisis estadístico basados en datos adquiridos se dividen en métodos paramétricos y métodos no paramétricos, de acuerdo con la normalidad de los datos. Cuando los datos satisfacen la normalidad, muestran una curva de distribución de probabilidad con la mayor frecuencia de ocurrencia en el centro, y la frecuencia disminuye con la distancia desde el centro. La distancia desde el centro de la curva facilita la determinación estadística de si los datos obtenidos se observan con frecuencia. Dado que la mayoría de los datos se recopilan en torno al valor medio, reflejan la naturaleza del grupo y proporcionan información sobre si hay una diferencia entre los grupos y la magnitud de la diferencia. Por otro lado, si los datos no siguen la distribución normal, no hay garantía de que estén centrados en la media. Por lo tanto, la comparación de características entre grupos utilizando el valor medio no es posible. En este caso, se utiliza la prueba no paramétrica, en la que las observaciones se clasifican o firman (por ejemplo, + o −), y se comparan las sumas. Sin embargo, la prueba no paramétrica es algo menos potente que la prueba paramétrica . Además, solo es posible detectar la diferencia entre los valores de los grupos, pero no comparar la magnitud de estas diferencias. Por lo tanto , se recomienda que el análisis estadístico se realice utilizando la prueba paramétrica si es posible, y que la normalidad de los datos sea lo primero confirmado por la prueba paramétrica. La hipótesis en las pruebas de normalidad es la siguiente:

H0: Los datos siguen una distribución normal.

H1: Los datos no siguen una distribución normal.

Por lo tanto, ¿cuántas muestras serían apropiadas para asumir una distribución normal y realizar pruebas paramétricas?

De acuerdo con el teorema del límite central, la distribución de los valores medios de la muestra tiende a seguir la distribución normal independientemente de la distribución de la población si el tamaño de la muestra es lo suficientemente grande . Por esta razón, hay algunos libros que sugieren que si el tamaño de la muestra por grupo es lo suficientemente grande, la prueba t se puede aplicar sin la prueba de normalidad. Estrictamente hablando, esto no es cierto. Aunque el teorema del límite central garantiza la distribución normal de los valores medios de la muestra, no garantiza la distribución normal de las muestras en la población. El propósito de la prueba t es comparar ciertas características que representan grupos, y los valores medios se vuelven representativos cuando la población tiene una distribución normal. Esta es la razón por la que la satisfacción del supuesto de normalidad es esencial en el test t. Por lo tanto, incluso si el tamaño de la muestra es suficiente, se recomienda verificar primero los resultados de la prueba de normalidad. Los métodos conocidos de prueba de normalidad incluyen la prueba de Shapiro-Wilks y la prueba de Kolmogorov–Smirnov. Por lo tanto, ¿se puede realizar la prueba t con un tamaño de muestra muy pequeño (por ejemplo, 3) si se cumple la prueba de normalidad?

En la prueba de Shapiro–Wilks, conocida como una de las pruebas de normalidad más potentes, es teóricamente posible realizar la prueba de normalidad con tres muestras . Sin embargo, incluso si el valor de P es mayor que el nivel de significancia de 0,05, esto no significa automáticamente que los datos sigan una distribución normal. Los errores de tipo I y tipo II se producen en todas las pruebas de hipótesis, que se detectan utilizando los niveles de significación y la potencia. En general, los programas estadísticos solo proporcionan un valor P para el error de Tipo I como resultado de las pruebas de normalidad, y no proporcionan energía para el error de Tipo II. La potencia de la prueba de normalidad indica la capacidad de discriminar distribuciones no normales de distribuciones normales. Dado que no hay una fórmula que pueda calcular la potencia de la prueba de normalidad directamente, se estima mediante simulación por computadora. En la simulación, la computadora extrae repetidamente muestras de un cierto tamaño de la distribución que se va a probar, y prueba si las muestras extraídas tienen una distribución normal a un nivel de significación determinado. La potencia es la velocidad a la que se rechaza la hipótesis nula a partir de los datos obtenidos a través de simulaciones repetidas varias veces. Si solo hay tres muestras, puede ser difícil asegurarse de que no se distribuyan normalmente. Khan y Ahmad informaron el cambio de potencia de acuerdo con los tamaños de muestra bajo diferentes distribuciones alternativas no normales (Fig. 2). De hecho, los tipos de distribuciones mencionados en la figura no se observan comúnmente en los estudios clínicos, y no son esenciales para comprender esta figura. No explicamos en detalle sobre eso porque va más allá de nuestro alcance. El eje x representa el número de muestras extraídas de cada tipo de distribución, y el eje y representa la potencia de la prueba de normalidad correspondiente al número de muestras extraídas. Higo. 2 muestra que, aunque hay algún grado de diferencia dependiendo de los patrones de distribución, la potencia tiende a disminuir cuando el tamaño de la muestra disminuye, incluso si el nivel de significancia se fija en 0,05. Por lo tanto, en circunstancias típicas en las que se desconoce el patrón de distribución de la población, la prueba de normalidad debe realizarse con un tamaño de muestra suficiente.

Un archivo externo que contiene una imagen, ilustración, etc. El nombre del objeto es kja-d-18-00292f2.jpg

Resultados de potencia de la prueba de Shapiro-Wilks bajo diferentes distribuciones alternas no normales a α = 0,05. La potencia tiende a disminuir cuando el tamaño de la muestra disminuye. Distribución logística: distribución logística alterna (Ubicación = 0, Escala = 1), Distribución de Weibull: distribución de Weibull alterna (Escala = 2, Forma = 3) (Modificada de Khan RA, Ahmad F. Comparación de potencia de varias Pruebas de Normalidad. Pakistan Journal of Statistics and Operation Research 2015; 11. Disponible a partir de http://pjsor.com/index.php/pjsor/article/view/1082).

Deja una respuesta

Tu dirección de correo electrónico no será publicada.