PMC

Normalidade

métodos de análise Estatística com base em dados adquiridos são divididos em métodos paramétricos e métodos não paramétricos, de acordo com a normalidade dos dados. Quando os dados satisfazem a normalidade, ele mostra uma curva de distribuição de probabilidade com a maior frequência de ocorrência no centro, e a frequência diminui com a distância do centro. A distância do centro da curva torna mais fácil determinar estatisticamente se os dados obtidos são frequentemente observados. Uma vez que a maioria dos dados são coletados em torno do valor médio, ele reflete a natureza do grupo e dá informações sobre se há uma diferença entre grupos e a magnitude da diferença. Por outro lado, se os dados não seguem a distribuição normal, não há garantia de que esteja centrado na média. Por conseguinte, a comparação de características entre grupos utilizando o valor médio não é possível. Neste caso, o teste não paramétrico é usado, no qual as observações são ordenadas ou assinadas (por exemplo, + ou−), e as somas são comparadas. No entanto, o teste não paramétrico é um pouco menos poderoso do que o teste paramétrico . Além disso, só é possível detectar a diferença entre os valores dos grupos, mas não comparar a magnitude dessas diferenças. Portanto, recomenda-se que a análise estatística seja realizada usando o teste paramétrico se possível , e que a normalidade dos dados seja a primeira coisa confirmada pelo teste paramétrico. A hipótese no teste de normalidade é a seguinte:

H0: os dados seguem uma distribuição normal.

H1: os dados não seguem uma distribuição normal.

assim, quantas amostras seriam apropriadas para assumir a distribuição normal e realizar testes paramétricos?

de acordo com o teorema do limite central, a distribuição dos valores médios da amostra tende a seguir a distribuição normal, independentemente da distribuição da população, se o tamanho da amostra é grande o suficiente . Por esta razão, existem alguns livros que sugerem que se o tamanho Da Amostra por grupo é grande o suficiente, o teste t pode ser aplicado sem o teste de normalidade. Estritamente falando, isso não é verdade. Embora o teorema do limite central garanta a distribuição normal dos valores médios da amostra, não garante a distribuição normal das amostras na população. O objetivo do teste t é comparar certas características que representam grupos, e os valores médios tornam-se representativos quando a população tem uma distribuição normal. Esta é a razão pela qual a satisfação do pressuposto de normalidade é essencial no teste-T. Por conseguinte, mesmo que a dimensão da amostra seja suficiente, recomenda-se que os resultados do teste de normalidade sejam verificados em primeiro lugar. Os métodos bem conhecidos de testes de normalidade incluem o teste de Shapiro-Wilks e o teste de Kolmogorov–Smirnov. Por conseguinte, o ensaio em t pode ser realizado com uma amostra de tamanho muito pequeno (por exemplo, 3) se o ensaio de normalidade for satisfeito?

no teste Shapiro-Wilks, que é conhecido como um dos mais poderosos testes de normalidade, é teoricamente possível realizar o teste de normalidade com três amostras . No entanto, mesmo que o valor P seja maior do que o nível de significância de 0,05, isso não significa automaticamente que os dados seguem uma distribuição normal. Erros de tipo I e tipo II ocorrem em todos os testes de hipótese, que são detectados usando os níveis de significância e potência. Em geral, os programas estatísticos fornecem apenas um valor P para o erro de tipo I como resultado de testes de normalidade, e não fornecem energia para o erro de tipo II. A potência do teste de normalidade indica a capacidade de discriminar distribuições não-normais a partir de distribuições normais. Uma vez que não existe uma fórmula que possa calcular a potência do teste de normalidade diretamente, ela é estimada por simulação de computador. Na simulação, o computador extrai repetidamente amostras de um determinado tamanho da distribuição a ser testada, e testa se as amostras extraídas possuem uma distribuição normal a um nível determinado de significância. A potência é a taxa a que a hipótese nula é rejeitada a partir dos dados obtidos através de simulações repetidas várias centenas de vezes. Se existirem apenas três amostras, pode ser difícil assegurar que estas não sejam normalmente distribuídas. Khan e Ahmad relataram a mudança de poder de acordo com tamanhos de amostra sob diferentes distribuições alternativas não-normais (Fig. 2). De fato, os tipos de distribuições mencionados na figura não são comumente observados em estudos clínicos, e não são essenciais para entender essa figura. Nós não explicamos em detalhes sobre isso porque ele vai além do nosso alcance. O eixo dos x representa o número de amostras extraídas de cada tipo de distribuição e o eixo dos y representa a potência do teste de normalidade correspondente ao número de amostras extraídas. Figo. 2 mostra que, embora haja algum grau de diferença, dependendo dos padrões de distribuição, a energia tende a diminuir quando o tamanho da amostra diminui, mesmo se o nível de significância é fixado em 0.05. Por conseguinte, em circunstâncias típicas em que o padrão de distribuição da população é Desconhecido, o teste de normalidade deve ser realizado com um tamanho de amostra suficiente.

Um arquivo externo que contém uma imagem, ilustração, etc. O nome do objecto é kja-d-18-00292f2.jpg

resultados de Potência do teste de Shapiro-Wilks em diferentes distribuições alternativas não normais a α = 0,05. O poder tende a diminuir quando o tamanho da amostra diminui. Distribuição logística: logística alternativa (localização = 0, Escala = 1) distribuição, distribuição Weibull: distribuição alternativa Weibull (escala = 2, Forma = 3) distribuição (modificada a partir de Khan RA, Ahmad F. Power comparação de vários testes de normalidade. Pakistan Journal of Statistics and Operation Research 2015; 11. Disponível em http://pjsor.com/index.php/pjsor/article/view/1082).

Deixe uma resposta

O seu endereço de email não será publicado.