Teste de Kruskal-Wallis e Nemenyi

No artigo “Como interpretar uma análise de variância?” vimos que para se utilizar ANOVA é necessário que algumas suposições, como a de normalidade e variância constante dos resíduos, sejam validadas. Mas o que fazer quando estas suposições não são atendidas? Um caminho alternativo é a utilização do teste de Kruskal-Wallis.

Em diversas áreas do conhecimento é comum encontrar a aplicabilidade de testes não-paramétricos, principalmente nas ciências sociais e humanas. Neste artigo, abordaremos os testes de Kruskal-Wallis e Nemenyi para comparações múltiplas.

Leia também: Como interpretar uma Análise de Variância (ANOVA)

O teste de Kruskal-Wallis          

O teste de Kruskal-Wallis é uma extensão do teste de Wilcoxon-Mann-Whitney. Enquanto o teste não paramétrico de Wilcoxon-Mann-Whitney consiste em comparar a distribuição de duas amostras, o teste de Kruskal-Wallis permite realizar a comparação de três ou mais grupos em amostras independentes.

Por isso o teste de Kruskal-Wallis é o método não-paramétrico alternativo à ANOVA para um fator (Kruskal e Wallis, 1952), sendo utilizado nos casos em que as suposições exigidas pela ANOVA não são atendidas.

Para utilizar o teste de Kruskal-Wallis é necessário que as variáveis sejam quantitativas ou estejam, pelo menos, em escala ordinal (como por exemplo variáveis medidas em escala likert).

Comparação de variável quantitativa Teste paramétrico Teste não-paramétrico
Entre dois grupos Teste t Teste Mann-Whitney
Entre três ou mais grupos ANOVA Teste de Kruskal-Wallis
Comparações múltiplas Teste de Tukey Teste de Nemenyi

Leia também: Teste t e Mann-Whitney para amostras independentes

Qual a diferença entre Kruskal-Wallis e ANOVA?

A principal diferença entre os testes se deve ao fato de que para fazer a ANOVA devemos validar as suposições de normalidade, variância constante e independência dos resíduos e que as variáveis devem ser do tipo contínuas. Já para a realização do teste de Kruskal-Wallis devemos considerar apenas a suposição de que as observações sejam independentes e que as variáveis sejam do tipo contínuas ou ordinais.

Além disso, enquanto a ANOVA testa a média e a variação entre os grupos (fatores), o teste de Kruskal-Wallis consiste em testar uma pseudo-mediana.

Pseudo-mediana? Afinal, o que o teste de Kruskal-Wallis testa?

Como dito anteriormente, o teste de Kruskal-Wallis é análogo à ANOVA e consiste em testar uma pseudo-mediana. Mas em rigor, o teste de Kruskal-Wallis avalia diferenças de médias de ordens (postos), as quais não são necessariamente iguais às medianas dos grupos, uma vez que é atribuído a cada observação seu posto (ordem).

Mas antes disso, deve-se ordenar as observações em ordem crescente, independente dos grupos, e em seguida fazer a distribuição dos postos, onde o menor valor recebe o posto ou ordem 1, o segundo 2 e assim sucessivamente, até que todas as observações tenham sido consideradas.

Quando há observações repetidas, é indicado que seja atribuído o valor médio dos postos entre estas observações. Por isso, pode ocorrer do resultado do teste apontar para a diferença significativa entre os grupos, mas as medianas serem iguais ou relativamente próximas. Quando isso ocorre, o teste de Kruskal-Wallis testa, em simultâneo, a mediana e as formas de distribuição.

Quando os grupos apresentam a mesma forma de distribuição de probabilidade, o resultado do teste de Kruskal-Wallis pode ser interpretado com base na mediana.

Aplicação do teste de Kruskal-Wallis

Vamos supor um experimento que foi elaborado com o objetivo de verificar o comportamento do peso de tomates italianos cultivados em solos enriquecidos com diferentes tipos de nutrientes.

Quatro solos foram enriquecidos com diferentes nutrientes e nomeados como “A”, “B”, “C” e “D”. Em seguida foram cultivados tomates italianos e, após o período de crescimento, foram colhidos e pesados seis tomates de cada solo.

Grupo Peso dos tomates italianos colhidos (em gramas)
Solo “A” 128,5 162,8 111,4 128,5 205,7 128,5
Solo “B” 128,5 102,8 102,8 179,9 248,5 137,1
Solo “C” 162,8 137,1 68,6 98,5 77,1 137,1
Solo “D” 85,7 102,8 111,4 77,1 60 68,6

Em nosso exemplo, podemos definir as hipóteses do teste como:

  • H0: Não existe diferença entre o peso do tomate italiano cultivado nos quatro solos.
  • H1: Há pelo menos um solo com o peso do tomate italiano cultivado diferente.

No boxplot abaixo pode-se visualizar o comportamento do peso dos tomates italianos cultivados em cada um dos quatro solos.

Essa aparente diferença do pesos dos tomantes cultivados nos diferentes solos é significativa?

Vamos entrar com os dados no R e utilizar o teste Kruskal Wallis para responder à essa questão.

> peso <- c(128.5, 162.8, 111.4, 128.5, 205.7, 128.5, 128.5, 102.8, 102.8, 179.9, 248.5, 137.1, 162.8, 137.1, 68.6, 98.5, 77.1, 137.1, 85.7, 102.8, 111.4, 77.1, 60, 68.6)
> cultivo <- c(rep("A",6),rep("B",6),rep("C",6),rep("D",6))
> kruskal.test(peso~factor(cultivo))

        Kruskal-Wallis rank sum test

data:  peso by factor(cultivo)
Kruskal-Wallis chi-squared = 9.0028, df = 3, p-value = 0.02925

O p-valor do teste de Kruskal-Wallis de 0,029 (menor que um nível de significância de 0,05) nos leva a rejeitar a hipótese nula de que não existe diferença entre o peso dos tomates italianos cultivados nos diferentes solos.

Mas como saber em quais solos o peso dos tomates se diferem?

Quando aplicamos a ANOVA para comparar os grupos e obtemos um resultado que indica que pelo menos dois grupos se diferem entre si, utilizamos o teste de Tukey para comparações múltiplas.

Leia também: Comparações Múltiplas – Teste de Tukey

Já ao utilizar o teste de Kruskal-Wallis, o teste de comparações múltiplas adequado é o de Nemenyi.

Teste de comparação múltipla de Nemenyi

O teste de Nemenyi (Nemenyi, 1963) é um teste post-hoc, ou seja, é um teste de comparação múltipla que é usado após a aplicação de teste não paramétricos com três ou mais fatores, como por exemplo, o teste de Kruskal-Wallis.

O teste consiste em fazer comparações em pares com o intuito de verificar qual dos fatores que diferem entre si. No entanto, o teste de Nemenyi é muito conservador e pode não encontrar diferença significativa entre os pares testados.

O pacote PMCMR do R, possui a função posthoc.kruskal.nemenyi.test() para se realizar o teste de comparação múltipla de Nemenyi.

> posthoc.kruskal.nemenyi.test(peso ~ factor(cultivo))

Pairwise comparisons using Tukey and Kramer (Nemenyi) test
with Tukey-Dist approximation for independent samples

data:  peso by factor(cultivo)

  A     B     C
B 1.000 -     -
C 0.663 0.713 -
D 0.044 0.055 0.456

Avaliando os p-valores das comparações duas a duas, podemos ver que o teste só revelou haver diferença significativa entre o peso dos tomates cultivados nos solos A e D (p-valor = 0,044). O teste não apresentou evidências de diferença significativa entre o peso dos tomates cultivados nos solos A e B (p-valor = 1,000), A e C (p-valor = 0,663), B e C (p-valor = 0,713), B e D (p-valor = 0,055) e entre os tomates cultivados nos solos C e D (p-valor = 0,456).

Agora que você sabe um pouco mais sobre a utilização dos testes não paramétricos de Kruskal-Wallis e Nemenyi para comparações múltiplas, se inscreva em nosso blog para receber nossas futuras publicações. Em caso dúvidas ou sugestões, entre em contato com nossos consultores.

Artigo desenvolvido com a colaboração de Bruna Faria.


Gostou deste conteúdo?
Inscreva-se para receber artigos, eBooks, planilhas, dicas e guias exclusivos.

Preencha seu melhor email!