Testes Não Paramétricos: Conceitos, Precauções e Vantagens

Depois de ler este artigo, você aprenderá sobre: ​​- 1. Conceitos de Testes Não Paramétricos 2. Suposições de Testes Não Paramétricos 3. Precauções 4. Alguns Testes Não-Paramétricos 5. Vantagens 6. Desvantagens.

Conceitos de testes não paramétricos:

Mais recentemente, vimos o desenvolvimento de um grande número de técnicas de inferência que não fazem numerosas ou rigorosas suposições sobre a população da qual amostramos os dados. Essas técnicas livres de distribuição ou não paramétricas resultam em conclusões que exigem menos qualificações.

Tendo usado um deles, poderíamos dizer que, “independentemente da forma da (s) população (s), podemos concluir que…”

Os dois nomes alternativos que são freqüentemente dados a esses testes são:

Livre de distribuição:

Testes não paramétricos são “livres de distribuição”. Eles não assumem que os escores sob análise são extraídos de uma população distribuída de uma determinada maneira, por exemplo, de uma população normalmente distribuída.

Ao fazer testes do significado da diferença entre dois meios (em termos do CR ou t, por exemplo), assumimos que os escores nos quais nossas estatísticas são baseadas são normalmente distribuídos na população. O que realmente fazemos - sob a hipótese nula - é estimar, a partir de nossa estatística de amostragem, a probabilidade de uma diferença real entre os dois parâmetros.

Quando N é muito pequeno ou os dados são muito distorcidos, de modo que a suposição de normalidade é duvidosa, os “métodos paramétricos” são de valor duvidoso ou não são aplicáveis. O que precisamos em tais casos são técnicas que nos permitam comparar amostras e fazer inferências ou testes de significância sem ter que assumir normalidade na população.

Tais métodos são chamados de não paramétricos ou de distribuição livre. O teste do qui-quadrado X2, por exemplo, é uma técnica não paramétrica. O significado de X 2 depende apenas dos graus de liberdade na tabela; nenhuma suposição precisa ser feita quanto à forma de distribuição para as variáveis ​​classificadas nas categorias da tabela X 2 .

O coeficiente de correlação de diferença de posição (rho) também é uma técnica não paramétrica. Quando p é calculado a partir de pontuações classificadas por ordem de mérito, a distribuição a partir da qual as pontuações são tomadas pode ser bastante distorcida e N é quase sempre pequena.

Testes de classificação:

Alternativamente, muitos desses testes são identificados como “testes de classificação”, e este título sugere seu outro mérito principal: técnicas não paramétricas podem ser usadas com pontuações que não são exatas em qualquer sentido numérico, mas que na verdade são simplesmente ranks.

Suposições de testes não paramétricos:

Um teste estatístico não paramétrico é baseado em um modelo que especifica apenas condições muito gerais e nenhuma em relação à forma específica da distribuição da qual a amostra foi retirada.

Algumas suposições estão associadas à maioria dos testes estatísticos não paramétricos, a saber:

1. Que as observações são independentes;

2. A variável em estudo tem continuidade subjacente;

3. Procedimentos não paramétricos para evitar hipóteses diferentes sobre a população do que procedimentos paramétricos;

4. Ao contrário dos testes paramétricos, existem testes não-paramétricos que podem ser aplicados adequadamente aos dados medidos em uma escala ordinal, e outros para dados em uma escala nominal ou categórica.

Precauções no uso de testes não paramétricos:

No uso de testes não paramétricos, o aluno é advertido contra os seguintes lapsos:

1. Quando as medições são em termos de escalas de intervalo e razão, a transformação das medições em escalas nominais ou ordinais levará à perda de muita informação. Portanto, na medida do possível, testes paramétricos devem ser aplicados em tais situações. Ao usar um método não paramétrico como um atalho, estamos jogando fora dólares para economizar centavos.

2. Em situações nas quais as suposições subjacentes a um teste paramétrico são satisfeitas e tanto testes paramétricos quanto não-paramétricos podem ser aplicados, a escolha deve ser feita no teste paramétrico, porque a maioria dos testes paramétricos tem maior poder em tais situações.

3. Testes não-paramétricos, sem dúvida, fornecem um meio para evitar a suposição de normalidade de distribuição. Mas esses métodos não fazem nada para evitar as hipóteses de independência na homocedasticidade, onde aplicável.

4. O cientista comportamental deve especificar a hipótese nula, a hipótese alternativa, o teste estatístico, a distribuição amostral e o nível de significância antes da coleta de dados. A busca por um teste estatístico depois que os dados foram coletados tende a maximizar os efeitos de quaisquer diferenças que favoreçam um teste em detrimento de outro.

Como resultado, a possibilidade de rejeitar a hipótese nula quando ela é verdadeira (erro tipo I) é bastante aumentada. No entanto, esse cuidado é aplicável igualmente a testes paramétricos e não paramétricos.

5. Não temos o problema de escolher testes estatísticos para variáveis ​​categóricas. Apenas testes não paramétricos são adequados para dados enumerativos.

6. Os testes F e T são geralmente considerados testes robustos porque a violação das suposições subjacentes não invalida as inferências.

Costuma-se justificar o uso de um teste teórico normal em uma situação em que a normalidade não pode ser garantida, argumentando que ele é robusto sob a não-normalidade.

Alguns testes não paramétricos:

Discutiremos alguns testes não paramétricos comuns.

1. Teste de Sinais:

O teste de sinais é a mais simples de todas as estatísticas livres de distribuição e possui um nível muito alto de aplicabilidade geral. É aplicável em situações em que a razão crítica, t, teste para amostras correlacionadas não pode ser usada porque as suposições de normalidade e homocedasticidade não são satisfeitas.

Os alunos estão cientes do fato de que certas condições na configuração do experimento introduzem o elemento de relação entre os dois conjuntos de dados.

Essas condições geralmente são uma situação de pré-teste, pós-teste; uma situação de teste e re-teste; teste de um grupo de sujeitos em dois testes; formação de “grupos combinados”, pareando algumas variáveis ​​estranhas que não são objeto de investigação, mas que podem afetar as observações.

No teste do sinal, testamos a significância do sinal da diferença (como mais ou menos). Este teste é aplicado quando N é menor que 25.

O exemplo a seguir nos deixará claro sobre o teste de sinais:

Exemplo:

As pontuações frequentemente submetidas sob duas condições diferentes, A e B são dadas abaixo. Aplique o teste de sinais e teste a hipótese de que A é superior a B.

Excluindo 0 (zero), temos nove diferenças, das quais sete são mais.

Agora temos que expandir o binômio, (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

O número total de combinações é 2 9 ou 512. Adicionando os 3 primeiros termos (p 9 + 9p 8 q + 36 p 7 q 2 ), temos um total de 46 combinações (ou seja, 1 de 9, 9 de 8 e 36 de 7) que contêm 7 ou mais sinais de adição.

Cerca de 46 vezes, em 512 ensaios, 7 ou mais sinais de 9 ocorrerão quando o número médio de sinais + sob a hipótese nula for 4.5. A probabilidade de 7 ou mais sinais +, portanto, é 46/512 ou .09, e claramente não é significativa.

Este é um teste unicaudal, uma vez que nossa hipótese afirma que A é melhor que B. Se a hipótese no início fosse que A e B diferem sem especificar qual é superior, teríamos um teste bicaudal para o qual P = 18.

Tabelas estão disponíveis que dão o número de sinais necessários para significância em diferentes níveis, quando N varia em tamanho. Quando o número de pares é tão grande quanto 20, a curva normal pode ser usada como uma aproximação para a expansão binomial ou o teste x 2 aplicado.

2. Teste Mediano:

O teste mediano é usado para comparar o desempenho de dois grupos independentes, como por exemplo, um grupo experimental e um grupo controle. Primeiro, os dois grupos são jogados juntos e uma mediana comum é calculada.

Se os dois grupos foram sorteados aleatoriamente da mesma população, 1/2 das pontuações em cada grupo deve ficar acima e 1/2 abaixo da mediana comum. Para testar essa hipótese nula, precisamos elaborar uma tabela 2 x 2 e calcular x 2 .

O método é mostrado no exemplo a seguir:

Exemplo:

Um psicólogo clínico quer investigar os efeitos de uma droga tranquilizante no tremor das mãos. Quatorze pacientes psiquiátricos recebem a droga, e 18 outros pacientes recebem dose inofensiva. O primeiro grupo é o experimental, o segundo o grupo de controle.

O medicamento aumenta a firmeza - como mostrado pelos escores mais baixos no grupo experimental? Como estamos preocupados apenas se o medicamento reduzir o tremor, este é um teste unicaudal.

Teste mediano aplicado a grupos experimentais e controle. Sinais positivos indicam escores acima da mediana comum, menos escores de sinais abaixo da mediana comum.

N = 14 N = 18

Mediana comum = 49, 5

A mediana comum é de 49, 5. No grupo experimental 4 as pontuações estão acima e 10 abaixo da mediana comum em vez das 7 acima e 7 abaixo de serem esperadas por acaso. No grupo controle, 12 escores estão acima e 6 abaixo da mediana comum, em vez dos 9 esperados em cada categoria.

Essas freqüências são inseridas na tabela a seguir e X 2 é calculado pela fórmula (declarada abaixo) com correção para continuidade:

AX 2 c de 3, 17 com 1 grau de liberdade produz ap, que fica em 0, 08, a meio caminho entre 0, 05 e 0, 10. Queríamos saber se a mediana do grupo experimental era significativamente menor do que a do controle (indicando assim mais estabilidade e menos tremor).

Para essa hipótese, um teste unicaudal, p / 2, é de aproximadamente 0, 04 e X2 c é significativo no nível 0, 5. Se nossa hipótese fosse de que os dois grupos diferissem sem especificar a direção, teríamos um teste bicaudal e X2 teria sido marcado como não significativo.

Nossa conclusão, feita de maneira um tanto provisória, é que a droga produz alguma redução no tremor. Mas, devido às pequenas amostras e à falta de um achado altamente significativo, o psicólogo clínico quase certamente repetiria o experimento - talvez várias vezes.

X 2 é geralmente aplicável no teste da mediana. No entanto, quando N 1 e N 2 são pequenos (por exemplo, menores que cerca de 10) e o teste X 2 não é preciso e o método exato de probabilidades de computação deve ser usado.

Vantagens dos testes não paramétricos:

1. Se o tamanho da amostra for muito pequeno, pode não haver alternativa ao uso de um teste estatístico não paramétrico, a menos que a natureza da distribuição da população seja conhecida exatamente.

2. Testes não paramétricos normalmente fazem menos suposições sobre os dados e podem ser mais relevantes para uma situação particular. Além disso, a hipótese testada pelo teste não-paramétrico pode ser mais apropriada para a investigação.

3. Testes estatísticos não paramétricos estão disponíveis para analisar dados que são inerentemente em ranks, bem como dados cujas pontuações aparentemente numéricas têm a força de ranks. Ou seja, o pesquisador só pode dizer de seus sujeitos que tem mais ou menos a característica do que o outro, sem poder dizer quanto mais ou menos.

Por exemplo, ao estudar uma variável como a ansiedade, podemos afirmar que o sujeito A é mais ansioso do que o sujeito B sem saber exatamente quanto é o ansioso.

Se os dados forem inerentemente classificados, ou mesmo se puderem ser categorizados apenas como mais ou menos (mais ou menos, melhor ou pior), eles podem ser tratados por métodos não paramétricos, enquanto não podem ser tratados por métodos paramétricos, a menos que precário e, talvez, suposições irrealistas são feitas sobre as distribuições subjacentes.

4. Métodos não paramétricos estão disponíveis para tratar dados que são simplesmente classificatórios ou categóricos, isto é, são medidos em uma escala nominal. Nenhuma técnica paramétrica aplica-se a tais dados.

5. Existem testes estatísticos não paramétricos adequados para tratar amostras compostas de observações de várias populações diferentes. Frequentemente, os testes paramétricos não podem manipular esses dados sem exigir que façamos suposições aparentemente irreais ou que requeiram cálculos complicados.

6. Testes estatísticos não paramétricos normalmente são muito mais fáceis de aprender e aplicar do que os testes paramétricos. Além disso, sua interpretação é mais direta do que a interpretação de testes paramétricos.

Desvantagens de testes não paramétricos:

1. Se todas as suposições de um método estatístico paramétrico forem, de fato, atendidas nos dados e a hipótese de pesquisa puder ser testada com um teste paramétrico, então os testes estatísticos não paramétricos são um desperdício.

2. O grau de desperdício é expresso pela eficiência energética do teste não paramétrico.

3. Outra objeção aos testes estatísticos não paramétricos é que eles não são sistemáticos, enquanto os testes estatísticos paramétricos foram sistematizados e testes diferentes são simplesmente variações de um tema central.

4. Outra objeção a testes estatísticos não paramétricos tem a ver com conveniência. As tabelas necessárias para implementar testes não paramétricos são amplamente distribuídas e aparecem em diferentes formatos.