Teste Qui-Quadrado: Significado, Aplicações e Usos

Depois de ler este artigo, você aprenderá sobre: ​​1. Significado do Teste do Qui-Quadrado 2. Níveis de Significância do Teste do Qui-Quadrado 3. Teste do Qui-Quadrado sob Hipótese Nula 4. Condições para a Validade 5. Propriedade Aditiva 6. Aplicações 7. Usos

Significado do Teste Qui-Quadrado:

O teste qui-quadrado (χ 2 ) representa um método útil de comparar resultados obtidos experimentalmente com aqueles que se espera teoricamente em algumas hipóteses.

Assim, o qui-quadrado é uma medida da divergência real das frequências observadas e esperadas. É muito óbvio que a importância de tal medida seria muito grande em estudos de amostragem nos quais invariavelmente estudamos a divergência entre teoria e fato.

O qui-quadrado, como vimos, é uma medida de divergência entre as frequências esperadas e observadas e, como tal, se não houver diferença entre as frequências esperadas e as observadas, o valor do qui-quadrado é 0.

Se houver diferença entre as freqüências observadas e as esperadas, o valor do qui-quadrado seria maior que 0. Ou seja, quanto maior o qui-quadrado, maior a probabilidade de divergência real dos resultados observados experimentalmente.

Se o valor calculado do qui-quadrado é muito pequeno em relação ao seu valor de tabela, isso indica que a divergência entre as freqüências reais e esperadas é muito pequena e, consequentemente, o ajuste é bom. Se, por outro lado, o valor calculado do qui-quadrado é muito grande em relação ao valor da tabela, indica que a divergência entre as frequências esperadas e observadas é muito grande e, consequentemente, o ajuste é ruim.

Para avaliar o qui-quadrado, entramos na Tabela E com o valor computado de qui-quadrado e o número apropriado de graus de liberdade. O número de df = (r - 1) (c - 1) em que r é o número de linhas ec o número de colunas nas quais os dados são tabulados.

Assim, em 2 x 2 graus de liberdade da tabela são (2 - 1) (2 - 1) ou 1. Da mesma forma na tabela 3 x 3, graus de liberdade são (3 - 1) (3 - 1) ou 4 e em 3 x 4 tabela os graus de liberdade são (3 - 1) (4 - 1) ou 6.

Níveis de significância do teste qui-quadrado:

Os valores calculados de χ 2 (Qui-quadrado) são comparados com os valores da tabela, para concluir se a diferença entre as frequências esperadas e observadas é devida às flutuações amostrais e como significativas ou se a diferença é devida a algum outro motivo e como tão significativo. A divergência entre teoria e fato é sempre testada em termos de certas probabilidades.

As probabilidades indicam a extensão da confiança que podemos colocar na conclusão tirada. Os valores da tabela de χ 2 estão disponíveis em vários níveis de probabilidade. Esses níveis são chamados níveis de significância. Normalmente, o valor de χ 2 no nível de significância de 0, 05 e 0, 01 para os graus de liberdade determinados é visto nas tabelas.

Se o valor calculado de χ 2 for maior que o valor tabulado, é considerado significativo. Em outras palavras, a discrepância entre as frequências observadas e esperadas não pode ser atribuída ao acaso e rejeitamos a hipótese nula.

Assim, concluímos que o experimento não suporta a teoria. Por outro lado, se o valor calculado de χ 2 for menor que o valor tabelado correspondente, então é considerado não significativo no nível de significância exigido.

Isto implica que a discrepância entre os valores observados (experimento) e os valores esperados (teoria) pode ser atribuída ao acaso, isto é, flutuações da amostragem.

Teste Qui-Quadrado sob Hipótese Nula:

Suponha que nos seja dado um conjunto de frequências observadas obtidas em alguns experimentos e queremos testar se os resultados experimentais suportam uma hipótese ou teoria particular. Karl Pearson, em 1990, desenvolveu um teste para testar a significância da discrepância entre os valores experimentais e os valores teóricos obtidos sob alguma teoria ou hipótese.

Este teste é conhecido como teste do χ 2 e é usado para testar se o desvio entre a observação (experimento) e a teoria pode ser atribuído ao acaso (flutuações da amostragem) ou se é realmente devido à inadequação da teoria para se ajustar ao observado dados.

Sob a hipótese nula, afirmamos que não há diferença significativa entre o observado (experimental) e os valores teóricos ou hipotéticos, ou seja, há uma boa compatibilidade entre teoria e experimento.

A equação para o qui-quadrado (χ 2 ) é declarada da seguinte forma:

em que f o = frequência de ocorrência de fatos observados ou experimentalmente determinados

f e = frequência esperada de ocorrência em algumas hipóteses.

Assim, o qui-quadrado é a soma dos valores obtidos dividindo o quadrado da diferença entre freqüências observadas e esperadas pelas freqüências esperadas em cada caso. Em outras palavras, as diferenças entre frequências observadas e esperadas são quadradas e divididas pelo número esperado em cada caso, e a soma desses quocientes é χ 2 .

Várias ilustrações do teste do qui-quadrado esclarecerão a discussão dada acima. As diferenças de f e f são escritas sempre + ve.

1. Testando a divergência de resultados observados daqueles esperados na hipótese de probabilidade igual (hipótese nula):

Exemplo 1:

Noventa e seis sujeitos são solicitados a expressar sua atitude em relação à proposição “A educação para a AIDS deve ser integrada no currículo do ensino médio do ensino médio” marcando F (favorável), I (indiferente) ou U (desfavorável).

Observou-se que 48 marcavam 'F', 24 'I' e 24 'U':

(i) Teste se os resultados observados divergem significativamente dos resultados esperados se não houver preferências no grupo.

(ii) Testar a hipótese de que “não há diferença entre as preferências do grupo”.

(iii) Interpretar os resultados.

Solução:

Os seguintes passos podem ser seguidos para o cálculo de x 2 e tirar as conclusões:

Passo 1:

Calcule as freqüências esperadas (f e ) correspondentes às freqüências observadas em cada caso sob alguma teoria ou hipótese.

Em nosso exemplo, a teoria é de igual probabilidade (hipótese nula). Na segunda linha, a distribuição das respostas esperadas na hipótese nula é igualmente selecionada.

Passo 2:

Calcule os desvios (f o - f e ) para cada frequência. Cada uma dessas diferenças é quadrada e dividida pela sua f e (256/32, 64/32 e 64/32).

Etapa 3:

Adicione estes valores para calcular:

Passo 4:

Os graus de liberdade na tabela são calculados a partir da fórmula df = (r - 1) (c - 1) para ser (3 - 1) (2 - 1) ou 2.

Passo 5:

Procure os valores calculados (críticos) de χ 2 para 2 df em determinado nível de significância, geralmente 5% ou 1%.

Com df = 2, o valor de χ 2 para ser significativo no nível 0, 01 é 9, 21 (Tabela E). O valor do χ 2 obtido de 12> 9, 21.

Eu. Daí a divergência marcada é significativa.

ii. A hipótese nula é rejeitada.

iii. Concluímos que nosso grupo realmente favorece a proposição.

Rejeitamos a hipótese da “resposta igual” e concluímos que nosso grupo favorece a proposição.

Exemplo 2:

O número de acidentes automobilísticos por semana em uma determinada comunidade foi o seguinte:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Essas frequências estão de acordo com a crença de que as condições de acidentes foram as mesmas durante esse período de dez semanas?

Solução:

Hipótese nula - Defina a hipótese nula de que as freqüências dadas (de número de acidentes por semana em uma determinada comunidade) são consistentes com a crença de que as condições do acidente foram as mesmas durante o período de 10 semanas.

Desde o número total de acidentes ao longo das 10 semanas são:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Sob a hipótese nula, estes acidentes devem ser uniformemente distribuídos ao longo do período de 10 semanas e, portanto, o número esperado de acidentes para cada uma das 10 semanas é de 100/10 = 10.

Já que o valor calculado de χ 2 = 26, 6 é maior que o valor tabulado, 21.666. É significativo e a hipótese nula é rejeitada no nível de significância de 0, 01. Assim, concluímos que as condições do acidente não são certamente uniformes (iguais) durante o período de 10 semanas.

2. Testando a divergência de resultados observados daqueles esperados na hipótese de uma distribuição normal:

A hipótese, em vez de ser igualmente provável, pode seguir a distribuição normal. Um exemplo ilustra como essa hipótese pode ser testada pelo qui-quadrado.

Exemplo 3:

Duzentos vendedores foram classificados em três grupos muito bons, satisfatórios e pobres - por consenso dos gerentes de vendas.

Esta distribuição de rating difere significativamente da esperada se a capacidade de vender é normalmente distribuída em nossa população de vendedores?

Estabelecemos a hipótese de que a capacidade de vender é normalmente distribuída. A curva normal estende-se de - 3σ a + 3σ. Se a capacidade de vender é normalmente distribuída, a linha de base pode ser dividida em três segmentos iguais, ou seja,

(+ 1σ a + 3σ), (- 1σ a + 1σ) e (- 3σ a - 1σ) representando vendedores bons, satisfatórios e pobres respectivamente. Referindo a Tabela A, encontramos que 16% dos casos estão entre + 1σ e + 3σ, 68% entre - 1σ e + 1σ e 16% entre - 3σ e - 1σ. No caso do nosso problema, 16% de 200 = 32 e 68% de 200 = 136.

df = 2. P é menor que 0, 01

O χ 2 calculado = 72, 76

O χ 2 calculado de 72, 76> 9, 21. Portanto, P é menor que 0, 01.

.˙. A discrepância entre frequências observadas e frequências esperadas é bastante significativa. Com base nisso, a hipótese de uma distribuição normal da capacidade de venda nesse grupo deve ser rejeitada. Assim, concluímos que a distribuição dos ratings difere da esperada.

3. Teste qui-quadrado quando nossas expectativas são baseadas em resultados predeterminados:

Exemplo 4:

Em um experimento de criação de ervilhas, um pesquisador obteve os seguintes dados:

A teoria prevê a proporção de feijão, em quatro grupos A, B, C e D deve ser 9: 3: 3: 1. Em um experimento entre 1.600 grãos, os números em quatro grupos foram 882, 313, 287 e 118. os resultados do experimento apóiam a teoria genética? (Teste no nível 0, 05).

Solução:

Estabelecemos a hipótese nula de que não há diferença significativa entre os valores experimentais e a teoria. Em outras palavras, há boa correspondência entre teoria e experimento, isto é, a teoria apóia o experimento.

Como o valor do χ 2 calculado de 4.726 <7.81, não é significativo. Portanto, hipótese nula pode ser aceita no nível de significância de 0, 05 e podemos concluir que os resultados experimentais apóiam a teoria genética.

4. O teste qui-quadrado quando as entradas da tabela são pequenas:

Quando as entradas da tabela são pequenas e quando a tabela é 2 x 2 vezes, isto é, df = 1, χ 2 está sujeito a erros consideráveis, a menos que uma correção para continuidade (chamada Correção de Yates) seja feita.

Exemplo 5:

Quarenta ratos foram oferecidos oportunidade de escolher entre duas rotas. Verificou-se que 13 escolheram rotas iluminadas (isto é, rotas com mais iluminação) e 27 escolheram rotas escuras.

(i) Testar a hipótese de que a iluminação não faz diferença na preferência dos ratos por rotas (Teste no nível 0, 05).

(ii) Testar se os ratos têm preferência por rotas escuras.

Solução:

Se a iluminação não faz diferença na preferência por rotas, ou seja, se H 0 for verdadeiro, a preferência proporcional seria de 1/2 para cada rota (ou seja, 20).

Em nosso exemplo, devemos subtrair 0, 5 de cada diferença (f o - f e ) pelo seguinte motivo:

Os dados podem ser tabulados da seguinte forma:

Quando as entradas esperadas na tabela 2 x 2 vezes são as mesmas que no nosso problema, a fórmula para o qui-quadrado pode ser escrita de uma forma um pouco mais curta, como segue:

(i) O valor crítico de χ 2 no nível 0, 05 é 3, 841. O χ 2 obtido de 4.22 é mais que 3.841. Portanto, a hipótese nula é rejeitada no nível 0, 05. Aparentemente, claro ou escuro é um fator na escolha dos ratos para as rotas.

(ii) Em nosso exemplo, temos que fazer um teste unilateral. Entrando na tabela E, descobrimos que χ 2 de 4, 22 tem um P = 0, 043 (por interpolação).

.˙. P / 2 = 0, 0215 ou 2%. Em outras palavras, há duas chances em 100 de que tal divergência ocorra.

Portanto, marcamos a divergência como significante no nível 02.

Portanto, concluímos que os ratos têm uma preferência por rotas escuras.

5. Teste de independência do qui-quadrado em tabelas de contingência:

Às vezes, podemos encontrar situações que nos obrigam a testar se existe alguma relação (ou associação) entre duas variáveis ​​ou atributos. Em outras palavras, o χ 2 pode ser feito quando desejamos investigar a relação entre características ou atributos que podem ser classificados em duas ou mais categorias.

Por exemplo, podemos ser obrigados a testar se a cor dos olhos do pai está associada à cor dos olhos dos filhos, se a condição sócio-econômica da família está associada à preferência de marcas diferentes de uma mercadoria, se a educação de casal e tamanho da família estão relacionados, se uma vacina particular tem um efeito de controle sobre uma doença particular etc.

Para fazer um teste, preparamos um final de tabela de contingência para calcular f e (frequência esperada) para cada célula da tabela de contingência e, em seguida, calculamos χ 2 usando a fórmula:

Hipótese nula:

O χ 2 é calculado assumindo que os dois atributos são independentes um do outro, ou seja, não há relação entre os dois atributos.

O cálculo da frequência esperada de uma célula é o seguinte:

Exemplo 6:

Em uma amostra de 2.000 famílias, 1.400 famílias são consumidoras de chá, onde 1236 são famílias hindus e 164 não-hindus.

E 600 famílias não são consumidoras de chá, onde 564 são famílias hindus e 36 não são hindus. Use o teste do χ 2 e indique se existe alguma diferença significativa entre o consumo de chá entre famílias hindus e não-hindus.

Solução:

Os dados acima podem ser organizados na forma de uma tabela de contingência 2 x 2, conforme abaixo:

Estabelecemos a hipótese nula (H 0 ) de que os dois atributos, ou seja, 'consumo de chá' e 'comunidade' são independentes. Em outras palavras, não há diferença significativa entre o consumo de chá entre famílias hindus e não-hindus.

Já que o valor calculado de χ 2, a saber, 15, 24 é muito maior que o valor tabelado de χ 2 ao nível de significância 0, 01; o valor de χ 2 é altamente significativo e a hipótese nula é rejeitada.

Portanto, concluímos que as duas comunidades (hindus e não-hindus) diferem significativamente quanto ao consumo de chá entre elas.

Exemplo 7:

A tabela abaixo mostra os dados obtidos durante uma epidemia de cólera.

Testar a eficácia da inoculação na prevenção do ataque da cólera.

Solução:

Montamos a hipótese nula (H 0 ) de que os dois atributos: inoculação e ausência de ataque da cólera não estão associados. Esses dois atributos na tabela fornecida são independentes.

Baseando-se em nossa hipótese, podemos calcular as freqüências esperadas da seguinte forma:

Cálculo de (f e ):

O valor de cinco por cento de χ 2 para 1 df é 3, 841, o que é muito menos do que o valor calculado de χ 2 . Assim, à luz disto, a conclusão é evidente que a hipótese é incorreta e a inoculação e a ausência de ataque da cólera estão associadas.

Condições para a validade do teste qui-quadrado:

A estatística de teste do Qui-quadrado pode ser usada se as seguintes condições forem satisfeitas:

1. N, a frequência total, deve ser razoavelmente grande, digamos maior que 50.

2. As observações da amostra devem ser independentes. Isto implica que nenhum item individual deve ser incluído duas ou mais vezes na amostra.

3. As restrições sobre as freqüências de célula, se houver, devem ser lineares (isto é, elas não devem envolver poderes quadrados e superiores das freqüências) como ∑f o = ∑f e = N.

4. Nenhuma frequência teórica deve ser pequena. Pequeno é um termo relativo. De preferência, cada frequência teórica deve ser maior que 10, mas em qualquer caso não menor que 5.

Se qualquer frequência teórica for menor que 5, então não podemos aplicar o teste χ2 como tal. Nesse caso, usamos a técnica de "pooling", que consiste em adicionar as freqüências que são menores que 5 com a frequência precedente ou seguinte (frequências), de modo que a soma resultante seja maior que 5 e ajuste os graus de liberdade de acordo.

5. A distribuição dada não deve ser substituída por frequências ou proporções relativas, mas os dados devem ser dados em unidades originais.

6. A correção de Yates deve ser aplicada em circunstâncias especiais quando df = 1 (isto é, em tabelas 2 x 2) e quando as entradas de célula são pequenas.

7. O teste do χ 2 é usado principalmente como um teste não direcional (ou seja, fazemos um teste bicaudal). No entanto, pode haver casos em que testes de χ 2 podem ser empregados na realização de um teste unilateral.

No teste unilateral, dobramos o valor-P. Por exemplo, com df = 1, o valor crítico de χ 2 no nível 05 é 2.706 (2.706 é o valor escrito no nível. 10) e o valor crítico de; χ 2 no nível 0, 01 é 5, 412 (o valor está escrito no nível 0, 02).

A Propriedade Aditiva do Teste Qui-Quadrado:

χ 2 tem uma propriedade muito útil de adição. Se vários estudos de amostra foram conduzidos no mesmo campo, os resultados podem ser reunidos para obter uma ideia precisa sobre a posição real.

Suponha que dez experimentos tenham sido conduzidos para testar se uma determinada vacina é eficaz contra uma doença em particular. Agora aqui teremos dez valores diferentes de χ 2 e dez valores diferentes de df.

Podemos adicionar dez χ 2 para obter um valor e, da mesma forma, dez valores de df também podem ser somados. Assim, teremos um valor de χ 2 e um valor de graus de liberdade. Agora podemos testar os resultados de todos esses dez experimentos combinados e descobrir o valor de P.

Suponha que cinco experimentos independentes tenham sido conduzidos em um campo particular. Suponha que em cada caso houvesse um df e os valores seguintes de χ 2 fossem obtidos.

Agora, com nível de significância de 5% (ou para P - 0, 05), o valor χ 2 para um df é 3, 841. A partir dos valores calculados de χ 2 apresentados acima, notamos que em apenas uma facilidade, ie, experimento No. 3, o valor observado de χ 2 é menor que o valor tabelado de 3.841.

Significa que, no que diz respeito a esta experiência, a diferença é insignificante, mas nos restantes quatro casos o valor calculado de χ 2 é superior a 3, 841 e, como tal, a 5% de significância, a diferença entre as frequências esperadas e reais é significativa .

Se somarmos todos os valores de χ 2, obtemos (4, 3 + 5, 7 + 2, 1 + 3, 9 + 8, 3) ou 24, 3. O total dos graus de liberdade é 5. Significa que o valor calculado de χ 2 para 5 df é 24, 3.

Se olharmos na tabela de χ 2, descobriremos que a 5% de significância para 5 df o valor de χ 2 é 11.070. O valor calculado de χ 2, que é 24, 3, é muito superior ao valor tabelado e, como tal, podemos concluir que a diferença entre frequências observadas e esperadas é significativa.

Mesmo se tomarmos o nível de significância de 1% (ou P = 0, 01), o valor da tabela de χ 2 é apenas 15, 086. Assim, a probabilidade de obter um valor χ 2 igual ou superior a 24, 3 como resultado de flutuações de amostragem é muito menor do que 0, 01 ou, em outras palavras, a diferença é significativa.

Aplicações do Teste Chi:

As aplicações da estatística do teste χ 2 podem ser discutidas conforme descrito abaixo:

1. Testando a divergência dos resultados observados dos resultados esperados quando nossas expectativas são baseadas na hipótese de probabilidade igual.

2. Teste qui-quadrado quando as expectativas são baseadas na distribuição normal.

3. Teste qui-quadrado quando nossas expectativas são baseadas em resultados predeterminados.

4. Correção da descontinuidade ou correção de Yates no cálculo do χ 2 .

5. Teste qui-quadrado de independência em tabelas de contingência.

Usos do Teste Qui-Quadrado:

1. Embora o teste seja realizado em termos de freqüências, ele pode ser melhor visualizado conceitualmente como um teste sobre proporções.

2. O teste do χ 2 é usado na hipótese de teste e não é útil para a estimativa.

3. O teste qui-quadrado pode ser aplicado a uma tabela de contingência complexa com várias classes.

4. O teste do qui-quadrado tem uma propriedade muito útil, isto é, 'a propriedade aditiva'. Se vários estudos de amostra forem conduzidos no mesmo campo, os resultados podem ser reunidos em conjunto. Isso significa que valores de χ 2 podem ser adicionados.