Erro padrão da média

Depois de ler este artigo, você aprenderá sobre o padrão da média.

A inferência estatística também nos ajuda a testar a hipótese de que “a estatística baseada na amostra não é significativamente diferente do parâmetro da população e que a diferença, se houver, é apenas devido à variação do acaso” .

Erro padrão da média (SE M ou σ M )

O erro padrão da média (SE M ) é muito importante para testar a representatividade, confiabilidade ou significância da média.

Suponha que calculamos a pontuação média de 200 meninos do 10º ano de Delhi no Teste de Habilidade Numérica como 40. Assim, 40 é a média de apenas uma amostra da população (todos os meninos lendo na classe X em Delhi).

Podemos também desenhar diferentes amostras aleatórias de 200 meninos da população. Suponha que escolhemos aleatoriamente 100 amostras diferentes, cada amostra consistindo de 200 meninos da mesma população e calculamos a média de cada amostra.

Embora 'n' seja 200 em cada caso, 200 meninos escolhidos aleatoriamente para constituir as diferentes amostras não são idênticos e assim, devido à flutuação na amostragem, obteríamos 100 valores médios dessas 100 amostras diferentes.

Esses valores médios tenderão a diferir um do outro e formarão uma série. Esses valores formam a distribuição amostral de médias. Pode ser expresso matematicamente que essas médias amostrais são distribuídas normalmente.

Os 100 valores médios (em nosso exemplo) cairão em uma distribuição normal em torno de M pop, sendo o M pop a média da distribuição amostral de médias. O desvio padrão dessas 100 médias amostrais é chamado SE M ou Erro Padrão da Média, que será igual ao desvio padrão da população dividido pela raiz quadrada de (tamanho da amostra).

O SE M mostra a propagação das médias da amostra em torno de M pop . Assim, SE M é uma medida de variabilidade das médias amostrais. É uma medida de divergência de médias amostrais de M pop . SE M também é escrito como σ M.

Erro padrão da média (SE M ou σ M ) é calculado usando a fórmula (para amostras grandes)

(A) Cálculo de SE M em amostras grandes :

onde σ = desvio padrão da população e

n = número de casos incluídos na amostra

(Como raramente podemos ter o SD de uma população, para σ usamos o valor de SD das médias amostrais).

Intervalo de confiança:

Os dois intervalos de confiança, ou seja, 95% e 99% estão em uso geral. RA Fisher nomeia os limites do intervalo de confiança que contém o parâmetro como “limites fiduciários” e denomina a confiança colocada no intervalo como probabilidade fiduciária.

(a) 95% do intervalo de confiança:

Referindo-se à tabela de área sob curva normal, encontramos que 95% dos casos situam-se entre M ± 1, 96 SE M. Que estamos 95% confiantes ou corretos ao dizer que M pop estaria no intervalo M + 1.96 SE M e M + 1.96 SE M e estamos 5% errados ao dizer que M pop vai ficar do lado desse intervalo.

Em outras palavras, a probabilidade de M pop estar no intervalo M ± 1, 96 SE M é 95% (ou 0, 95) e a probabilidade de M pop estar fora do intervalo é de 5% (ou 0, 05). O valor, 1, 96 é o valor crítico no nível de significância de 0, 05.

(b) 99% do intervalo de confiança:

Referindo-se à tabela de área sob curva normal, descobrimos que 99% dos casos situam-se entre M ± 2, 58 SE M. Que estamos 99% confiantes ou corretos ao dizer que M pop estaria no intervalo M - 2.58 SE M e M + 2.58 SE M e estamos errados em 1% ao dizer que M pop ficará fora desse intervalo.

Em outras palavras, a probabilidade de M pop estar no intervalo M ± 2, 58 SE M é 99% (ou 0, 99) e a probabilidade de M pop estar fora do intervalo é de 1% (ou 0, 01). O valor, 2, 58, é o valor crítico no nível de significância de 0, 01.

Aqui descobrimos que o nível de significância está inversamente relacionado à extensão da precisão. No nível 05 de significância, seríamos precisos em 95% dos casos e em nível de significância de 0, 01, estaríamos precisos em 99% dos casos.

A tabela abaixo irá preceder você:

Exemplo 1:

A média e DP de 225 meninos da classe XII de Delhi em um teste de habilidade numérica foram 48 e 6 respectivamente. Quão bem isso significa representar o M pop ou estimar M pop . (n = 225, σ = 6, média = 48]

Referindo-se à tabela de distribuição normal (Tabela A), descobrimos que todos os casos mais (99.7) estão em ± 3σ. No caso do nosso exemplo, todos os meios de amostragem estarão entre M pop + 3σ me M pop - 3σ M. Assim, qualquer média de amostra será melhor 3σ m menos que M pop em 3σ M mais que M pop .

Assim, se soubermos o valor de σ M, podemos inferir sobre o M pop da nossa média amostral. Aqui, 4 é o desvio padrão da distribuição das médias amostrais, cuja média é uma. Todos os meios de amostra que são normalmente distribuídos em torno de M pop estarão entre M pop + 3 SE M e M pop - 3 SE M.

3 SE M = 3 x 0, 4 = 1, 2

Embora não saibamos o valor exato de M pop, podemos pelo menos dizer com confiança que M pop está entre

(48 -1, 2) e (48 + 1, 2) ou 46, 8 → 49, 2

A partir da Tabela A, descobrimos que 95% das facilidades estão entre ± 1, 96 σ. No caso do nosso exemplo, o intervalo de confiança de 95% para M pop varia de M - 1, 96 SE M a M + 1, 96 SE M.

Agora, 1, 96 SE M = 1, 96 x 0, 4 = 0, 78

. . . M-1, 96 SE M = 48 - 0, 78 = 47, 22 e M + 1, 96 SE M = 48 + 0, 78 = 48, 78

. . . Intervalo de confiança de 95% varia de 47, 22 a 48, 78. O intervalo de confiança de 99% para M pop varia de M - 2, 58 SE M a M + 2, 58 SE M.

Agora 2, 58 SE M = 2, 58 X 0, 4 = 1, 03

. . . M - 2, 58 SE M = 48 - 1, 03 = 46, 97 e M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . Intervalo de confiança de 99% para M pop varia de 46, 97 a 49, 03.

Exemplo 2:

A média e o desvio padrão de 400 alunos em um teste foram 42 e 8. Você pode estimar o escore médio da população em intervalos de confiança de 99% e 95%?

Solução:

(i) intervalo de confiança de 95% para M pop varia de M - 1, 96 SE M para M + 1, 96 SE M.

Agora 1, 96 SE M = 1, 96 x 0, 4 = 0, 784

. . . M-1, 96 SE M = 42-0, 784 = 41, 22

e M + 1, 96 SE M = 42 + 0, 784 = 42, 78 (até duas casas decimais).

Assim, o intervalo de confiança de 95% varia de 41, 22 a 42, 78. Temos 95% de precisão que M pop fica entre 41, 22 e 42, 78.

(ii) intervalo de confiança de 99% para M pop varia de M - 2, 58 SE M a M + 2, 58 SE M

Agora 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42 - 1, 03 = 40, 97

e M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Assim, o intervalo de confiança de 99% varia de 40, 97 a 43, 03. Estamos 99% confiantes de que M pop fica entre 40.97 e 43.03.

Exemplo 3:

As médias e DP de uma amostra de 169 meninos em um teste de habilidade numérica são 50 e 6 respectivamente:

(i) Determine o intervalo de 95% para a média populacional e interprete-o.

(ii) Determine o erro amostral aceitável em 0, 05 e 0, 01 nível de significância.

(iii) Determine 99% de intervalo de confiança para M pop .

Solução:

M = 50

(i) intervalo de confiança de 95% para Mp 0p varia de M - 1, 96 SE M a M + 1, 96 SE M.

Agora 1, 96 SE m = 1, 96 x 0, 46 = 0, 90

Assim M-1, 96 SE M = 50- 0, 90 = 49, 10

e M + 1, 96 SE M = 50 +, 90 = 50, 90

. . . Intervalo de confiança de 95% para M pop varia de 49.10 a 50.90. Dos meios amostrais de 50, estimamos que o M pop tenha algum valor fixo entre 49, 10 e 50, 90 e, ao dizer isso, estamos com 95% de confiança.

Em outras palavras, nossa média amostral de 50 não perderá o M pop por mais de 0, 90 e isso será verdadeiro para 95 casos em 100. Alternativamente, somente em 5 casos em 100, nossa média de amostra de 50 perderá o M pop por mais de .90.

(ii) Valor crítico no nível 0, 05 de significância = 1, 96

Valor crítico no nível de significância de 0, 01 = 2, 58

“Erro de amostragem = valor crítico x SE M

Assim, o erro de amostragem no nível de significância de 0, 05 é de 1, 96 SE M e o nível de significância de 0, 01 é de 2, 58 SE M

Erro de amostragem aceitável no nível 0, 05 = 1, 96 SE M = 1, 96 x 0, 46 = 0, 90

Erro de amostragem permitido no nível 0, 01 = 2, 58 SE M = 2, 58 X 0, 46 = 1, 19

(iii) o intervalo de confiança de 99% varia de M - 2, 58 SE M a M + 2, 58 SE M

Agora 2, 58 SE M = 2, 58 X 0, 46 = 1, 19

Assim M-2, 58 SE M = 50-1, 19 = 48, 81

e M + 2, 58 SE M = 50 + 1, 19 = 51, 19

O intervalo de confiança de 99% varia de 48, 81 a 51, 19.

Exemplo 4:

Para um dado grupo de 500 soldados, a pontuação média do AGCT é de 95, 00 e o DP é de 25.

(ii) Determine o intervalo de confiança 0, 99 para a verdadeira média.

(ii) É improvável que a média verdadeira seja maior que qual valor?

Solução:

(i) O intervalo de confiança de 99% varia de M - 2, 58 SE M a M + 2, 58 SE M.

Agora 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Assim M-2, 58 SE M = 95, 0-2, 89 = 92, 11

e M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . O intervalo de confiança de 99% varia de 92, 11 a 97, 89.

De nossas médias amostrais de 95.0, estimamos que a média real seja algum valor fixo entre 92.11 e 97.89 e, digamos assim, estamos 99% confiantes.

(ii) Nossa média amostral de 95.0 não perderá a verdadeira média em mais de 2, 89 ou seja, a verdade não é maior que 97, 89.

(B) Cálculo de SE M em pequena amostra:

É convencional chamar qualquer amostra maior que 30 como amostra grande. Quando N é grande, não vale a pena fazer a correção. Mas quando N é “pequeno” (menos de 30), é aconselhável usar (N - 1), e é imperativo quando N é bem pequeno, menor que 10.

O aluno deve lembrar (i) que teoricamente (N - 1) sempre deve ser usado quando SD é uma estimativa da população a; e que (ii) a distinção entre “estatística de amostra grande” e “estatística de amostra pequena” em termos de um ponto de corte de N = 30 é arbitrária e é, em parte, uma questão de conveniência.

Quando N é menor que cerca de 30, a fórmula para o σ M ou SE M deve ser:

Exemplo 5:

Depois de cinco alunos conseguiram pontuações em um teste:

Determine os limites do limite de confiança de 95% para a média populacional.

As pontuações são - 11, 13, 9, 12, 15:

Solução:

M = 12

Aqui o df = n-1 = 5-1 = 4

Referindo-se à Tabela D, com df = 4, o valor de t no nível de significância de 0, 05 (isto é, nível de confiança de 95%) é 2, 78.

O intervalo de confiança de 95% define M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x 1, 0 = 9, 22 e

M + 2, 78 SE M = 12 + 2, 78 x 1, 0 = 14, 78

. . . Os limites de intervalo de confiança de 95% são 9, 22 e 14, 78.

Isso significa que P = 0, 95 que M pop está no intervalo de 9, 22 a 14, 78.

Exemplo 6:

Dez medidas do tempo de reação à luz são tiradas de um observador experiente. A média é de 175, 50 ms (milissegundos) e o S é de 5, 82 ms. Determine o intervalo de confiança de .95 para o M pop ; o intervalo de confiança .99.

Solução:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Os df (graus de liberdade) disponíveis para a determinação de t são (n - 1) ou (10 - 1) = 9

(i) Determinando 95% (ou 95) intervalo de confiança:

Entrando na Tabela D com 9 df, lemos que t = 2, 26 no ponto 0, 05.

Intervalo de confiança de 95% para M pop varia de M - 2, 26 SE M para M + 2, 26 SE M.

Agora 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Assim M - 2, 26 SE M = 175, 50 -4, 16 = 171, 34

e M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . Intervalo de confiança de 95% para M pop varia de 171, 34 a 179, 66. O P é 0, 95 que o M pop não é menor que 171, 34 nem maior que 179, 66. Se inferirmos que M pop está dentro desse intervalo, ao longo de uma longa série de experimentos, devemos estar certos 95% do tempo e errar 5%.

(ii) Determinando 99% (ou 0, 99) intervalo de confiança:

Entrando na Tabela D com 9 df lemos que t = 3, 25 a 0, 01 ponto. O intervalo de confiança de 99% para M pop varia de M - 3, 25 SE M a M + 3, 25 SE M.

Agora 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Assim M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

e M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . Intervalo de confiança de 99% para M pop varia de 169, 52 a 181, 48.

O P é 0, 99 que o M pop não é menor que 169, 52 nem maior que 181, 48. Se inferirmos que M pop está dentro deste intervalo, ao longo de uma longa série de experimentos, devemos estar certos - 99% do tempo e errado - 1%.

Inferências sobre outras estatísticas:

Como todas as estatísticas têm distribuições de amostragem e erros padrão, a significância da mediana, desvio quartil, desvio padrão, porcentagens e outras estatísticas podem ser interpretadas como a da média e podemos estimar o parâmetro.

(i) Erro padrão da mediana (ou SE Mdn -):

Em termos de SD e Q, os SE's da mediana para grandes amostras podem ser calculados através das seguintes fórmulas:

em que σ = SD da amostra, n = tamanho da amostra e Q = Desvio quartil da amostra.

Um exemplo ilustrará o uso e interpretação das fórmulas:

Exemplo 7:

Na Trabue Language Scale A, 801 meninos de 11 anos fizeram o seguinte registro:

Mediana = 21, 40 e Q = 4, 90. Quão bem esta mediana representa a mediana da população da qual essa amostra é retirada?

Solução:

n = 801, Mdn = 21, 40, Q = 4, 90.

Ao aplicar a segunda fórmula, o

Como N é grande, a distribuição amostral pode ser considerada normal e o intervalo de confiança encontrado a partir da última linha da Tabela D. O intervalo de confiança para o pop Mdn é de 21, 40 ± 2, 58 x 0, 32 ou 21, 40 ± 0, 83.

Podemos estar confiantes de que a mediana da população não é inferior a 20, 57 nem superior a 22, 23. Essa faixa estreita mostra um alto grau de confiabilidade na mediana da amostra.

(ii) Erro Padrão do Desvio Padrão (SE σ ):

O erro padrão do desvio padrão, como SE M, é encontrado calculando a provável divergência da amostra SD de seu parâmetro (população SD). A fórmula para SE σ é

Exemplo 8:

n = 400, σ = 6

Quão bem este SD representa o SD da população da qual a amostra é retirada?

Solução:

Quando as amostras são grandes e retiradas aleatoriamente de sua população, a fórmula acima pode ser aplicada e interpretada da mesma maneira que SE M.

Como N é grande, o intervalo de confiança de 0, 99 para SD pode ser seguramente levado nos limites de ± 2, 58 σ σ . Substituindo por σ σ temos 6 ± 2, 58 x .21 ou seja, os limites entre (6 - .54) e (6 + .54) ou 5.46 e 6.54.

Se assumirmos que o SD pop está entre os limites 5.46 e 6.54, devemos estar certos 99% do tempo e errar 1%.

(iii) Erro padrão do desvio quartil (ou SE Q ou σ q ):

SE Q pode ser encontrado nas fórmulas:

Exemplo 9:

n = 801, Q = 4, 90

Quão bem este Q representa a população Desvio Quartil?

Solução:

Aplicando a fórmula

O intervalo de confiança de 0, 99 para o pop Q é de 4, 90 ± 2, 58 x 0, 203, ou seja, de 4, 38 a 5, 42. Esse intervalo mostra que a amostra Q é uma estatística altamente confiável.

(iv) Erro Padrão de Porcentagem (ou SE% ou σ%):

Dê a porcentagem de ocorrência de um comportamento, a questão freqüentemente surge de quanta confiança podemos colocar na figura. Quão confiável é um índice nossa porcentagem da incidência do comportamento em que estamos interessados? Para responder a esta pergunta,

Devemos calcular o SE de uma porcentagem pela fórmula:

no qual

p = a ocorrência percentual do comportamento, q = (1 - p)

n = número de casos.

Exemplo 10:

Em um estudo sobre trapaça entre crianças do ensino fundamental, descobriu-se que 100 ou 25% das 400 crianças de lares de alto status socioeconômico haviam fraudado vários testes. Quão bem representa a porcentagem da população?

Solução:

p = 25% (ocorrência percentual)

q = 75% (100% - 25%)

Intervalo de confiança de 99% para a porcentagem da população varia de

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

e 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Podemos supor com 99% de confiança que as crianças do ensino fundamental de alto status socioeconômico enganariam com pelo menos 19, 4% e não seriam maiores que 30, 60%.

(v) Erro Padrão do Coeficiente de Correlação (SE r ou σ r ):

A fórmula clássica para o SE de a- é

(SE de um coeficiente de correlação r quando N é grande)

Exemplo 11:

n = 120, r = 0, 60.

Quais são os limites do intervalo de confiança de 99% para a população?

Solução:

Intervalo de confiança de 99%

= r ± 2, 58 SE r =, 60 ± 2, 58 SE r

= .60 ± .15 ou .45 a .75

Termos estatísticos importantes:

i) Níveis:

0, 05:

Probabilidade de errar em 5 amostras de 100 amostras.

0, 01:

Probabilidade de errar em uma amostra de 100 amostras.

(ii) Confiança:

No nível de significância de 0, 05, o pesquisador tem 95% de confiança de que os dados devem representar a população.

No nível de significância de 0, 01, o pesquisador tem 99% de confiança de que a estatística da amostra deve representar a população.

(iii) Níveis de Significância:

Antes de testar a hipótese, temos que decidir os critérios com os quais queremos aceitar ou rejeitar a hipótese nula. Temos que configurar o nível de significância antes do teste. Dois níveis de significância estão em uso geral: nível 0, 05 e nível 0, 01.

(a) 0, 05 nível de significância:

Lemos na Tabela A que 95% dos casos em uma distribuição normal estão dentro dos limites de ± 1, 96 SE M. Se tomarmos os limites especificados por M ± 1, 96 SE M, definimos um intervalo para o qual o nível de confiança é de 0, 95. Baseando nosso julgamento como o tamanho de M pop nesses limites, podemos estar certos 95% do tempo e errado 5%.

A área entre - 1, 96 SE M e + 1, 96 SE M é conhecida como a área de aceitação de H o e a área além de - 1, 96 SE M e + 1, 96 SE M é conhecida como a área de rejeição. Se qualquer média de amostra estiver na área de aceitação, aceitamos o H o . Ao rejeitar o H o admitimos que a média da amostra pode cair fora de ± 1, 96 SE M.

Assim, ao rejeitarmos H o, obtemos 5% de erro, porque em 5% de 100 facilita-se a média da amostra. Estamos dispostos a aceitar até 5% de risco ao rejeitar o que é quando isso acontece. Assim, o critério para rejeitar H o é refutar o nível de significância.

(b) .01 nível de significância:

Lemos na Tabela A que 99% das atenuações em uma distribuição normal estão dentro dos limites de ± 2, 58 SE M. Se excedermos os limites especificados por M ± 2, 58 SE M, definimos um intervalo para o qual o nível de confiança é 0, 99. Baseando nosso julgamento em relação ao tamanho de M pop nesses limites, estamos certos 99% do tempo e 1% errado.

A área entre - 2, 58 SE M e + 2, 58 SE M seria a área de aceitação de H 0 e a área além dela seria a área de rejeição de H o . Estamos dispostos a arriscar até 1% de risco ao rejeitar o que acontece quando isso acontece.

0, 01 nível de significância é mais exigente do que o nível .05 porque no nível 0, 01 o erro na rejeição de H o é de 1%, enquanto no nível 0, 05 esse erro é de 5%.

(iv) distribuição t:

Sempre que N é menor que cerca de 30, ou seja, quando a amostra é pequena, a distribuição de amostragem é chamada de “distribuição t ”.

A distribuição t não difere muito da normal, a menos que N seja bastante pequena. À medida que N aumenta de tamanho, a distribuição t aproxima-se cada vez mais da forma normal.

Propriedades da distribuição t:

1. Parece uma curva em forma de sino. Mas sua distribuição é mais variável com assimetria zero e 'Ku' maior que 3.

2. É simétrico em relação à linha t = 0.

3. É unimodal com a máxima ordenada em t = 0.

4. Quando N é pequeno, a distribuição t encontra-se sob a curva normal, mas as caudas ou extremidades da curva são maiores do que as partes correspondentes da curva normal.

5. As unidades ao longo da linha de base da distribuição t são, na verdade, σ scores, ou seja,

v) Graus de liberdade (df):

O conceito de graus de liberdade é altamente importante em estatísticas de pequenas amostras. É crucial também, na análise de variância e em outros procedimentos. Graus de liberdade significa liberdade para variar.

Vamos escolher cinco pontuações cuja média será 15. Agora suponha que as quatro pontuações sejam 18, 10, 20, 15. Para que a média seja igual a 15, a quinta pontuação deve ser 12. Temos, é claro, liberdade para escolher quaisquer quatro pontuações.

Mas não temos liberdade para escolher o quinto grau porque o quinto resultado faz ajustes na variação provocada pelos primeiros quatro escores e com uma suposição de que a média será 15. Aqui o N = 5 e uma restrição é imposta, isto é, o a média deve ser 15. Portanto, o grau de liberdade é N - 1 ou 4.

Se tivermos 5 notas 5, 6, 7, 8 e 9, a média é 7; e os desvios dos nossos escores de 7 são - 2, - 1, 0, 1 e 2. A soma desses desvios é zero. Dos 5 desvios, apenas 4 (N - 1) podem ser selecionados “livremente” como a condição de que a soma igual a zero imediatamente restrinja o valor do 5º desvio.

O SD é, obviamente, baseado nos quadrados dos desvios feitos ao redor da média. Existem N df para calcular a média, mas apenas (N - 1) disponível para o 'S' (o SD), já que um df é perdido no cálculo da média.

Em outro exemplo, onde N = 10, o df disponível para estimar o M pop foi dado como 9 ou (N - 1) ie um menor que o número de observações, a saber, 10. Um df é perdido computando o M e conseqüentemente apenas restam 9 para estimar o M pop por meio de 'S' e a distribuição t.

Sempre que uma estatística é usada para estimar um parâmetro, a regra é que o df disponível seja igual a N menos o número de parâmetros já estimados da amostra. O M é uma estimativa do M pop e na computação perdemos 1 df .

Ao estimar a confiabilidade de um r, por exemplo (que depende dos desvios de dois meios), o df é (N - 2). No caso de testes qui-quadrado e análise de variância, procedimentos separados são seguidos na determinação do df .

(vi) Hipótese nula:

A hipótese nula é uma ferramenta útil para testar a significância das diferenças. Esta hipótese afirma que não há diferença real entre duas médias populacionais, e que a diferença encontrada entre as médias amostrais é, portanto, acidental e sem importância.

A hipótese nula está relacionada ao princípio legal de que “um homem é inocente até que se prove a culpa”. Isso constitui um desafio e a função de um experimento é dar aos fatos a chance de refutar (ou não refutar) esse desafio.

Para ilustrar, suponha que se afirme que “os padrões instrucionais das escolas de turno único são melhores do que as escolas de turno duplo”. Essa hipótese é vagamente declarada e não pode ser testada com precisão.

Se afirmarmos que “as escolas de turno único não produzem melhores padrões de instrução do que as escolas de turno duplo” (a diferença real é zero). Esta hipótese nula é exata e pode ser testada. Se nossa hipótese nula não puder ser tributada, ela deve ser rejeitada. A instrução sem diferença assume que os dois grupos serão testados e considerados iguais.

A forma nula é preferida pela maioria do pessoal de pesquisa experiente. Essa forma de afirmação define mais prontamente o modelo matemático a ser utilizado no teste estatístico de hipóteses.

Uma hipótese nula nunca é provada ou refutada. Pode ser aceito ou rejeitado com certo grau de confiança (ou em certo nível de significância).

Antes de testar uma hipótese, devemos levar em conta o seguinte:

1. Se a amostra é grande ou pequena.

2. Qual é o nível de significância?

3. Se o teste é um teste bicaudal ou unicaudal.

(vii) Erros em fazer inferências:

Ao aceitar ou rejeitar a hipótese nula, existe a possibilidade de cometer dois tipos de erros e a luxúria deve ser levada em conta pelos pesquisadores.

Os chamados erros Tipo I e Tipo II podem ser explicados abaixo:

Erros de tipo I:

Tais erros são cometidos quando rejeitamos uma hipótese nula marcando uma diferença significativa, embora não haja diferença real. Suponha que a diferença entre duas médias populacionais (M pop - M pop = 0) seja realmente zero. (Por exemplo, meninos e meninas podem ser considerados como constituindo a mesma população em relação à maioria dos testes mentais). Se o teste de significância de duas médias de amostras reflete um fato de que a diferença nas médias populacionais é significativa, cometemos um erro do tipo I.

Erros do tipo II:

Esse tipo de erro é cometido quando aceitamos uma hipótese nula marcando uma diferença não significativa, embora exista uma diferença real. Suponha que haja uma diferença real entre as duas médias populacionais.

Se o nosso teste de significância aplicado aos dois meios amostrais nos leva a acreditar que a diferença nas médias populacionais não é significativa, cometemos um erro do Tipo II.

Várias precauções podem ser tomadas para evitar os dois tipos de erros. Se estabelecermos um nível baixo de significância (P é maior que 0, 05), aumentamos a probabilidade de erros do Tipo I; enquanto, se definirmos um alto nível de significância (P é menor que 0, 05), os erros do Tipo I serão menores. A possibilidade de desenhar inferências errôneas do tipo II é melhorada quando estabelecemos um nível muito alto de significância.

(viii) Testes bicaudais e unicaudais de significância:

Na hipótese nula, as diferenças entre as médias obtidas (isto é, M 1 - M 2 ) podem ser mais ou menos. Na determinação das probabilidades, tomamos as duas caudas da distribuição de amostragem.

(ix) Razão Crítica (CR):

A razão crítica (CR) é encontrada dividindo a diferença entre as médias amostrais pelo seu erro padrão (CR = D / SE D ). Quando os N's das amostras são grandes (30 ou mais é “grande”), a distribuição de CRs é conhecida como normal em torno da diferença real entre as médias populacionais, t é uma razão crítica na qual uma estimativa mais exata do σ D é usado. A distribuição amostral de t não é normal quando N é pequeno (menos de 30, digamos), t é um CR; mas todos os CRs não são t.

Teste bicaudal:

1. No teste bicaudal levamos em consideração ambas as caudas da curva normal.

2. No caso de hipótese alternativa não-adaptada, fazemos um teste bicaudal.

3. Exemplo:

Um teste de interesse é administrado a certos meninos em um profissional. Aulas de treinamento e certos meninos em uma aula de latim. A diferença média entre os dois grupos é significativa no nível 0, 05?

4. A média da amostra desvia de M pop em qualquer direção + ou -.

5. H 0 : M 1 - M 2 = 0

A : M 1 = M 2

6. Valor para ser significativo:

1, 96 no nível 0, 05

2, 58 no nível .01

7. A área de rejeição é dividida em ambas as extremidades (caudas) da curva normal (ou seja, 05 em 0, 025 e 0, 025, 01 em 0, 005 e 0, 005).

Teste unilateral:

1. Temos que considerar um alto, ou seja, à esquerda ou à direita da curva normal.

2. No caso de hipótese alternativa direcional, fazemos o teste unicaudal, M 1 > M 2 . Nesse caso, a direção é muito clara - uma face.

Exemplo:

Dez sujeitos recebem 5 trilhas sucessivas mediante um teste de símbolo de dígitos, do qual apenas são mostradas as pontuações das trilhas 1 e 5. O ganho médio do primeiro para o julgamento final é significativo?

4. A média da amostra se desvia da média da população em uma direção.

5. H 0 : M 1 = M 2

A : M 1 > M 2 ou M 1 <m 2

6. Valor para ser significativo:

1, 62 no nível 0, 05

2, 33 no nível .01

7. Há uma área de rejeição na cauda direita da distribuição ou na cauda esquerda da distribuição.