4 Medidas Comumente Usadas de Dispersão

Existem quatro medidas comumente usadas para indicar a variabilidade (ou dispersão) dentro de um conjunto de medidas. São eles: 1. Intervalo 2. Desvio de quartil 3. Desvio médio 4. Desvio padrão.

Medida nº 1. Intervalo:

Intervalo é o intervalo entre a pontuação mais alta e a mais baixa. O intervalo é uma medida da variabilidade ou dispersão das variações ou observações entre si e não dá uma ideia sobre a disseminação das observações em torno de algum valor central.

Simbolicamente R = Hs - Ls. Onde R = Intervalo;

Hs é a pontuação mais alta e Ls é a pontuação mais baixa.

Cálculo do intervalo (dados desagrupados):

Exemplo 1:

As dezenas de dez meninos em um teste são:

17, 23, 30, 36, 45, 51, 58, 66, 72, 77.

Exemplo 2:

As dezenas de dez meninas em um teste são:

48, 49, 51, 52, 55, 57, 50, 59, 61, 62.

No exemplo I, a pontuação mais alta é 77 ​​e a pontuação mais baixa é 17.

Então o intervalo é a diferença entre essas duas pontuações:

. . . Intervalo = 77 - 17 = 60

De maneira semelhante, no exemplo II

Intervalo = 62 - 48 = 14

Aqui nós achamos que as pontuações dos meninos estão amplamente espalhadas. Assim, as pontuações dos meninos variam muito. Mas as pontuações das meninas não variam muito (claro que elas variam menos). Assim, a variabilidade dos escores dos meninos é maior que a variabilidade dos escores das meninas.

Cálculo do intervalo (dados agrupados):

Exemplo 3:

Encontre o intervalo de dados na seguinte distribuição:

Solução:

Nesse caso, o limite superior verdadeiro da classe mais alta 70-79 é Hs = 79, 5 e o limite inferior verdadeiro da classe mais baixa 20-29 é Ls = 19, 5

Portanto, Faixa R = Hs - Ls

= 79, 5 - 19, 5 = 60, 00

Intervalo é um índice de variabilidade. Quando o intervalo é mais, o grupo é mais variável. Quanto menor o intervalo, mais homogêneo é o grupo. Intervalo é a medida mais geral de 'propagação' ou 'dispersão' de pontuações (ou medidas). Quando desejamos fazer uma comparação aproximada da variabilidade de dois ou mais grupos, podemos computar o intervalo.

A faixa comparada acima está em uma forma bruta ou é uma medida absoluta de dispersão e é imprópria para fins de comparação, especialmente quando as séries estão em duas unidades diferentes. Para fins de comparação, o coeficiente de variação é calculado dividindo-se o intervalo pela soma dos itens maiores e menores.

Vantagens:

1. O intervalo pode ser calculado com facilidade.

2. É uma medida mais simples de dispersão.

3. É calculado quando queremos fazer uma comparação aproximada de dois ou mais gráficos de variabilidade.

Limitações:

1. O intervalo não é baseado em todas as observações da série. Leva em conta apenas os casos mais extremos.

2. Isso nos ajuda a fazer apenas uma comparação aproximada de dois ou mais grupos de variabilidade.

3. O intervalo leva em consideração as duas pontuações extremas de uma série.

Assim, quando N é pequeno ou quando há grandes lacunas na distribuição de frequência, o intervalo como medida de variabilidade é pouco confiável.

Exemplo 4:

Pontuações do Grupo A - 3, 5, 8, 11, 20, 22, 27, 33

Aqui intervalo = 33 - 3 = 30

Pontuações do Grupo B - 3, 5, 8, 11, 20, 22, 27, 93

Aqui intervalo = 93 - 3 = 90.

Basta comparar a série de pontuações no grupo A e no grupo B. No grupo A, se um único escore 33 (a última pontuação) for alterado para 93, o intervalo será amplamente alterado. Assim, uma única pontuação alta pode aumentar o intervalo de baixo para alto. É por isso que o alcance não é uma medida confiável da variabilidade.

4. É muito afetado por flutuações na amostragem. Seu valor nunca é estável. Em uma aula em que normalmente a altura dos alunos varia de 150 cm a 180 cm, se um anão, cuja altura é de 90 cm, for admitido, o alcance seria de 90 cm a 180 cm.

5. O intervalo não apresenta a série e a dispersão verdadeiramente. A distribuição assimétrica e simétrica pode ter a mesma faixa, mas não a mesma dispersão. É de precisão limitada e deve ser usado com cautela.

No entanto, não devemos ignorar o fato de que o alcance é uma medida bruta de dispersão e é totalmente inadequado para estudos precisos e precisos.

Medida # 2. Desvio de quartil:

Intervalo é o intervalo ou a distância na escala de medição que inclui 100% de casos. As limitações do intervalo são devidas à sua dependência apenas dos dois valores extremos.

Existem algumas medidas de dispersão que são independentes desses dois valores extremos. O mais comum deles é o desvio quartil que é baseado no intervalo contendo os 50% dos casos intermediários em uma determinada distribuição.

O desvio do quartil é metade da distância da escala entre o terceiro quartil e o primeiro quartil. É a faixa semi-interquartílica de uma distribuição:

Antes de assumir o desvio quartil, devemos conhecer o significado de quartis e quartis.

Por exemplo, um resultado de teste 20 pontuações e essas pontuações são organizadas em ordem decrescente. Vamos dividir a distribuição das pontuações em quatro partes iguais. Cada parte apresentará um 'trimestre'. Em cada trimestre haverá 25% (ou 1/4 de N) casos.

Como as pontuações são organizadas em ordem decrescente,

As 5 melhores pontuações serão no 1º trimestre,

As próximas 5 pontuações serão no 2º trimestre,

As próximas 5 pontuações serão no 3º trimestre, e

E as 5 pontuações mais baixas serão no 4º trimestre.

Com o objetivo de estudar melhor a composição de uma série, pode ser necessário dividi-la em três, quatro, seis, sete, oito, nove, dez ou cem partes.

Normalmente, uma série é dividida em quatro, dez ou cem partes. Um item divide a série em duas partes, três itens em quatro partes (quartis), nove itens em dez partes (decis) e noventa e nove itens em cem partes (percentis).

Existem, portanto, três quartis, nove decis e noventa e nove percentis em uma série. O segundo quartil, ou o 5º decil ou o 50º percentil é a mediana (veja a Figura).

O valor do item que divide a primeira metade de uma série (com valores menores que o valor da mediana) em duas partes iguais é chamado de primeiro quartil (Q 1 ) ou quartil inferior. Em outras palavras, Q 1 é um ponto abaixo do qual 25% dos casos se encontram. Q 1 é o 25º percentil.

O segundo quartil (Mdn) ou o quartil médio é a mediana. Em outras palavras, é um ponto abaixo do qual 50% das pontuações estão. Uma mediana é o 50º percentil.

O valor do item que divide a última metade da série (com valores maiores que o valor da mediana) em duas partes iguais é chamado de Terceiro Quartile (Q 3 ) ou Quartile Superior. Em outras palavras, Q 3 é um ponto abaixo do qual 75% das pontuações se encontram. Q 3 é o 75º percentil.

Nota:

Um aluno deve distinguir claramente entre um quarto e um quartil. Trimestre é um intervalo; mas o quartil é um ponto na escala. Os quartos são numerados de cima para baixo (ou da pontuação mais alta para a pontuação mais baixa), mas os quartis são numerados de baixo para cima.

O desvio do quartil (Q) é metade da distância da escala entre o terceiro quartil (Q 3 ) e o primeiro quartil (Q 1 ):

L = limite inferior do ci onde Q 3 está,

3N / 4 = 3/4 de nem 75% de N.

F = total de todas as frequências abaixo de 'L'

fq = Frequência do ci sobre o qual Q 3 reside e i = tamanho ou comprimento do ci

L = limite inferior do ci onde Q 1 está,

N / 4 = um quarto (ou 25%) de N

F = total de todas as frequências abaixo de 'L'

fq = frequência do ci sobre o qual Q 1 está,

ei = tamanho ou comprimento de ci

Intervalo interquartil:

O intervalo entre o terceiro quartil e o primeiro quartil é conhecido como a faixa interquartil. Faixa simbolicamente interquartil = Q 3 - Q 1 .

Faixa semi-interquartílica:

É a metade da distância entre o terceiro quartil e o primeiro quartil.

Assim, SI R. = Q 3 - Q 1/4

Desvio Q ou Quartile é também conhecido como intervalo semi-interquartil (ou SIR)

Assim, Q = Q 3 - Q 1/2

Se compararmos a fórmula de Q 3 e Q 1 com a fórmula de mediana, as seguintes observações ficarão claras:

Eu. No caso da mediana usamos N / 2 enquanto para Q 1 usamos N / 4 e para Q 3 usamos 3N / 4.

ii. No caso da mediana, usamos fm para denotar a frequência de ci, sobre a qual a mediana se encontra; mas no caso de Q 1 e Q 3 usamos fq para denotar a frequência da ci sobre a qual Q 1 ou Q 3 estão.

Computação de Q (dados desagrupados):

Para calcular Q, somos obrigados a calcular Q 3 e Q 1 primeiro. Q 1 e Q 3 são calculados da mesma maneira como estávamos calculando a mediana.

As únicas diferenças são:

(i) no caso de mediana, estávamos contando 50% dos casos (N / 2) do fundo, mas

(ii) no caso de Q 1 temos que contar 25% dos casos (ou N / 4) do fundo e

(iii) no caso de Q3, temos que contar 75% dos casos (ou 3N / 4) do fundo.

Exemplo 5:

Descubra Q das seguintes pontuações 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39.

Existem 20 pontuações.

25% de N = 20/4 = 5

Q 1 é um ponto abaixo do qual 25% dos casos se encontram. Neste exemplo, Q 1 é um ponto abaixo do qual 5 casos se encontram. A partir da simples inspeção de dados ordenados, verifica-se que abaixo de 24, 5 há 5 casos. Assim Q 1 = 24, 5

Da mesma forma Q 3 é um ponto abaixo do qual 75% de eases mentem.

75% de N = 3/4 x 20 = 15

Descobrimos que abaixo de 34, 5, 15 casos estão

Assim Q 3 = 34, 5.

Em uma distribuição simétrica, a mediana fica na metade da escala de Q 1 e Q 3 . Portanto, o valor Q 1 + Q ou Q 3 - Q indica o valor da mediana. Mas, geralmente, as distribuições não são simétricas e, portanto, Q1 + Q ou Q3-Q não dariam o valor da mediana.

Computação de Q (dados agrupados):

Exemplo 6:

As pontuações obtidas por 36 alunos em um teste são mostradas na tabela. Encontre o desvio quartil das pontuações.

Na coluna 1, tomamos a classe Intervalo, na coluna 2, tomamos a freqüência, e na coluna 3, as freqüências acumuladas a partir do fundo foram escritas.

Aqui N = 36, então para Q 1 temos que tomar N / 4 = 36/4 = 9 casos e para Q 3 temos que tomar 3N / 4 = 3 x 36/4 = 27 casos. Olhando para a coluna 3, cf = 9 será incluído em ci 55 - 59, cujo limite real é 54, 5 - 59, 5. Q1 ficaria no intervalo 54, 5 - 59, 5.

O valor de Q 1 deve ser calculado da seguinte forma:

Para o cálculo Q 3, cf = 27 será incluído em ci 65 - 69, cujos limites reais são 64. 5 - 69.5. Assim Q 3 ficaria no intervalo 64, 5 - 69, 5 e seu valor deve ser calculado da seguinte forma:

Interpretação do Desvio Quartile:

Ao interpretar o valor do desvio quartil, é melhor ter os valores de Mediana, Q1 e Q3, juntamente com Q. Se o valor de Q for maior, então a dispersão será mais, mas novamente o valor depende da escala. de medição. Dois valores de Q devem ser comparados somente se a escala usada for a mesma. Q medido para pontuações de 20 não pode ser comparado diretamente com Q para pontuações de 50.

Se mediana e Q são conhecidos, podemos dizer que 50% dos casos estão entre 'Mediana - Q' e 'Mediana + Q'. Estes são os 50% do meio dos casos. Aqui, chegamos a conhecer o intervalo de apenas 50% dos casos. Como os 25% inferiores dos casos e os 25% superiores dos casos estão distribuídos, não é conhecido através desta medida.

Às vezes, os casos ou valores extremos não são conhecidos, caso em que a única alternativa disponível para nós é calcular o desvio mediano e quartil como medida de centralidade, tendência e dispersão. Através de mediana e quartis podemos inferir sobre a simetria ou assimetria da distribuição. Vamos, portanto, ter uma ideia das distribuições simétricas e distorcidas.

Distribuições Simétricas e Assimétricas:

Diz-se que uma distribuição é simétrica quando as frequências são distribuídas simetricamente em torno da medida de tendência central. Em outras palavras, podemos dizer que a distribuição é simétrica se os valores em igual distância nos dois lados da medida de tendência central tiverem freqüências iguais.

Exemplo 7:

Descubra se a distribuição dada é simétrica ou não.

Aqui a medida de tendência central, tanto média como mediana, é 5. Se começarmos a comparar as frequências dos valores nos dois lados de 5, descobrimos que os valores 4 e 6, 3 e 7, 2 e 8, 1 e 9, 0 e 10 têm o mesmo número de frequências. Então a distribuição é perfeitamente simétrica.

Em uma distribuição simétrica, a média e a mediana são iguais e a mediana encontra-se a uma distância igual dos dois quartis, isto é, Q3 - Mediana = Mediana - Q1.

Se uma distribuição não é simétrica, então a partida da simetria se refere à sua assimetria. A assimetria indica que a curva está voltada mais para um lado do que para o outro. Então a curva terá uma cauda mais longa em um lado.

Diz-se que a assimetria é positiva se a cauda mais longa estiver no lado direito e se for negativa se a cauda mais longa estiver no lado esquerdo.

As figuras a seguir mostram a aparência de uma curva inclinada e negativamente inclinada:

Q 3 - Mdn> Mdn - Q 1 indica assimetria ve

Q 3 - Mdn <Mdn - Q 1 indica assimetria ve

Q 3 - Mdn = Mdn - Q 1 indica assimetria zero

Méritos de Q:

1. É uma medida de variabilidade mais representativa e confiável do que a faixa total.

2. É um bom índice de densidade de pontuação no meio da distribuição.

3. Os quartis são úteis para indicar a assimetria de uma distribuição.

4. Como a mediana, Q é aplicável a distribuições abertas.

5. Sempre que a mediana é preferida como uma medida de tendência central, o desvio quartil é preferido como medida de dispersão.

Limitações de Q:

1. Entretanto, como mediana, o desvio quartil não é passível de tratamento algébrico, pois não leva em consideração todos os valores da distribuição.

2. Só calcula o terceiro e o primeiro quartil e nos fala sobre o alcance. De Q 'não podemos obter uma imagem real sobre como as pontuações estão dispersas do valor central. Isso é 'Q' não nos dá nenhuma ideia sobre a composição das pontuações. 'Q' de duas séries pode ser igual, mas a série pode ser bastante diferente na composição.

3. Quase dá uma ideia de dispersão.

4. Ignora os escores acima do terceiro quartil e os escores abaixo do primeiro quartil. Ele simplesmente nos fala sobre os 50% da distribuição.

Usos de Q:

1. Quando a mediana é uma medida de uma tendência central;

2. Quando a distribuição está incompleta em cada extremidade;

3. Quando há pontuação dispersa ou extrema que influenciaria desproporcionalmente o DS;

4. Quando a concentração em torno da mediana - o meio de 50% dos casos é de interesse primário.

Coeficiente de Desvio de Quartile:

O desvio quaternário é uma medida absoluta de dispersão e, para torná-lo relativo, calculamos o 'coeficiente de desvio quartil'. O coeficiente é calculado dividindo o desvio quartil pela média dos quartis.

É dado por:

Coeficiente de desvio quartil = Q 3 - Q 1 / Q 3 + Q 1

Onde Q 3 e Q 1 se referem aos quartis superior e inferior, respectivamente.

Medida # 3. Desvio Médio (AD) ou Desvio Médio (MD):

Como já discutimos o intervalo e o 'Q' nos dá alguma ideia da variabilidade. O intervalo de duas séries pode ser o mesmo ou o desvio quartil de duas séries pode ser o mesmo, mas as duas séries podem ser diferentes. Nem o intervalo nem o 'Q' falam da composição da série. Essas duas medidas não levam em consideração as pontuações individuais.

O método do desvio médio ou 'o desvio médio', como é chamado às vezes, tende a remover uma deficiência séria de ambos os métodos (Range e 'Q'). O desvio médio é também chamado de primeiro momento de dispersão e é baseado em todos os itens de uma série.

Desvio médio é a média aritmética dos desvios de uma série calculada a partir de alguma medida de tendência central (média, mediana ou moda), sendo todos os desvios considerados positivos. Em outras palavras, a média dos desvios de todos os valores da média aritmética é conhecida como desvio médio ou desvio médio. (Normalmente, o desvio é retirado da média da distribuição.)

Onde ∑ é a soma total de;

X é a pontuação; M é a média; N é o número total de pontuações.

E 'd' significa o desvio de pontuações individuais da média.

Computação do Desvio Médio (dados não agrupados):

Exemplo 8:

Encontre o desvio médio para o seguinte conjunto de variáveis:

X = 55, 45, 39, 41, 40, 48, 42, 53, 41, 56

Solução:

Para encontrar o desvio médio, primeiro calculamos a média para o conjunto de observações dado.

Os desvios e os desvios absolutos são apresentados na Tabela 4.2:

Exemplo 9:

Encontre o desvio médio para as pontuações dadas abaixo:

25, 36, 18, 29, 30, 41, 49, 26, 16, 27

A média dos escores acima foi de 29, 7.

Para calcular o desvio médio:

Nota:

Se você aplicar alguma álgebra, verá que ∑ (X - M) é zero

Computação do Desvio Médio (dados agrupados):

Exemplo 10:

Encontre o desvio médio para a seguinte distribuição de frequência:

Aqui, na coluna 1, escrevemos o ci 's, na coluna 2, escrevemos as frequências correspondentes, na coluna 3, escrevemos os pontos médios do ci' s que é denotado por 'X', na coluna 4, escrevemos o produto de frequências e pontos médios dos ci's denotados por X, na coluna 5, escrevemos os desvios absolutos dos pontos médios de ci da média que é denotada por | d | e na coluna 6, escrevemos o produto de desvios absolutos e frequências, indicado por | fd |.

Méritos do Desvio Médio:

1. Desvio médio é a medida mais simples de dispersão que leva em consideração todos os valores em uma determinada distribuição.

2. É facilmente compreensível até por uma pessoa não muito versada em estatística.

3. Não é muito afetado pelo valor de itens extremos.

4. É a média dos desvios dos escores individuais da média.

Limitações:

1. Desvio médio ignora os sinais algébricos dos desvios e, como tal, não é capaz de tratamento matemático adicional. Então, é usado apenas como medida descritiva da variabilidade.

2. De fato, o MD não é de uso comum. É raramente usado na estatística moderna e geralmente a dispersão é estudada por desvio padrão.

Usos do MD:

1. Quando se deseja pesar todos os desvios de acordo com seu tamanho.

2. Quando é necessário saber até que ponto as medidas estão espalhadas em ambos os lados da média.

3. Quando desvios extremos influenciam indevidamente o desvio padrão.

Interpretação do Desvio Médio:

Para interpretar o desvio médio, é sempre melhor examiná-lo juntamente com a média e o número de casos. A média é necessária porque a média e o desvio médio são respectivamente o ponto e a distância na mesma escala de medida.

Sem média, o desvio médio não pode ser interpretado, pois não há indício para a escala de medição ou a unidade de medida. O número de casos é importante porque a medida da dispersão depende disso. Para um menor número de casos, a medida provavelmente será mais.

Nos dois exemplos, temos:

No primeiro caso, o desvio médio é quase 25% da média, enquanto no segundo caso é menor. Mas o desvio médio pode ser mais no primeiro caso devido ao menor número de casos. Assim, os dois desvios médios calculados acima indicam uma dispersão quase semelhante.

Medida # 4. Desvio Padrão ou SD e Variância:

De várias medidas de dispersão, a medida mais usada é o "desvio padrão". É também o mais importante por ser a única medida de dispersão passível de tratamento algébrico.

Aqui também, os desvios de todos os valores da média da distribuição são considerados. Essa medida sofre os menores inconvenientes e fornece resultados precisos.

Ele remove a desvantagem de ignorar os sinais algébricos enquanto calcula os desvios dos itens da média. Em vez de negligenciar os sinais, nós ajustamos os desvios, tornando todos positivos.

Difere da DA em vários aspectos:

Eu. Computando AD ou MD, nós desconsideramos os sinais, ao passo que ao encontrar o SD evitamos a dificuldade dos signos esquadrando os desvios separados;

ii. Os desvios quadrados usados ​​na computação SD são sempre tirados da média, nunca da mediana ou modo.

“Desvio padrão ou SD é a raiz quadrada da média dos desvios quadrados das pontuações individuais da média da distribuição.”

Para ser mais claro, devemos observar aqui que, ao computar o SD, ajustamos todos os desvios separadamente. Encontre a soma, divida a soma pelo número total de pontuações e depois encontre a raiz quadrada da média dos desvios quadrados.

Portanto, SD também é chamado de 'Desvio médio da raiz da média' e é geralmente denotado pela pequena letra grega σ (sigma).

Simbolicamente, o desvio padrão para dados desagrupados é definido como:

Onde d = desvio dos escores individuais da média;

(Alguns autores usam 'x' como o desvio de pontuações individuais da média)

∑ = soma total de; N = número total de casos.

Os desvios quadrados médios são referidos como variância. Ou, em palavras simples, o quadrado do padrão de desvio é chamado de Segundo Momento de Dispersão ou Variância.

Computação de SD (dados não agrupados):

Existem duas maneiras de calcular o SD para dados desagrupados:

(a) Método direto.

(b) Método de atalho.

a) Método direto:

Encontre o desvio padrão para as pontuações abaixo:

X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9

Este método usa a fórmula (18) para encontrar o SD, que envolve os seguintes passos:

Passo 1:

Calcule a média aritmética dos dados fornecidos:

Passo 2:

Escreva o valor do desvio d, ou seja, X - M em relação a cada pontuação na coluna 2. Aqui, os desvios das pontuações devem ser obtidos a partir de 12. Agora você verá que ord ou ∑ (X - M) é igual a zero. Pense, porque é assim? Verifique-o. Se não for assim, descubra o erro no cálculo e corrija-o.

Etapa 3:

Faça o quadrado dos desvios e escreva o valor de d 2 em cada pontuação na coluna 3. Encontre a soma dos desvios quadrados. 2d 2 = 84.

Tabela 4.5 Computação do SD:

O desvio padrão requerido é de 2, 9.

Passo 4:

Calcule a média dos desvios quadrados e, em seguida, descubra a raiz quadrada positiva para obter o valor do desvio padrão, ou seja, σ.

Usando a fórmula (19), a variância será σ 2 = ∑d 2 / N = 84/10 = 8, 4

b) Método de atalho:

Na maioria dos casos, a média aritmética dos dados fornecidos passa a ser um valor fracionário e, em seguida, o processo de tomada de desvios e de quadratura torna-se tedioso e consome cal no cálculo do SD.

Para facilitar o cálculo em tais situações, os desvios podem ser obtidos a partir de um valor assumido. A fórmula de atalho ajustada para calcular SD será então,

Onde,

d = Desvio da pontuação de uma média assumida, digamos AM; ie d = (X - AM).

d 2 = O quadrado do desvio.

=d = A soma dos desvios.

2d 2 = A soma dos desvios quadrados.

N = Não. Das pontuações ou variações.

O procedimento de cálculo é esclarecido no seguinte exemplo:

Exemplo 11:

Encontre SD para as pontuações dadas na tabela 4.5 de X = 12, 15, 10, 8, 11, 13, 18, 10, 14, 9. Use o método de atalho.

Solução:

Tomemos o significado assumido AM = 11.

Os desvios e quadrados de desvios necessários na fórmula são dados na tabela a seguir:

Colocando os valores da tabela na fórmula, o SD

O método de atalho dá o mesmo resultado que obtivemos usando o método direto no exemplo anterior. Mas o método de atalho tende a reduzir o trabalho de cálculo em situações em que a média aritmética não é um número inteiro.

Computação de SD (dados agrupados):

a) Método longo / método direto:

Exemplo 12:

Encontre o SD para a seguinte distribuição:

Aqui também, o primeiro passo é encontrar a média M, para a qual temos que tomar os pontos médios dos c.i's denotados por X 'e encontrar o produto f X.'. A média é dada por ∑ f x '/ N. O segundo passo é encontrar os desvios dos pontos médios dos intervalos de classe X 'da média, ou seja, X'-M denotado por d.

O terceiro passo é enquadrar os desvios e encontrar o produto dos desvios quadrados e a frequência correspondente.

Para resolver o problema acima, ci's são escritos na coluna 1, as frequências são escritas na coluna 2, pontos médios de c.i's, ou seja, X 'são escritos na coluna 3, o produto de f X' é escrito na coluna 4, o desvio de X 'da média é escrito na coluna 5, o desvio quadrado d 2 é escrito na coluna 6, e o produto f d 2 é escrito na coluna 7,

Como mostrado abaixo:

Então, os desvios dos pontos médios devem ser tirados do 11.1.

Assim, o desvio padrão requerido é de 4, 74.

b) Método de atalho:

Às vezes, no método direto, observa-se que os desvios da média real resultam em decimais e os valores de d 2 e fd 2 são difíceis de calcular. Para evitar este problema, seguimos um método de corte curto para calcular o desvio padrão.

Neste método, em vez de tomarmos os desvios da média real, tomamos desvios de uma média assumida adequadamente escolhida, digamos AM.

A seguinte fórmula é então usada para calcular SD:

onde d é o desvio da média assumida.

Os seguintes passos são então envolvidos no cálculo do desvio padrão:

(i) Obter desvios das variáveis ​​da média assumida AM como d = (X - AM)

(ii) Multiplique estes desvios pelas freqüências correspondentes para obter a coluna fd . A soma dessa coluna fornece ∑ fd.

fd com desvio correspondente (d)

(iii) Multiplique para obter a coluna fd 2 . A soma desta coluna será ∑ fd 2 .

(iv) Use a fórmula (22) para encontrar o SD

Exemplo 13:

Usando o método de atalho, encontre SD dos dados na tabela 4.7.

Solução:

Tomemos a média suposta AM = 10. Outros cálculos necessários para calcular o SD são dados na tabela 4.8.

Colocando valores da tabela

Usando a fórmula (19), a variância

c) Método de desvio de etapas:

Neste método, na coluna 1, escrevemos ci 's; na coluna 2, escrevemos as frequências; na coluna 3 escrevemos os valores de d, onde d = X'-AM / i; na coluna 4, escrevemos o produto de fd e na coluna 5, escrevemos os valores de fd 2, como mostrado abaixo:

Aqui, a Média Assumida é o ponto médio do ci 9-11 ie 10, então os desvios d 's foram tirados de 10 e divididos por 3, o comprimento de ci A fórmula para SD no método de desvio de passo é

onde i = comprimento do c.i,

f = frequência;

d = desvios dos pontos médios de ci da média assumida (AM) em intervalo de classe (i) unidades, o que pode ser indicado:

Colocando valores da tabela

Os procedimentos de cálculo também podem ser indicados da seguinte maneira:

Desvio Padrão Combinado ( σ com b ):

Quando dois conjuntos de pontuações foram combinados em um único lote, é possível calcular o σ da distribuição total a partir dos σ das distribuições dos dois componentes.

A fórmula é:

onde σ 1, = SD de distribuição 1

σ 2 = SD de distribuição 2

d 1 = (M 1 - M pente )

d 2 = (M 2 - M pente )

N 1 = Nº de casos na distribuição 1.

N 2 = Nº de casos na distribuição 2.

Um exemplo ilustrará o uso da fórmula.

Exemplo 14:

Suponha que recebamos os meios e os valores de SD em um Teste de Realização para duas classes que diferem em tamanho e que sejam solicitados a encontrar o o do grupo combinado.

Os dados são os seguintes:

Primeiro, descobrimos que

A fórmula (24) pode ser estendida para qualquer número de distribuições. Por exemplo, no caso de três distribuições, será

Propriedades do SD:

1. Se cada valor de variação for aumentado pelo mesmo valor constante, o valor de SD da distribuição permanecerá inalterado:

Vamos discutir esse efeito sobre SD, considerando uma ilustração. A tabela (4.10) mostra pontuações originais de 5 alunos em um teste com uma pontuação média aritmética de 20.

Novas pontuações (X ') também são dadas na mesma tabela que obtemos adicionando uma constante 5 a cada pontuação original. Usando a fórmula para dados desagrupados, observamos que o SD dos escores permanece o mesmo em ambas as situações.

Assim, o valor de SD em ambas as situações permanece o mesmo.

2. Quando um valor constante é subtraído de cada variável, o valor de SD da nova distribuição permanece inalterado:

Os alunos também podem examinar que quando subtraímos uma constante de cada pontuação, a média é diminuída pela constante, mas a SD é a mesma. É devido ao motivo que ' d ' permanece inalterado.

3. Se cada valor observado for multiplicado por um valor constante, SD das novas observações também será multiplicado pela mesma constante:

Vamos multiplicar cada pontuação da distribuição original (Tabela 4.10) por 5.

Assim, o SD da nova distribuição será multiplicado pela mesma constante (aqui, é 5).

4. Se cada valor observado for dividido por um valor constante, o SD das novas observações também será dividido pela mesma constante. Os alunos podem examinar com um exemplo:

Assim, para concluir, SD é independente de mudança de origem (adição, subtração), mas dependente de mudança de escala (multiplicação, divisão).

Medições da Dispersão Relativa (Coeficiente de Variação):

As medidas de dispersão nos dão uma idéia sobre até que ponto as pontuações estão espalhadas em torno de seu valor central. Portanto, duas distribuições de frequência com os mesmos valores centrais podem ser comparadas diretamente com a ajuda de várias medidas de dispersão.

Se, por exemplo, em um teste em uma classe, os meninos têm escore médio M 1 = 60 com SD σ 1 = 15 e meninas com escore médio M 2 = 60 com SD σ 2 = 10. Claramente, as meninas que têm um menor SD, são mais consistentes em pontuar em torno de sua pontuação média do que os meninos.

Temos situações em que duas ou mais distribuições com meios desiguais ou diferentes unidades de medidas devem ser comparadas em relação à sua dispersão ou variabilidade. Para fazer tais comparações, usamos coeficientes de dispersão relativa ou coeficiente de variação (CV).

A fórmula é:

(Coeficiente de variação ou coeficiente de variabilidade relativa)

V dá a porcentagem que σ é da média do teste. É, portanto, uma relação que é independente das unidades de medida.

V é restrito em seu uso devido a certas ambiguidades em sua interpretação. É defensável quando usado com escalas de razão - escalas nas quais as unidades são iguais e existe um verdadeiro zero ou ponto de referência.

Por exemplo, V pode ser usado sem hesitação com escalas físicas - aquelas relacionadas a grandezas lineares, peso e tempo.

Dois casos surgem no uso de V com escalas de razão:

(1) Quando as unidades são diferentes, e

(2) quando M são desiguais, as unidades da escala são as mesmas.

1. Quando as unidades são diferentes:

Exemplo 15:

Um grupo de meninos de 10 anos tem altura média de 137 cm. com um o de 6, 2 cm. O mesmo grupo de meninos tem um peso médio de 30 kg. com um de 3, 5 kg. Em qual característica, o grupo é mais variável?

Solução:

Obviamente, não podemos comparar centímetros e quilogramas diretamente, mas podemos comparar a variabilidade relativa das duas distribuições em termos de V.

No presente exemplo, dois grupos não diferem apenas em relação à média, mas também em unidades de medidas que é cm. no primeiro caso e kg. no segundo. Coeficiente de variação pode ser usado para comparar a variabilidade dos grupos em tal situação.

Nós, assim, calculamos:

Assim, a partir do cálculo acima, parece que estes meninos são aproximadamente duas vezes mais variáveis ​​(11, 67 / 4, 53 = 2, 58) em peso que em altura.

2. Quando os meios são desiguais, mas as unidades de escala são as mesmas :

Suponha que temos os seguintes dados em um teste para um grupo de meninos e um grupo de homens:

Então, compare:

(i) O desempenho dos dois grupos no teste.

(ii) A variabilidade das pontuações nos dois grupos.

Solução:

(i) Como o escore médio do grupo de meninos é maior que o dos homens, portanto, o grupo de meninos tem dado um melhor desempenho do teste.

(ii) Para comparar dois grupos em relação à variabilidade entre os escores, calcula-se o coeficiente de variação V de meninos = 26, 67 e V de homens = 38, 46.

Portanto, a variabilidade dos escores é maior no grupo de homens. Os estudantes do grupo de meninos, com um CV menor, são mais consistentes em pontuar em torno de sua pontuação média em comparação ao grupo de homens.

SD e a disseminação de observações:

Em uma distribuição simétrica (normal),

(i) A média ± 1 DP cobre 68, 26% das pontuações.

Média ± 2 DP abrange 95, 44% das pontuações.

Média ± 3 DP cobre 99, 73% das pontuações.

(ii) Em grandes amostras (N = 500), o intervalo é de cerca de 6 vezes o SD.

Se N é cerca de 100, o intervalo é de cerca de 5 vezes o SD.

Se N é cerca de 50, o intervalo é de cerca de 4, 5 vezes o SD.

Se N é cerca de 20, o intervalo é de cerca de 3, 7 vezes o SD

Interpretação do Desvio Padrão:

O desvio padrão caracteriza a natureza da distribuição dos escores. Quando as pontuações são mais amplamente distribuídas, SD é mais e quando as pontuações são menos dispersas, SD é menor. Para interpretar o valor da medida de dispersão, devemos entender que quanto maior o valor de ' σ ', mais dispersos são os escores da média.

Como no caso do desvio médio, a interpretação do desvio padrão requer o valor de M e N para consideração.

Nos exemplos a seguir, os valores requeridos de σ, média e N são dados como:

Aqui, a dispersão é mais no exemplo 2 em comparação com o exemplo 1. Significa que os valores estão mais dispersos no exemplo 2, em comparação com os valores do exemplo 1.

Méritos do SD:

1. SD é rigidamente definido e seu valor é sempre definido.

2. É a medida mais amplamente utilizada e importante de dispersão. Ocupa uma posição central nas estatísticas.

3. Como o desvio médio, é baseado em todos os valores da distribuição.

4. Aqui, os sinais de desvios não são desconsiderados, ao invés disso, eles são eliminados pela saturação de cada um dos desvios.

5. É a medida mestra da variabilidade, pois é passível de tratamento algébrico e é usada no trabalho correlacional e em análises estatísticas posteriores.

6. É menos afetado por flutuações de amostragem.

7. É a medida confiável e mais precisa da variabilidade. O SD sempre acompanha a média, que é a medida mais confiável da tendência central.

8. Ele fornece uma unidade de medida padrão que possui um significado comparável de um teste para outro. Além disso, a curva normal está diretamente relacionada ao SD

Limitações:

1. Não é fácil calcular e não é facilmente entendido.

2. Ele dá mais pesos para itens extremos e menos para aqueles que estão perto da média. Quando o desvio de uma pontuação extrema é quadrada, dá origem a um valor maior.

Usos do SD:

Desvio padrão é usado:

(i) Quando a medida de variabilidade mais precisa, confiável e estável é desejada.

(ii) Quando mais peso deve ser dado a desvios extremos da média.

(iii) Quando o coeficiente de correlação e outras estatísticas são subsequentemente computados.

(iv) Quando medidas de confiabilidade são computadas.

(v) Quando as pontuações devem ser interpretadas corretamente com referência à curva normal.

(vi) Quando as pontuações padrão devem ser computadas.

(vii) Quando queremos testar a significância da diferença entre duas estatísticas.

(viii) Quando coeficiente de variação, variância, etc. são calculados.