Medição de variabilidade: uma visão geral

Medição da variabilidade: uma visão geral!

Significado da Variabilidade:

Variabilidade significa "dispersão" ou "dispersão". Assim, as medidas de variabilidade referem-se à dispersão ou disseminação de pontuações em torno de sua tendência central. As medidas de variabilidade indicam como a distribuição se espalha acima e abaixo da proposta central.

A partir do exemplo a seguir, podemos ter uma ideia clara sobre o conceito de medidas de variabilidade:

Suponha que haja dois grupos. Em um grupo há 50 meninos e em outro grupo 50 meninas. Um teste é administrado a ambos os grupos. A pontuação média dos meninos e é de 54, 4 e as meninas é que comparamos a pontuação média de ambos os grupos, descobrimos que não há diferença no desempenho dos dois grupos. Mas suponha que as pontuações dos meninos variem de 20 a 80 e que as notas das meninas variem de 40 a 60.

Essa diferença de alcance mostra que os meninos são mais variáveis, porque cobrem mais território do que as meninas. Se o grupo contiver indivíduos com capacidades muito diferentes, os escores serão espalhados de alto a baixo, o alcance será relativamente amplo e a variabilidade se tornará grande.

Esta situação pode ser ilustrada graficamente nas figuras abaixo:

A figura acima mostra duas distribuições de freqüência de algumas áreas (N) e algumas médias (50), mas de variabilidade muito diferente. O grupo A varia de 20 a 80 e o grupo B de 40 a 60. O grupo A é três vezes mais variável que o grupo B, distribui mais de três vezes a distância na escala das pontuações - embora ambas as distribuições tenham alguma tendência central.

Definições de Variabilidade:

Dicionário de Educação - CV Good. “A dispersão ou variabilidade das observações de uma distribuição sobre alguma medida de tendência central.” Dicionário Collins de Estatística: “Dispersão é a disseminação de uma distribuição”

AL Bowley:

“Dispersão é a medida da variação dos itens.”

Brooks e Dicks:

“Dispersão ou dispersão é o grau de dispersão ou variação das variáveis ​​sobre um valor central.” Assim, a propriedade que denota a extensão em que os valores são dispersos sobre os valores centrais é chamada de dispersão. Também indica a falta de uniformidade no tamanho dos itens de uma distribuição.

Necessidade de Variabilidade:

1. Ajuda a assegurar as medidas de desvio:

As medidas de variabilidade nos ajudam a medir o grau de desvio que existe nos dados. Por isso, pode-se determinar os limites dentro dos quais os dados estarão contidos em alguma variedade ou qualidade mensurável.

2. Isso ajuda a comparar diferentes grupos:

Com a ajuda de medidas de validade, podemos comparar os dados originais expressos em diferentes unidades.

3. É útil complementar as informações fornecidas pelas medidas de tendência central.

4. É útil calcular mais estatísticas antecipadas com base nas medidas de dispersão.

Medidas de Variabilidade:

Existem quatro medidas de variabilidade:

1. O intervalo

2. O desvio quartil

3. O Desvio Médio

4. O Desvio Padrão

Esses são:

1. A Faixa:

Intervalo é a diferença entre em uma série. É a medida mais geral de propagação ou dispersão. É uma medida da variabilidade das variedades ou observação entre si e não dá uma idéia sobre a disseminação das observações em torno de algum valor central.

Faixa = H - L

Aqui H = maior pontuação

L = pontuação mais baixa

Exemplo:

Em uma turma, 20 alunos garantiram as marcas da seguinte forma:

22, 48, 43, 60, 55, 25, 15, 45, 35, 68, 50, 70, 35, 40, 42, 48, 53, 44, 55, 52

Aqui, a pontuação mais alta é 70

A pontuação mais baixa é 15

Intervalo = H - L = 70 –15 = 55

Se o intervalo for maior que o grupo indica mais heterogeneidade e se o intervalo for menor que o grupo indica mais homogeneidade. Assim, o alcance nos fornece uma indicação instantânea e aproximada da variabilidade de uma distribuição.

Méritos de Alcance:

1. O alcance é facilmente calculado e facilmente compreendido.

2. É a medida mais simples da variabilidade.

3. Fornece uma estimativa rápida da medida da variabilidade.

Deméritos de Alcance:

1. O alcance é muito afetado pela flutuação das pontuações.

2. Não é baseado em todas as observações da série. Leva apenas as pontuações mais altas e mais baixas para contabilizar.

3. No caso de distribuições abertas, a faixa não pode ser usada.

4. É muito afetado por flutuações na amostragem.

5. É muito afetado por pontuações extremas.

6. A série não é verdadeiramente representada por intervalo. Uma distribuição simétrica e A simétrica pode ter o mesmo intervalo, mas não a mesma dispersão.

Usos do intervalo:

1. O intervalo é usado como uma medida de dispersão quando variações no valor da variável não são muito.

2. O intervalo é a melhor medida de variabilidade quando os dados estão muito dispersos ou muito escassos.

3. O alcance é usado quando o conhecimento da pontuação extrema ou do spread total é desejado.

4. Quando uma estimativa rápida da variabilidade é desejada, o intervalo é usado.

2. O desvio do quartil (Q):

Próximo ao intervalo, o desvio quartil é outra medida de variabilidade. Baseia-se no intervalo contendo os cinquenta por cento dos casos em uma determinada distribuição. Um quarto significa 1/4 de algo, quando uma escala é dividida em quatro partes iguais. "O desvio quartil ou Q é a metade da distância da escala entre os percentis 75 e 25 em uma distribuição de frequência."

A partir da figura 9.2, descobrimos que o primeiro quartil ou Q 1 é a posição em uma distribuição abaixo dos quais 25% dos casos, e acima dos quais 75% dos casos se encontram. O segundo quartil ou Q2 é uma posição abaixo e acima da qual estão 50% dos casos. É a mediana da distribuição.

O 3º quartil ou Qg é o 75º percentil, abaixo dos quais 75% e acima dos quais 25%. Assim, o desvio quartil (Q) é metade das distâncias da escala entre o 3º quartil (Q 3 ) e o 1º quartil (Q 1 ). Também é conhecida como a Raiva Semi-Interquartil.

Simbolicamente:

Portanto, a fim de calcular o desvio quartil primeiro de tudo, temos que calcular primeiro quartil (Q 1 ) e terceiro quartil (Q 3 )

Onde = L = limite inferior da classe do primeiro quartil,

A classe do 1o quartil é aquela classe, cuja freqüência cumulativa é maior que o valor de N / 4 quando se calcula da extremidade inferior.

N / 4 = um quarto do número total de casos.

F = Frequência acumulada do intervalo de classes abaixo do

1a classe quartil.

Fq 1 = A frequência da classe Q 1

i = tamanho do intervalo de classe 3N

Onde: L = limite inferior da classe do 3º quartil

A classe do 3º quartil é aquela cuja frequência cumulativa (C f ) é maior que o valor de 3N / 4, isto é, Cf> 3N / 4, quando Cf é calculado a partir da extremidade inferior.

3N / 4 = ¾ de N ou 75% do número total de casos.

F = Frequência acumulada da classe abaixo da classe.

fq 2 = A frequência da classe Q 3 .

i = tamanho do intervalo de classe.

Cálculo do quartil dos dados do grupo:

Exemplo:

Descubra o desvio quartil dos seguintes dados:

Etapas para calcular o desvio quartil:

Passo 1:

Calcule N / 4, ou seja, 25% da distribuição e 3N / 4, ou seja, 75% da distribuição.

Aqui –N = 50, então N / 4 = 12, 5

e 3N / 4 = 37, 5

Passo 2:

Calcule o C f da extremidade inferior. Como na tabela-9.1 coluna-3.

Etapa 3:

Descubra a classe Q 1 e Q 3 .

Neste exemplo:

Ci, 60-64 é classe Q1 porque o C f > N / 4

Ci 75-79 é Q 3 classe porque

o Cf> 3N / 4

Passo 4:

Descubra F para a classe Q 1 e a classe Q 3 . Neste exemplo

F para Q 1 classe = 10

F para a classe Q3 = 30 Step

Passo 5:

Descubra Q1 colocando os valores acima na fórmula.

Q 1 = L + N / 4 - F / fq1 xi

Aqui L = 59, 5 porque os limites exatos da classe Q1 60-64 são 59, 5-64, 5.

F = 10 o Cf abaixo da classe Q 1

Fq 1 = 4: a frequência exata da classe Q 1

i = 5, tamanho do intervalo de classe

N / 4 = 12, 5

Agora Q 1 = 59, 5 + 12, 5-10 / 4 x 5

= 59, 5 + 2, 5 / 4 x 5

= 59, 5 + 0, 63 x 5

= 59, 5 + 3, 13 = 62, 63

Passo 6:

Descubra o Q 3 colocando os valores na fórmula.

Aqui L = 74, 5 porque os limites exatos da classe Q 3 75-79 são 74, 5—79, 5.

F = 30 o Cf abaixo da classe Q 3 .

3N / 4 = 37, 5

Fq 1 = 8 a frequência exata da classe Q 3 .

i = tamanho 5 dos intervalos de classe.

Q3 = 74, 5 + 37, 5-30 / 8 x 5

= 74, 5 + 7, 5 / 8 x 5 = 74, 5 + 0, 94 x 5

= 74, 5 + 4, 7 = 79, 2

Passo 7:

Descubra Q colocando o valor acima na fórmula.

Q = Q 3 -Q 1/2 = 79, 2 - 62, 63 / 2

= 16, 5 / 2 = 8, 285 = 8, 29

Mérito do desvio quartil:

1. O desvio de quartil é simples de calcular e fácil de entender.

2. É mais representativo e digno de confiança do que alcance. No caso de intervalos de classe em aberto, é usado no estudo de medidas de dispersão.

3. No caso de intervalos de classe em aberto, é usado no estudo de medidas de dispersão.

4. É um bom índice de densidade de pontuação no meio da distribuição.

5. Quando tomamos Mediana como medida de tendência central, nesse momento, Q é preferido como medida de dispersão.

6. Como intervalo, não é afetado por pontuações extremas.

Deméritos de desvio quartil:

1. Não é baseado em todas as observações de dados. Ignora os primeiros 25% e os últimos 25% das pontuações.

2. O tratamento algébrico adicional não é possível no caso de Q. É apenas uma média posicional. Não estuda variação dos valores de uma variável a partir de qualquer média. Apenas indica uma distância em uma escala.

3. É afetado pela flutuação das pontuações. Seu valor é afetado em qualquer caso, por uma mudança no valor de uma única pontuação.

4. Q não é uma medida adequada de dispersão, quando em uma série há uma variação considerável nos valores de vários escores.

Usos do desvio quartil:

1. Quando a mediana é a medida de tendência central, nesse momento, Q é usado como medida de dispersão.

2. Quando pontuações extremas afetam a SD ou as pontuações são dispersas naquele momento, Q é usado como medida de variabilidade.

3. Quando nosso principal interesse é conhecer a concentração em torno da mediana - no meio, 50% dos casos, nesse momento, Q é usado.

4. Quando os intervalos de classe são abertos, Q é usado como medida de dispersão.

3. O Desvio Médio (AD):

Nós discutimos sobre duas variabilidade, alcance e desvio quartil. Mas nenhuma dessas dispersões indica a composição da distribuição. É porque ambas as dispersões não levam em conta todas as pontuações individuais. Podemos superar algumas das graves deficiências de alcance e desvio quartil usando outra dispersão chamada Desvio médio ou Desvio médio.

“Desvio médio é a média aritmética de todos os desvios das diferentes pontuações do valor médio das pontuações sem a consideração do sinal do desvio.”

Assim, o desvio médio é a média aritmética dos desvios de uma série calculada a partir de alguma medida de tendência central. Então, o desvio médio é a média dos desvios da sua média (às vezes, da mediana e do modo).

Definições:

Dicionário Collins de Estatística:

“Desvio médio é a média dos valores absolutos das diferenças entre os valores de uma variável e a média de sua distribuição.”

Dicionário de Educação, CV Bom:

“Uma medida que expressa a quantidade média pela qual os itens individuais em uma distribuição se desviam de uma medida de tendência central, como a média da mediana.”

HE Garrett:

“O desvio médio ou AD é a média dos desvios de todos os escores separados em uma série tirada de sua média (ocasionalmente da mediana ou do modo)”.

Assim, pode-se dizer que o desvio médio ou desvio médio, como é chamado, é a média dos desvios de todas as pontuações.

Não são levados em conta os sinais e todos os desvios se + ou + foram tratados como positivos.

onde AD = desvio médio

£ = Capital Sigma, significa soma total de

II = Modulous no curto Mod, significa sem respeito ao sinal negativo.

x = desvio, (X-M)

Computação do Desvio Médio:

Existem duas situações para calcular o desvio médio:

(a) Quando os dados são desagrupados.

(b) Quando os dados são agrupados.

Cálculo do AD a partir de dados desagrupados.

Exemplo:

Encontre o AD das seguintes 10 pontuações dadas abaixo:

23, 34, 16, 27, 28, 39, 45, 26, 18, 27

Solução:

Passo 1:

Descubra a média das pontuações com fórmula

∑X / N

Passo 2:

Descubra o desvio de todas as pontuações deduzindo a média das pontuações.

Etapa 3:

Descubra o desvio absoluto como mostrado na tabela-9.2 e depois ∑ | x |

Passo 4:

Coloque os valores na fórmula.

O AD = 7, 58.

Cálculo da DA a partir de dados agrupados:

Exemplo:

Descubra o AD dos seguintes dados:

Solução :

Passo 1:

Descubra a média da distribuição.

Média = 70, 80

Passo 2:

Descubra o ponto médio para cada intervalo de classe. Como na coluna - 3 da tabela - 9.3

Etapa 3:

Descubra o x deduzindo a média do ponto médio (X). Como mostrado na coluna - 5 da tabela - 9.3.

Passo 4:

Descubra o desvio absoluto ou | x |. Como coluna - 6 acima.

Passo 5:

Descubra | f x | multiplicando f por | x. Como mostrado na coluna —7 e descubra Σ | f x |

Passo 6:

Coloque os valores acima na fórmula.

A fórmula para AD de dados agrupados

Onde = AD = desvio médio

Σ = Soma total de

f = frequência

x = desvio ie (X-M)

N = Total Número de casos, ou seja, ∑ f .

Colocando os valores na fórmula

Méritos do AD:

1. O desvio médio é rigidamente definido e seu valor é preciso e definido.

2. É fácil calcular.

3. É fácil de entender. Porque é a média dos desvios de uma medida de tendência central.

4. Baseia-se em todas as observações.

5. É menos afetado pelo valor das pontuações extremas.

Deméritos do AD:

1. A desvantagem mais séria com o desvio médio é que ela ignora os sinais algébricos dos desvios que é contra as regras fundamentais da matemática.

2. O tratamento algébrico adicional não é possível no caso de AD.

3. É muito raramente usado. Por causa do desvio padrão é geralmente usado como uma medida de dispersão.

4. Quando calculado a partir do modo AD, não fornece uma medida precisa da dispersão.

Usos do desvio médio:

1. O desvio médio é usado quando se deseja ponderar todos os desvios da média de acordo com seu tamanho.

2. Quando pontuações extremas influenciam o desvio padrão nesse momento, a DA é a melhor medida de dispersão.

3. A DA é usada quando queremos saber até que ponto as medidas estão espalhadas em ambos os lados da média.

4. O Desvio Padrão (SD):

Nós discutimos três medidas de variabilidade, ou seja, intervalo, desvio quartil e desvio médio. Nós também descobrimos que todos eles sofrem de sérios inconvenientes.

O intervalo apenas considerado para contabilizar apenas a pontuação mais alta e a pontuação mais baixa. O desvio quartil leva em conta apenas os 50% do escore médio e, no caso de desvio médio, ignoramos os sinais.

Portanto, para superar todas essas dificuldades, usamos outra medida de dispersão chamada Desvio Padrão. É comumente usado em pesquisas experimentais, pois é o índice mais estável de variabilidade. Simbolicamente é escrito como σ (sigma da letra pequena grega).

Definições:

Dicionário Collin de Estatística.

“O desvio padrão é uma medida de dispersão ou dispersão. É o desvio médio da raiz quadrada ”.

Dicionário de Educação - CV Good.

“Uma medida amplamente utilizada de variabilidade, consistindo na raiz quadrada da média dos desvios quadrados das pontuações da média da distribuição.”

O desvio padrão é a raiz quadrada do valor médio dos desvios quadrados das pontuações da sua média aritmética.

O SD é calculado somando o desvio quadrado de cada medida da média, dividido pelo número de casos e extraindo a raiz quadrada. Para ser mais claro, devemos notar aqui que, ao computar o SD, ajustamos todos os desvios separadamente, encontramos sua soma, dividimos a soma pelo número total de pontuações e depois encontramos a raiz quadrada da média do desvio quadrado. Então, isso também é chamado de 'raiz quadrada média do desvio'.

O quadrado do desvio padrão é chamado de variância (σ 2 ). É referido como o desvio quadrado médio. É também chamado de dispersão do segundo momento.

Cálculo do SD a partir de dados desagrupados:

Exemplo:

Descubra o SD dos seguintes dados:

6, 8, 10, 12, 5, 8, 9, 17, 20, 11.

Solução:

Passo 1:

Descubra a média das pontuações.

Passo 2:

Descubra o desvio (x) de cada pontuação.

Computação de SD de dados agrupados:

Nos dados agrupados, o SD pode ser calculado em dois métodos:

1. Método direto ou método longo

2. Método curto ou método da média presumida

1. Método direto ou método longo:

Exemplo:

Descubra o SD da seguinte distribuição:

Solução:

Passo 1:

Descubra o ponto médio de cada intervalo de classe. (Colum-3 Tabela 9.4)

Passo 2:

Descubra a média da distribuição:

Aqui M = ∑ f x / N = 3540/50

= 70, 80

Etapa 3:

Descubra o desvio (x) deduzindo a média dos pontos.

Passo 4:

Descubra o f x multiplicando f (col-2) por x (col-5)

Passo 5:

Descubra o f x multiplicando f x (col-2) por x (col-5)

Passo 6:

Calcule f x adicionando os valores em col-7.

Passo 7:

Coloque os valores na fórmula.

2. Método Curto ou Método Médio Assumido:

No método curto, o cálculo do SD é fácil e consome menos tempo. Se os pontos médios dos intervalos das classes forem números decimais, torna-se mais complicado calcular o SD no método longo. Este método consiste essencialmente em 'adivinhar' ou assumir uma média e depois aplicar uma correção para dar a média real. De modo que é chamado como método médio assumido.

Exemplo:

Calcule o SD, da seguinte distribuição:

Solução:

Passo 1:

Assuma o ponto médio de qualquer intervalo de classe como 'Média Assumida'. Mas é melhor assumir que o ponto médio do intervalo de classe no meio tenha a frequência mais alta como a média assumida. Aqui let é assumir = 72 como média Assumida.

Passo 2:

Descubra x (desvio das pontuações da média assumida) como mostrado em col-3.

x '= X - M / i

Etapa 3:

Calcule f x ', multiplicando x' por f (col-4).

Passo 4:

Calcule f x 2 multiplicando x '(col-3) por f x (col-5).

Passo 5:

Descubra ∑ f x 'e ∑ f x ' 2 it 'adicionando os valores em col-4 e col-5, respectivamente. '

Passo 6:

Coloque os valores na fórmula:

Fórmula para SD no método curto é:

Onde i = tamanho do intervalo de classe

∑ = Soma total de

f = frequência

x '= desvio dos escores de sua média assumida.

Agora, se substituirmos ∑ f x '/ N no lugar de C.

A fórmula será a seguinte:

Agora, colocando os valores na fórmula, obtemos.

1. Se um valor constante for adicionado a cada pontuação ou subtraído de cada pontuação, o valor de SD permanecerá inalterado:

Isso significa SD é independente da mudança de origem (adição, subtração). Assim, se um valor constante é adicionado ou subtraído de cada variedade, o SD permanece o mesmo.

Podemos examinar isso no seguinte exemplo:

Na tabela acima, são dadas notas de 5 alunos. Vamos ver o que acontece com o SD das pontuações se adicionarmos um número constante digamos 5 e subtrairmos 5 de cada pontuação.

2. Se um valor constante for multiplicado ou dividido pelas pontuações originais, o valor de SD também será multiplicado ou dividido pelo mesmo número:

Isso significa que o SD é independente da mudança de escala (multiplicação, divisão). Se multiplicarmos as pontuações originais por um número constante, o SD também será multiplicado pelo mesmo número.

Novamente, se dividirmos cada pontuação por um número constante, o SD também será dividido pelo mesmo número.

Podemos ilustrar isso com o seguinte exemplo:

Na tabela acima, são dadas notas de 5 alunos. Vamos ver o que acontece com o SD das 5 pontuações, se multiplicarmos com um número constante, digamos 2 e dividi-lo com o mesmo número constante.

Assim, a partir disso, descobrimos que, se as pontuações são multiplicadas com um número constante, o σ também é multiplicado com isso. Se as pontuações são divididas por um número constante, então o σ também é dividido pelo mesmo número.

Méritos do SD:

1. Desvio padrão é rigidamente definido e seu valor é sempre definido.

2. Baseia-se em todas as observações de dados.

3. É capaz de tratamento algébrico adicional e possui muitas propriedades matemáticas.

4. Ao contrário de Q e AD, é menos afetado pelas flutuações das pontuações.

5. Diferentemente da AD, ela não ignora os sinais negativos. Por quadratura de desvios supera estas dificuldades.

6. É a medida confiável e mais precisa da variabilidade. Sempre acompanha a média, que é a medida mais estável de tendência central.

7. O SD fornece uma medida que é um significado comparável de um teste para outro. Acima de tudo, as unidades da curva normal são expressas em uma unidade.

Deméritos de SD:

1. SD é difícil de entender e não é fácil de calcular.

2. SD atribui mais peso a pontuações extremas e perda àquelas que estão mais próximas da média. É porque os quadrados dos desvios, que são grandes em tamanho, seriam proporcionalmente maiores que os quadrados daqueles desvios que são comparativamente pequenos.

Usos do SD:

1. SD é usado quando o nosso impulso é medir a variabilidade com maior estabilidade.

2. Quando desvios extremos podem afetar a variabilidade nesse momento, o SD é usado.

3. SD é usado para calcular as estatísticas adicionais, como coeficiente de correlação, pontuação padrão, erro padrão, análise de variância, análise de co-variância, etc.

4. Quando a interpretação dos resultados é feita em termos do NPC, o SD é usado.

5. Quando queremos determinar a confiabilidade e a validade dos resultados dos testes, o SD é usado.

Desvio Padrão Combinado:

Durante o trabalho de pesquisa, às vezes, extraímos mais de uma amostra da população. Portanto, obtemos diferentes SDs para cada grupo ou amostra. Mas às vezes precisamos interpretar esses resultados como um grupo. Portanto, quando conjuntos diferentes de pontuação foram combinados em um único lote, é possível calcular o SD da distribuição total a partir dos SDs dos subgrupos.

Fórmula para calcular o desvio padrão combinado ou é a seguinte:

N 1, N 2, N n = Número de pontuações no grupo 1, grupo 2 e assim até no enésimo grupo.

d = (Média-M pente ) 'd' é encontrado deduzindo M pente da média do grupo em questão.

Da mesma forma d 1, d 2 … d n são descobertos.

σ = desvio padrão do grupo em questão σ 1, σ 2, σ 3 significa σ do grupo 1, grupo 2, grupo 3 etc.

Exemplo:

Solução:

Agora coloque os valores na fórmula.