Técnicas Utilizadas nas Estatísticas

Neste artigo vamos discutir algumas das técnicas de estatística. Algumas das técnicas são: 1. As Medidas da Tendência Central 2. Variabilidade 3. Probabilidade 4. Distribuição de Freqüências 5. Séries Temporais.

As medidas da tendência central:

Médias:

Qualquer medida estatística que dê uma idéia sobre a posição do ponto em torno do qual outras observações se agrupam é chamada de medida de tendência central. A medida mais comumente usada é a média ou a média aritmética.

Ganhos diários de dois trabalhadores por uma semana são como abaixo:

1o trabalhador Rs 70, 50, 100, 90, 50 Ganho médio = Rs 76

2o trabalhador Rs 200, 250, 50, 300, 150 Ganho médio = Rs 190

Assim, a partir do exemplo acima, podemos concluir que, em média, o segundo trabalhador ganha mais do que o primeiro. O objetivo de calcular uma média - como se pode ver facilmente - é substituir a série de observações por um único valor, que é considerado o representante de todas as observações. A partir do exemplo dado acima, pode-se observar que a média aritmética é um valor próximo ao meio e algumas das observações são maiores do que enquanto algumas são menores.

Assim, pode-se dizer que a média aritmética das observações de uma variável é definida como a soma das observações dividida pelo número de observações.

Para o primeiro trabalhador, a média aritmética foi calculada como abaixo:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = Rs 76

Média Geométrica (GM) A Média Geométrica de um grupo de observações é definida como a enésima raiz do produto de todas as observações. Vamos supor que as observações sejam x 1, x 2, x 3, …, x n .

GM pode ser calculado como abaixo:

Isso pode ser calculado com a ajuda de uma tabela de log.

Modo:

Modo é definido como o valor das variáveis ​​ou observações que ocorre com mais frequência. Por exemplo, se as observações são - 2, 9, 6, 2, 8, 2, 2, 7, 2 e 3, então o modo é visto como 2, o que ocorreu para o número máximo de vezes, isto é, 5 vezes.

Mediana:

Mediana é o valor da variável intermediária, quando as observações são organizadas em ordem crescente ou decrescente. É óbvio que metade dos valores será menor que a mediana e metade dos valores será maior. Assim, se as observações são 3, 9, 6, 4, 5, 7 e 10, então organizando os valores em uma ordem crescente 3, 4, 5, 6, 7, 9 e 10, o valor mediano é visto como 4ª observação e é igual a 6.

No entanto, se o número de observações for par, então há dois valores intermediários e é costume usar a média aritmética desses dois valores. Por exemplo, se a observação 10 for omitida das variáveis ​​acima, existem dois valores intermediários 5 e 6 e o ​​valor mediano é 5 + 6 ÷ 2 = 5, 5.

As outras ferramentas estatísticas importantes para medir e analisar os dados e o elemento de variabilidade incluem o cálculo de (i) Intervalo, (ii) Intervalo semi-interquartil, (iii) Desvio absoluto médio, (iv) Desvio padrão, (v) ) Distribuição de frequência (simétrica e assimétrica).

A distribuição simétrica é caracterizada pela existência de uma linha de simetria que divide o histograma em duas partes e uma parte é a imagem espelhada do outro. No entanto, a maioria das distribuições em comércio e economia não são desse tipo. Distribuições assimétricas também são conhecidas como distribuições distorcidas. Entidade significa que a falta de simetria e distribuições distorcidas são caracterizadas por uma cauda mais longa em um lado do histograma.

Medindo a variabilidade:

Os meios aritméticos e geométricos ou medianos servem como base para comparar duas ou mais populações ou observações. Mas as outras medidas de variabilidade ou desvio também são importantes para expressar até que ponto as observações diferem umas das outras. Na estatística, a dispersão é sinônimo de variabilidade ou desvio.

A seguir estão as importantes medidas de variabilidade:

Alcance:

A diferença entre os maiores e menores valores de um conjunto de observações é chamada de 'intervalo'.

Gama de quartis semi-inter :

A diferença entre o valor das observações no segundo e terceiro quartil é chamada de faixa semi-interquartil. Isso elimina a influência de valores muito baixos e muito altos das observações, que são poucas em número.

Desvio médio absoluto:

Desvio absoluto médio significa a variação das observações da média aritmética das observações.

Exemplo: As observações são x 1, x 2 … x n e a média aritmética é x.

A fórmula é:

e, portanto, a média é

Mas ∑ (x 1 - x̅) = 0, seja qual for o valor de x 1, x 2, … .x n

Portanto, a fórmula ∑ (x i - x̅) não pode ser usada como medida de variabilidade. Essa dificuldade pode ser evitada se os sinais (+ ou -) forem ignorados. Isso é lógico, pois o sinal de um desvio particular x i - x̅ indica apenas se a observação x i, está à esquerda de x ou à sua direita e isso não tem relevância no cálculo dos desvios, a partir do ponto central (x), de qualquer observação.

Desvio padrão:

O desvio das observações de sua média aritmética (x̅) pode ser positivo (+) ou negativo (-). Na estatística, os sinais de desvios da média aritmética indicam apenas a direção da observação da tendência central (x) e, portanto, ignorados. Os sinais negativos (-) entre os desvios do x também podem ser evitados se, em vez de se tomarem os valores absolutos, os quadrados dos desvios são tomados como abaixo:

Como a medida da variabilidade deve estar na mesma unidade das observações originais, o desvio padrão é calculado pela seguinte fórmula:

Para uma distribuição de freqüência, com x 1 x 2, …, x n como os valores médios das classes e f 1 f 2, …, f n como as freqüências, o Desvio Padrão (SD) é calculado pela seguinte melhoria do fórmula acima:

O desvio padrão é, de longe, a medida de variabilidade mais utilizada nas estatísticas. Tem muitas propriedades que tornam a medida mais preferida em problemas estatísticos.

Exemplo:

Os níveis de QI de cinco estudantes de Administração de Empresas são os seguintes:

portanto, o desvio padrão é: 13, 22

13, 22 é o desvio padrão expresso nas mesmas unidades que as observações em si. O valor 13, 22 é um ponto na mesma escala numérica.

O desvio padrão acima foi elaborado a partir das variações de uma população de 5 alunos. No entanto, na prática, o Desvio Padrão muitas vezes não pode ser calculado a partir da população, pois na maioria das vezes a população é tão grande que geralmente a amostra é tomada com a finalidade de calcular o desvio.

Para dados de amostra, a variabilidade é medida pela variação da amostra e o desvio padrão é calculado usando a seguinte fórmula:

Deve-se notar que, uma vez que os dados da amostra foram utilizados, 'n' denota o tamanho da amostra em lugar de 'N', que denota a observância da população.

Conceito de Probabilidade:

Muitas vezes, em nossa vida cotidiana, prevemos certos eventos futuros com palavras como - isso provavelmente acontecerá ', ' probabilidade de que isso é muito alto ', ou' isso ocorrerá com toda a probabilidade ', com uma certa imprecisão em tais afirmações. Essas declarações são em grande parte subjetivas e dependem principalmente do nosso poder de analisar situações semelhantes no passado. A importância da noção de probabilidade de um evento e alguns meios de medi-lo com ferramentas estatísticas é imensa para os bancos comerciais.

Ao dar um empréstimo a um cliente, o banqueiro gostaria de saber a probabilidade de inadimplência do referido cliente, que é medida com base no estudo da probabilidade usando os cálculos estatísticos. Embora seja muito difícil definir probabilidade precisamente em um nível elementar, pode-se fazer um esforço para prever o mesmo usando as técnicas de experimento aleatório e definição de frequência.

Experimento aleatório significa uma experiência cujos resultados possíveis são conhecidos e que podem ser repetidos sob condições idênticas, mas a previsão exata do resultado é impossível. O preço de uma mercadoria em vários dias pode ser considerado como resultado de um experimento aleatório. Os resultados serão geralmente denotados por E 1, E 2, E 3 …, E n e é assumido que eles são finitos em número.

Distribuição de frequência:

Se o resultado E 1 ocorre r vezes quando a experiência aleatória é repetida n vezes, então a probabilidade de E 1 é definida pela razão 'r / n', já que o número de repetições é aumentado indefinidamente. Assim, a probabilidade é definida como um limite de freqüência relativa quando o experimento é repetido um número infinito de vezes.

Séries Temporais:

Uma série de observações em diferentes pontos do tempo em uma variável - que é dependente do tempo - constitui uma série temporal. Assim, tais séries de observações fornecem as mudanças ou variações de uma quantidade ao longo de um período de tempo e são frequentemente chamadas de dados históricos ou cronológicos. Para este tipo de dados, uma das variáveis ​​é o tempo que é representado por 't' e o outro, que é dependente do tempo, é representado por 'Yt'.

Por exemplo, rendimento de safra em diferentes épocas do ano, produção de aço em meses diferentes, exportação trimestral de chá, venda de sorvetes em diferentes meses do ano, etc. Todos os exemplos citados acima referem-se a alguma atividade econômica ou de negócios. e uma série de observações sobre tais variáveis ​​são usualmente chamadas de dados de séries temporais econômicas. Outro exemplo de dados de séries temporais é a precipitação em polegadas em vários dias do ano.

Assim, fica claro que qualquer variável, que depende do tempo, forma os dados da série temporal. Conclusões valiosas que são tiradas pelas partes interessadas, como a comunidade de negócios, banqueiros, industriais, etc., a partir da série temporal levam a uma medição de tendência dos dados, que influenciam suas decisões de forma significativa.