8 tipos importantes de amostragem de probabilidade

Este artigo lança luz sobre os oito tipos importantes de amostragem probabilística usados ​​para conduzir pesquisas sociais. Os tipos são: 1. Amostragem Aleatória Simples 2. Amostragem Sistemática 3. Amostragem Aleatória Estratificada 4. Amostragem Estratificada Proporcional 5. Amostragem Estratificada Desproporcional 6. Amostragem de Alocação Ótima 7. Amostragem de Agrupamentos 8. Amostragem Multifásica.

Tipo # 1. Amostragem aleatória simples:

A amostragem aleatória simples é, em certo sentido, o tema básico de toda amostragem científica. É o projeto principal de amostragem probabilística. De fato, todos os outros métodos de amostragem científica são variações da amostragem aleatória simples. Uma compreensão de qualquer uma das variedades refinadas ou complexas de procedimentos de amostragem pressupõe um entendimento da amostragem aleatória simples.

Uma amostra aleatória simples é selecionada por um processo que não apenas dá a cada elemento da população uma chance igual de ser incluído na amostra, mas também faz a seleção de todas as combinações possíveis de casos no tamanho de amostra desejado, igualmente provável. Suponha, por exemplo, que se tenha uma população de seis filhos, a saber, A, B, C, D, E e F.

Haverá as seguintes combinações possíveis de casos, cada um com dois elementos dessa população, AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF e EF, ou seja, em todas as 15 combinações.

Se escrevermos cada combinação em cartões de tamanhos iguais, colocamos os cartões em uma cesta, misturamo-los completamente e deixamos que uma pessoa vendada escolha uma, cada uma das cartas terá a mesma chance de ser selecionada / incluída na amostra.

Os dois casos (o par) escritos no cartão captado pela pessoa com dobradiça, constituirão a amostra aleatória simples desejada. Se alguém deseja selecionar amostras aleatórias simples de três casos da população de seis casos acima, as possíveis amostras, cada uma de três casos, serão ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF e DEF, ou seja, 20 combinações ao todo.

Cada uma dessas combinações terá uma chance igual de seleção na amostra. Usando o mesmo método, pode-se selecionar uma amostra aleatória simples de quatro casos dessa população.

Em princípio, pode-se usar este método para selecionar amostras aleatórias de qualquer tamanho de uma população. Mas, na prática, se tornaria muito trabalhoso e, em certos casos, uma tarefa impossível listar todas as combinações possíveis do número desejado de casos. O mesmo resultado pode ser obtido selecionando elementos individuais, um por um, usando o método acima (loteria) ou usando um livro de números aleatórios.

O livro de tabelas que compreende lista de números aleatórios é nomeado após Tippet quem foi o primeiro a traduzir o conceito de aleatoriedade em um livro de números aleatórios.

Este livro é preparado por um procedimento muito complicado, de tal forma que os números não mostram qualquer evidência de ordem sistemática, isto é, ninguém pode estimar o número seguinte, com base no número anterior e vice-versa. Vamos discutir os dois métodos de desenhar uma amostra aleatória simples.

Método de loteria:

Esse método envolve as seguintes etapas:

(a) Cada membro ou item na 'população' é atribuído um número único. Ou seja, não há dois membros com o mesmo número,

(b) Cada número é anotado em um cartão separado ou em um chip. Cada chip ou cartão deve ser semelhante a todos os outros em relação ao peso, tamanho e forma, etc.

c) As cartas ou os chips são colocados em uma tigela e misturados

(d) Solicita-se a uma pessoa com cego para pegar qualquer ficha ou cartão da taça.

Sob estas circunstâncias, a probabilidade de desenhar qualquer cartão pode ser a mesma que a probabilidade de desenhar qualquer outro cartão. Como cada cartão representa um membro da população, a probabilidade de selecionar cada um seria exatamente a mesma.

Se depois de selecionar um cartão (chip) ele foi substituído na tigela e o conteúdo novamente bem misturado, cada chip teria uma probabilidade igual de ser selecionado no segundo, quarto ou sésimo desenho. Tal procedimento acabaria por produzir uma amostra aleatória simples.

Selecionando Amostra com a Ajuda de Números Aleatórios :

Nós já dissemos quais são os números aleatórios. Esses números ajudam a evitar qualquer viés (chances desiguais) de itens que incluam uma população, de serem incluídos na amostra na seleção da amostra.

Esses números aleatórios são tão preparados que preenchem o critério matemático de aleatoriedade completa. Qualquer livro padrão sobre estatísticas contém algumas páginas de números aleatórios. Esses números geralmente são listados em colunas em páginas consecutivas.

A seguir, uma parte de um conjunto de números aleatórios:

O uso das tabelas de números aleatórios envolve as seguintes etapas:

(a) Cada membro da população é atribuído um número único. Por exemplo, um membro pode ter o número 77 e outro 83, etc.

(b) A tabela de números aleatórios é inserida em algum ponto aleatório (com uma marca cega em qualquer página do livro de tabelas) e os casos cujos números surgem à medida que se move deste ponto para baixo da coluna são incluídos na amostra até o número desejado de casos é obtido.

Suponha que nossa população consista de quinhentos elementos e desejamos extrair cinquenta casos como amostra. Suponha que usamos os três últimos dígitos em cada número de cinco dígitos (já que o tamanho do universo é 500, ou seja, três dígitos).

Seguimos pela coluna começando com 42827; mas como decidimos usar apenas três dígitos (digamos os três últimos), começamos com 827 (ignorando os dois primeiros dígitos). Agora notamos cada número com menos de 501 (já que a população é de 500).

A amostra seria composta pelos elementos da população com os números correspondentes aos escolhidos. Paramos depois de selecionarmos 50 elementos (o tamanho decidido por nós). Com base na seção acima da tabela, estaremos escolhendo 12 números correspondentes aos escolhidos. Devemos escolher 12 casos correspondentes aos números 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Características da amostra aleatória simples:

Começaremos considerando uma propriedade muito importante das amostras aleatórias simples; Sendo assim, quanto maior o tamanho da amostra, maior a probabilidade de sua média (valor médio) estar próxima da média da população, ou seja, o valor verdadeiro. Vamos ilustrar essa propriedade supondo uma população composta por seis membros (filhos).

Que as idades dessas crianças sejam respectivamente: A = 2 anos, B = 3 anos, C = 4 anos, D = 6 anos, E = 9 anos e F = 12 anos. Vamos desenhar amostras aleatórias de um, dois, três quatro e cinco membros cada desta população e ver como, em cada caso, as médias amostrais (médias) se comportam com referência à verdadeira média da 'população' (ou seja, 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). A tabela a seguir ilustra o comportamento das médias amostrais associadas ao tamanho da amostra.

Tabela que mostra as possíveis amostras de um, dois, três, quatro e cinco elementos (crianças, da população de seis crianças de 2, 3, 4, 6, 9 e 12 anos, respectivamente):

Na tabela fornecida, todas as amostras aleatórias possíveis de vários tamanhos (isto é, 1, 2, 3, 4 e 5) e suas médias correspondentes são mostradas. A verdadeira (população) média é de 6 anos. Esta média pode, claro, ser calculada somando os valores médios das combinações totais dos elementos na população para qualquer dado tamanho de amostra.

Na tabela, vemos, por exemplo, que para o tamanho da amostra de três elementos existem 20 combinações possíveis de elementos, cada combinação tendo uma chance igual de ser selecionada como uma amostra de acordo com o princípio da probabilidade.

Somando-se os valores médios dessas possíveis combinações mostradas na tabela, obtemos a pontuação total de 120. A média será de 120 ÷ 20 = 6, que também é, é claro, a média populacional. Isso vale também para outras colunas.

Vamos agora examinar a mesa com cuidado. Descobriremos que para amostras de um elemento cada (coluna A) existe apenas um valor médio que não se desvia em mais de 1 unidade da média real da população de 6 anos. Ou seja, todos os outros, 2, 3, 4, 9 e 12, desviam em mais de uma unidade da média populacional, ou seja, 6. Conforme aumentamos o tamanho da amostra, por exemplo, na coluna B, onde o tamanho da amostra é 2, encontramos uma proporção maior de médias (médias) que não se desviam da média populacional em mais de 1 unidade.

A tabela acima mostra que, para a amostra de dois, existem 15 combinações possíveis e, portanto, 15 possíveis meios. Destes 15 meios existem 5 médias que não se desviam da média da população em mais de 1 unidade.

Ou seja, há 33% das médias amostrais que estão próximas da média da população em unidades +1 e -1. Na coluna C da tabela, vemos que existem 20 combinações possíveis de elementos para o tamanho de amostra de três elementos, cada um.

Das 20 possíveis médias amostrais, descobrimos que 10, isto é, 50% não se desviam da média populacional em mais de 1 unidade. Para o tamanho da amostra de quatro elementos, há 67% das médias que estão dentro da faixa de +1 e -1 da média verdadeira (população).

Por fim, para o tamanho da amostra de cinco elementos, há muito mais, isto é, 83% dessas médias ou estimativas. A lição que surge de nossas observações é bastante clara: quanto maior a amostra, mais provável é que sua média esteja próxima da média da população.

Isto é o mesmo que dizer que a dispersão de estimativas (médias) diminui à medida que o tamanho da amostra aumenta. Podemos ver claramente isso na tabela acima. Para o tamanho da amostra de um (coluna A), o intervalo de médias é o maior, ou seja, entre 2 e 12 = 10. Para o tamanho de amostra de dois, o intervalo é entre 2, 5 e 10, 5 = 8.

Para o tamanho da amostra de três, quatro e cinco, o intervalo de variabilidade de médias é respectivamente 3 a 9 = 6, 3, 8 a 7, 8 = 4 e 4, 8 a 6, 8 = 2. Também será visto da tabela que quanto mais uma amostra A média difere da média da população com menor frequência de probabilidade de ocorrer.

Podemos representar esse fenômeno relacionado à amostragem aleatória simples claramente com a ajuda de uma série de curvas mostrando a relação entre a variabilidade das estimativas e o tamanho da amostra. Vamos considerar uma grande população de moradores. Pode-se imaginar que suas idades vão variar entre abaixo de 1 ano (no mínimo) e acima de 80 anos (no máximo).

A expectativa normal e razoável seria a de que há casos menores à medida que se aproxima dos extremos e que o número de casos continua aumentando progressivamente e simetricamente à medida que nos afastamos desses extremos.

A idade média da população é, digamos, 40 anos. Tal distribuição de residentes pode ser representada por uma curva conhecida como curva normal ou em forma de sino (A no diagrama seguinte). Suponhamos agora que retiremos desta população várias amostras aleatórias de tamanhos diferentes, por exemplo, 10.100 e 10.000. Para qualquer um dos tamanhos de amostra, obteremos um número muito grande de amostras da população.

Cada uma dessas amostras nos dará uma estimativa específica da média populacional. Alguns desses meios serão superestimados e algumas subestimativas da característica da população (média ou idade média). Alguns meios estarão muito próximos, alguns muito longe.

Se plotarmos essas médias amostrais para um tamanho de amostra específico e unirmos esses pontos, devemos, em cada caso, obter uma curva normal. Curvas normais diferentes representarão, assim, os valores de médias amostrais para amostras de diferentes tamanhos.

O diagrama acima se aproxima de uma imagem de como os meios amostrais se comportariam em relação ao tamanho da amostra. A curva A representa a localização das idades dos indivíduos solteiros. As médias estimadas de amostras de 10 indivíduos, cada uma, da curva B que mostra uma dispersão bastante ampla da população verdadeira - significam 40 anos).

As médias de amostras de 100 indivíduos cada, formam uma curva normal C que mostra um desvio muito menor da média populacional. Finalmente, as médias das amostras de 10.000 de uma curva que quase se aproxima da linha vertical correspondente à média da população. O desvio dos valores que representam a curva D da média populacional seria insignificante, como é evidente no diagrama.

Também pode ser facilmente discernido da figura acima que, para amostras de qualquer tamanho, a média amostral mais provável é a média populacional. Os próximos são os valores médios próximos da média da população.

Assim, podemos concluir que quanto mais a média da amostra se desviar da média populacional, menor a probabilidade de ocorrer. E, por fim, também vemos o que já dissemos sobre o comportamento das amostras, ou seja, quanto maior a amostra, maior a probabilidade de sua média ficar próxima da média populacional.

É este tipo de comportamento por parte das amostras aleatórias simples (probabilidade) em relação à média, bem como a proporções e outros tipos de estatísticas, que nos permite estimar não apenas a característica da população (por exemplo, a média), mas também a probabilidade de a amostra diferir do valor real da população em alguma quantidade dada.

Uma característica típica da amostragem aleatória simples é que, quando a população é grande em comparação com o tamanho da amostra (por exemplo, mais de dez vezes maior), as variabilidades das distribuições amostrais são mais influenciadas pelo número absoluto de casos na amostra. amostra do que pela proporção da população que a amostra inclui.

Em outras palavras, a magnitude dos erros que podem surgir em decorrência da amostragem depende mais do tamanho absoluto da amostra do que da proporção que ela tem com a população, isto é, de quão grande ou pequena é a parte da amostragem. população.

Quanto maior o tamanho da amostra aleatória, maior a probabilidade de fornecer uma estimativa razoavelmente boa da característica da população, independentemente de sua proporção em comparação com a população.

Assim, a estimativa de um voto popular em uma pesquisa nacional, dentro dos limites de uma margem de erro tolerável, não exigiria uma amostra substancialmente maior do que a que seria necessária para uma estimativa do voto da população em uma província particular onde o resultado da pesquisa está em dúvida.

Para elaborar o ponto, uma amostra de 500 (amostra de 100%) dará perfeita precisão se uma comunidade tivesse apenas 500 residentes. Uma amostra de 500 dará uma precisão ligeiramente maior para um município de 1000 habitantes do que para uma cidade de 10.000 habitantes. Mas além do ponto em que a amostra é uma grande parte do "universo", não há diferença apreciável na precisão com o aumento do tamanho do "universo".

Para qualquer nível de precisão, tamanhos de amostra idênticos dariam o mesmo nível de precisão para comunidades de diferentes populações, por exemplo, variando de 10.000 a 10 milhões. A proporção do tamanho da amostra para as populações dessas comunidades não significa nada, embora isso pareça ser importante se prosseguirmos com a intuição.

Tipo # 2. Amostragem Sistemática:

Este tipo de amostragem é, para todos os efeitos práticos, uma aproximação da amostragem aleatória simples. Isso requer que a população possa ser identificada exclusivamente por sua ordem. Por exemplo, os moradores de uma comunidade podem ser listados e seus nomes reorganizados em ordem alfabética. Cada um desses nomes pode receber um número único. Tal índice é conhecido como o 'quadro' da população em questão.

Suponha que esse quadro consista em 1.000 membros, cada um com um número único, isto é, de 1 a 1.000. Digamos que queremos selecionar uma amostra de 100. Podemos começar selecionando qualquer número entre 1 e 10 (ambos incluídos). Suponha que façamos uma seleção aleatória inserindo a lista e obtenha 7.

Em seguida, prosseguimos para selecionar membros; a partir de 7, com um intervalo regular de 10. O selecionado para selecionar membros: começando com um intervalo regular de 10. A amostra selecionada consistiria, portanto, de elementos com os números 7, 17, 27, 37, 47, … 977, 987, 997. Esses elementos juntos constituiriam uma amostra sistemática.

Deve ser lembrado que uma amostra sistemática pode ser considerada uma amostra de probabilidade apenas se o primeiro caso (por exemplo, 7) tiver sido selecionado aleatoriamente e, em seguida, o décimo caso do quadro tiver sido selecionado posteriormente.

Se o primeiro caso não for selecionado aleatoriamente, a amostra resultante não será uma amostra probabilística, pois, na natureza do caso, a maioria dos casos que não estão a uma distância de dez do número inicialmente escolhido terá um zero (0 ) probabilidade de ser incluído na amostra.

Deve-se notar que na amostragem sistemática quando o primeiro caso é sorteado aleatoriamente, não há, antecipadamente, nenhuma limitação sobre as chances de qualquer caso ser incluído na amostra. Mas, uma vez selecionado o primeiro caso, as chances de casos subseqüentes são decisivamente afetadas ou alteradas. No exemplo acima, os casos diferentes de 17, 27, 37, 47, etc., não têm chance de serem incluídos na amostra.

Isso significa que o plano de amostragem sistemático não oferece todas as combinações possíveis de casos, a mesma chance de ser incluído na amostra.

Assim, os resultados podem ser bastante enganosos se os casos na lista estiverem organizados em alguma ordem cíclica ou se a população não estiver completamente misturada com relação às características em estudo (digamos, renda ou horas de estudo), ou seja, de uma maneira. que cada um dos dez membros tinha uma chance igual de ser escolhido.

Tipo # 3. Amostragem aleatória estratificada:

Na amostragem aleatória estratificada, a população é primeiro dividida em vários estratos. Esses estratos podem ser baseados em um único critério, por exemplo, nível educacional, produzindo um número de estratos correspondentes aos diferentes níveis de escolaridade ou na combinação de dois ou mais critérios (por exemplo, idade e sexo), produzindo estratos como 30 anos e homens com mais de 30 anos, mulheres com menos de 30 anos e mulheres com mais de 30 anos.

Na amostragem aleatória estratificada, uma amostra aleatória simples é retirada de cada um dos estratos e essas sub-amostras são reunidas para formar a amostra total.

Em geral, a estratificação do universo com a finalidade de amostragem contribui para a eficiência da amostragem se ela estabelece classes, isto é, se pode dividir a população em classes de membros ou elementos que são internamente comparativamente homogêneos e relativos entre si, heterogêneos., no que diz respeito às características estudadas. Suponhamos que idade e sexo sejam duas bases potenciais de estratificação.

Agora, devemos descobrir que a estratificação com base no sexo (masculino / feminino) produz dois estratos que diferem acentuadamente uns dos outros em relação aos escores em outras características pertinentes em estudo, enquanto, por outro lado, a idade como base de estratificação não Estratos de rendimento que são substancialmente diferentes uns dos outros em termos das pontuações nas outras características significativas, então será aconselhável estratificar a população com base no sexo e não na idade.

Em outras palavras, o critério do sexo será a base mais efetiva de estratificação nesse caso. É bem possível que o processo de dividir a população em estratos internamente homogêneos e relativamente heterogêneos em relação a certas características relevantes seja proibitivamente caro.

Nessa situação, o pesquisador pode optar por selecionar uma grande amostra aleatória simples e compensar o alto custo aumentando (por meio de uma amostra aleatória simples de grande porte) o tamanho total da amostra e evitando os perigos resultantes da estratificação.

Deve-se entender claramente que a estratificação dificilmente tem a ver com fazer da amostra uma réplica da população.

De fato, as questões envolvidas na decisão se a estratificação deve ser efetuada estão relacionadas principalmente à homogeneidade antecipada dos estratos definidos com relação às características em estudo e aos custos comparativos dos diferentes métodos de obtenção de precisão. A amostragem aleatória estratificada, como a amostragem aleatória simples, envolve planos de amostragem representativos.

Agora nos voltamos para discutir as principais formas ou amostragem estratificada. O número de casos selecionados dentro de cada estrato pode ser proporcional à força do estrato ou desproporcional a ele.

O número de casos pode ser o mesmo de estrato para estrato ou variar de um estrato para outro, dependendo do plano de amostragem. Vamos agora considerar muito brevemente estas duas formas, ou seja, proporcional e as amostras estratificadas desproporcionais.

Tipo # 4. Amostragem Estratificada Proporcional :

Na amostragem proporcional, os casos são extraídos de cada estrato na mesma proporção em que ocorrem no universo. Suponhamos que sabemos que 60% da "população" é masculina e 40% dela é do sexo feminino. Amostragem estratificada proporcional com referência a essa 'população', envolveria o desenho de uma amostra de maneira que essa mesma divisão entre os sexos seja refletida, ou seja, 60:40, na amostra.

Se o procedimento de amostragem sistemática for empregado em um estudo, a base sobre a qual a lista é feita determina se a amostra resultante é ou não uma amostra estratificada proporcional. Por exemplo, se todo sétimo nome for selecionado em uma sequência regular a partir de uma lista de nomes organizados em ordem alfabética, a amostra resultante deverá conter aproximadamente 1/7 dos nomes iniciados com cada letra do alfabeto.

A amostra resultante neste caso seria uma amostra alfabética estratificada proporcional. Naturalmente, se o arranjo alfabético é completamente não relacionado e irrelevante para o problema que está sendo estudado, a amostra pode ser considerada uma amostra aleatória com certas limitações típicas das amostras sistemáticas discutidas acima.

Várias razões podem ser sugeridas para amostragem dos vários estratos em proporções desiguais ou diferentes. Às vezes, é necessário aumentar a proporção amostrada dos estratos com um pequeno número de casos, a fim de garantir que esses estratos sejam amostrados.

Por exemplo, se alguém estivesse planejando um estudo de vendas a varejo de roupas em uma determinada cidade em um determinado ponto do tempo, uma amostra aleatória simples de lojas de varejo não poderia nos fornecer uma estimativa precisa do volume total de vendas, já que uma pequena número de estabelecimentos com uma proporção muito grande das vendas totais, pode acontecer de ser excluído da amostra.

Nesse caso, seria sensato estratificar a população de lojas de tecidos em termos de algumas poucas lojas de tecidos que têm um volume muito grande de vendas que constituirão o estrato mais alto. O pesquisador faria bem em incluir todos eles em sua amostra.

Ou seja, às vezes ele pode ter uma amostra de 100% desse estrato e uma porcentagem muito menor de casos de outros estratos que representam um grande número de lojas (com baixo ou moderado volume de turnover). Essa amostragem desproporcional por si só provavelmente fornecerá estimativas confiáveis ​​em relação à população.

Outra razão para tomar uma proporção maior de casos de um estrato do que de outros é que o pesquisador pode querer subdividir os casos dentro de cada estrato para análise posterior.

O sub-estrato assim derivado pode não conter todos um número suficiente de casos para amostrar e na mesma proporção que os outros sub-estratos, portanto não permitiria casos suficientes para servir como uma base adequada para uma análise mais aprofundada. Sendo este o caso, pode-se ter que extrair uma proporção maior de casos do sub-estrato.

Em termos gerais, pode-se dizer que a maior precisão e representação podem ser obtidas se as amostras dos vários estratos refletirem adequadamente suas variabilidades relativas em relação às características em estudo, em vez de apresentarem seus tamanhos relativos na "população".

É aconselhável fazer uma amostragem mais intensa em estratos onde o pesquisador tem uma razão para acreditar que a variabilidade de uma dada característica, por exemplo, atitudes ou participação, seria maior.

Assim, em um estudo realizado para prever o resultado das eleições nacionais empregando o método de amostragem estratificada, com os estados como base de estratificação, uma amostra mais pesada deve ser tirada das áreas ou regiões onde o resultado é severamente nublado e muito em dúvida. .

Tipo 5. Amostragem estratificada desproporcional :

Já sugerimos as características da amostragem desproporcional e também algumas das principais vantagens desse procedimento de amostragem. É claro que uma amostra estratificada em que o número de elementos retirados de vários estratos é independente dos tamanhos desses estratos pode ser chamado de amostra estratificada desproporcional.

Este mesmo efeito pode ser conseguido alternativamente, extraindo de cada estrato um número igual de casos, independentemente de quão fortemente ou fracamente o estrato esteja representado na população.

Como corolário do modo como é selecionado, uma vantagem da amostragem estratificada desproporcional relaciona-se ao fato de que todos os estratos são igualmente confiáveis ​​do ponto de vista do tamanho da amostra. Uma vantagem ainda mais importante é a economia.

Esse tipo de amostra é econômico, pois os pesquisadores são poupados dos problemas de garantir um volume desnecessariamente grande de informações dos grupos mais prevalentes na população.

Tal amostra pode, no entanto, também trair as desvantagens combinadas do número desigual de casos, ou seja, pequenez e não representatividade. Além disso, uma amostra desproporcional requer profundo conhecimento das características pertinentes dos vários estratos.

Tipo # 6. Amostra de Alocação Ótima :

Neste procedimento de amostragem, o tamanho da amostra retirada de cada estrato é proporcional ao tamanho e à distribuição dos valores dentro de qualquer estrato. Uma utilização precisa deste procedimento de amostragem envolve o uso de certos conceitos estatísticos que ainda não foram introduzidos de forma adequada ou convincente.

Agora sabemos algo sobre a amostragem aleatória estratificada e suas diferentes manifestações. Vamos agora ver como as variáveis ​​ou critérios de estratificação devem ser planejados.

As seguintes considerações idealmente entram na seleção de controles para estratificação:

(a) As informações pertinentes à instituição de estratos devem estar atualizadas, exatas, completas, aplicáveis ​​à população e disponíveis ao pesquisador.

Muitas características da população não podem ser usadas como controles, uma vez que nenhuma estatística satisfatória sobre elas está disponível. Em uma sociedade altamente dinâmica, caracterizada por grandes transtornos na população, o pesquisador, empregando a estratégia de estratificação, geralmente corre o risco de errar completamente em suas estimativas sobre os tamanhos dos estratos que ele produz em sua amostra.

(b) O pesquisador deve ter razões para acreditar que os fatores ou critérios usados ​​para a estratificação sejam significativos à luz do problema em estudo.

(c) A menos que o estrato em questão seja grande o suficiente e, portanto, o amostrador e os trabalhadores de campo não tenham grande dificuldade em localizar candidatos para ele, ele não deve ser usado.

(d) Ao selecionar casos para estratificação, o pesquisador deve tentar escolher aqueles que são homogêneos em relação às características que são significativas para o problema em estudo. Como foi dito anteriormente, a estratificação é eficaz na medida em que os elementos dentro do estrato são semelhantes entre si e ao mesmo tempo diferentes em relação aos elementos de outros estratos.

Vamos agora considerar os méritos e limitações da amostragem aleatória estratificada de uma maneira geral:

(1) Ao empregar o procedimento de amostragem aleatória estratificada, o pesquisador pode ter certeza de que nenhum grupo ou categoria essencial será excluído da amostra. A maior representatividade da amostra é assim garantida e os eventuais contratempos que ocorrem na amostragem aleatória simples são assim evitados.

(2) No caso de populações mais homogêneas, maior precisão pode ser obtida com menos casos.

(3) Em comparação com os aleatórios simples, as amostras estratificadas são mais concentradas geograficamente, reduzindo assim os custos em termos de tempo, dinheiro e energia nas entrevistas com os entrevistados.

(4) As amostras que um entrevistador escolhe podem ser mais representativas se sua cota for alocada pelo procedimento impessoal de estratificação do que se ele usar seu próprio julgamento (como na amostragem de cotas).

A principal limitação da amostragem aleatória estratificada é que, para garantir o máximo de benefícios no decorrer de um estudo, o pesquisador precisa conhecer muito sobre o problema da pesquisa e sua relação com outros fatores. Tal conhecimento nem sempre é fácil e, muitas vezes, a espera é longa.

Deve ser lembrado que o ponto de vista da teoria da amostragem probabilística, é essencialmente irrelevante se a estratificação é introduzida durante o procedimento de amostragem ou durante a análise dos dados, exceto na medida em que a primeira torna possível controlar o tamanho da amostragem. amostra obtida de cada estrato e, assim, aumentar a eficiência do desenho amostral.

Em outras palavras, o procedimento de desenhar uma amostra aleatória simples e depois dividi-la em estratos é equivalente, na verdade, ao desenho de uma amostra aleatória estratificada usando como base de amostragem dentro de cada estrato, a população daquele estrato que é incluída no dado dado simples. amostra aleatória.

Tipo # 7. Amostragem de Clusters :

Tipicamente, a amostragem aleatória simples e a amostragem aleatória estratificada acarretam enormes despesas quando se trata de populações grandes e dispersas espacialmente ou geograficamente.

Nos tipos de amostragem acima, os elementos escolhidos na amostra podem estar tão dispersos que entrevistá-los pode acarretar gastos pesados, uma maior proporção de tempo não produtivo (gasto durante a viagem), uma maior probabilidade de falta de uniformidade entre os entrevistados. questionamentos, gravações e, por último, um gasto pesado na supervisão do pessoal de campo.

Existem também outros fatores práticos dessa amostragem. Por exemplo, pode ser considerado menos censurável e, portanto, admissível administrar um questionário a três ou quatro departamentos de uma fábrica ou escritório, em vez de administrá-lo em uma amostra retirada de todos os departamentos em uma base aleatória simples ou estratificada, pois este último procedimento pode ser muito mais perturbador das rotinas de fábrica.

É por algumas dessas razões que os estudos de pesquisa em larga escala raramente fazem uso de amostras aleatórias simples ou estratificadas; em vez disso, eles fazem uso do método de amostragem de cluster.

Na amostragem por conglomerados, o amostrador primeiro faz a amostragem da população, certos agrupamentos grandes, isto é, “agrupamento”. Esses agrupamentos podem ser prefeituras, domicílios ou várias unidades geográficas ou sociais. A amostragem de clusters da população é feita por métodos de amostragem aleatória simples ou estratificada. A partir desses clusters selecionados, os elementos constituintes são amostrados recorrendo a procedimentos que garantem a aleatoriedade.

Suponha, por exemplo, que um pesquisador queira conduzir uma amostra de estudo sobre os problemas de alunos de graduação em faculdades em Maharashtra.

Ele pode proceder da seguinte maneira:

(a) Primeiro, ele prepara uma lista de todas as universidades do estado e seleciona uma amostra das universidades em uma base "aleatória".

(b) Para cada uma das universidades do estado incluídas na amostra, ele faz uma lista de faculdades sob sua jurisdição e coleta uma amostra de faculdades de forma “aleatória”.

(c) Para cada uma das faculdades que forem incluídas na amostra, ele faz uma lista de todos os alunos de graduação inscritos nela. De fora desses alunos, ele seleciona uma amostra do tamanho desejado em uma base "aleatória" (simples ou estratificada).

Dessa maneira, o pesquisador obtém uma probabilidade ou amostra aleatória de elementos, mais ou menos concentrados, geograficamente. Desta forma, ele é capaz de evitar pesadas despesas que teriam sido incorridas caso ele tivesse recorrido a uma amostragem aleatória simples ou estratificada, e ainda assim ele não precisava sacrificar os princípios e benefícios da amostragem probabilística.

Caracteristicamente, esse procedimento de amostragem se move através de uma série de etapas. Por isso, é, em certo sentido, uma amostragem de "múltiplos estágios" e às vezes conhecida por esse nome. Esse procedimento de amostragem se move progressivamente das unidades de amostragem mais inclusivas para as menos inclusivas, o pesquisador finalmente chega aos elementos da população que constituem sua amostra desejada.

Deve-se notar que, com a amostragem por conglomerados, não é mais verdade que toda combinação do número desejado de elementos na população tem a mesma probabilidade de ser selecionada como a amostra da população. Assim, o tipo de efeitos que vimos em nossa análise de amostras aleatórias simples, ou seja, o valor da população sendo o valor amostral mais provável, não pode ser visto aqui.

Mas tais efeitos se materializam de uma maneira mais complicada, embora, é claro, a eficiência da amostragem seja dificultada até certo ponto. Verificou-se que, numa base por caso, a amostragem por conglomerados é muito menos eficiente na obtenção de informação do que a amostragem aleatória estratificada comparativamente eficaz.

Relativamente falando, na amostragem de cluster, a margem de erro é muito maior. Essa desvantagem, no entanto, é mais que equilibrada pelas economias associadas, o que permite a amostragem de um número suficientemente grande de casos a um custo total menor.

Dependendo das características específicas do plano de amostragem que atende aos objetos de pesquisa, a amostragem por conglomerados pode ser mais ou menos eficiente do que a amostragem aleatória simples. As economias associadas à amostragem por conglomerados geralmente inclinam a balança para o uso de amostragem por conglomerados em pesquisas de grande escala, embora, em comparação com a amostragem aleatória simples, mais casos sejam necessários para o mesmo nível de precisão.

Tipo # 8. Amostragem Multi-Fase:

Às vezes, é conveniente limitar certas questões sobre aspectos específicos do estudo a uma fração da amostra, enquanto outras informações estão sendo coletadas de toda a amostra. Esse procedimento é conhecido como "amostragem multifásica".

A informação básica registada a partir de toda a amostra permite comparar certas características da subamostra com a de toda a amostra.

Um ponto adicional que merece ser mencionado é que a amostragem multifásica facilita a estratificação da sub-amostra, uma vez que as informações coletadas da amostra da primeira fase podem às vezes ser coletadas antes que o processo de subamostragem ocorra. Será lembrado que os estudos de painel envolvem amostragem multifásica.