Análise de Dados: 4 Passos

Este artigo lança luz sobre as quatro principais etapas envolvidas na análise de dados. As etapas são: 1. Estabelecimento de Categorias ou Classificação de Dados 2. Codificação 3. Tabulação 4. Análise Estatística de Dados.

Etapa # 1. Estabelecimento de Categorias ou Classificação de Dados :

A pesquisa em ciências sociais geralmente envolve uma grande variedade de respostas a diferentes tipos de perguntas ou estímulos apresentados à amostra ou à "população" de respondentes. Essas respostas podem ser verbais ou não verbais.

Claramente, se um grande número de tipos diferentes de respostas deve ser organizado de modo a poder ser usado para responder às questões de pesquisa, ou para extrair generalizações, elas devem ser agrupadas em um número limitado de categorias ou classes. Para dar um exemplo simples, suponha que as perguntas sejam feitas aos entrevistados: “Você é a favor do exame de tipo objetivo para estudantes universitários?”

As respostas dos entrevistados podem ser agrupadas em quatro grandes categorias, como abaixo:

(a) respostas “sim”.

(b) respostas "não".

(d) "não respondeu".

Suponha que outra pergunta feita aos entrevistados seja: "A que classe social você diz que pertence?"

As respostas dos respondentes podem ser agrupadas nas seguintes categorias:

(a) classe alta.

(b) classe média.

(d) "Não posso dizer."

(e) Outras respostas (tipo: “Eu não acredito em classes sociais”. “Não importa onde eu pertenço” etc.).

Um pré-requisito para tomar uma decisão sobre as categorias a serem instituídas para agrupar os dados é que o pesquisador deve selecionar algum princípio apropriado de classificação. A questão ou hipótese de pesquisa, se alguma tiver sido formulada, fornece uma boa base lógica para a seleção de um princípio classificatório.

Suponha que a hipótese em um estudo seja:

"Os estudantes que tiveram uma experiência de estudar em escolas mistas terão uma atitude mais favorável em relação ao sistema de coeducação."

Aqui, obviamente, um dos princípios da classificação das respostas será se o entrevistado já teve ou não experiência anterior no sistema coeducacional. Outra base de classificação das respostas seria o grau de favorecimento ou falta de amabilidade expresso em relação ao sistema coeducacional. Outras bases de classificação também podem ser invocadas, dependendo de quais outras associações devem ser escrutinadas.

A primeira base de classificação produziria duas categorias de respostas:

(a) Disse que eles tinham uma experiência prévia de co-educação;

(b) Disse, eles não tiveram nenhuma experiência prévia de co-educação.

Essas duas categorias contêm dentro de si toda a gama de respostas (assumindo, é claro, que nenhum entrevistado se recusou a responder ou não respondeu ou deu alguma "outra resposta". Nenhuma resposta sobre a suposição acima está além da bússola dessas duas categorias. Essas duas categorias juntas formam o que é conhecido como "conjunto de categorias".

Um 'conjunto de categorias' deve atender aos três requisitos a seguir:

(1) O conjunto de categorias deve ser derivado de um único princípio classificatório. Este requisito é perfeitamente compreensível, porque, se for utilizado mais de um princípio de classificação, uma única resposta pode ser reivindicada por mais de uma categoria.

Assim, as categorias não serão independentes umas das outras. Por exemplo, se temos três categorias que constituem o conjunto de categorias, por exemplo, masculino, feminino, derivando obviamente de dois princípios classificatórios, a saber sexo e idade, respectivamente, então qualquer caso (respondente) pode ser coberto por mais de uma categoria no conjunto de categorias.

Por exemplo, uma criança também pode ser um homem, uma fêmea também pode ser uma criança e assim por diante. O princípio classificatório pode, no entanto, ser composto de um, ou seja, composto de dois ou mais critérios, ou seja, filho do sexo masculino, filho do sexo feminino, etc.

(2) O segundo requisito é que o conjunto de categorias seja exaustivo, ou seja, deve ser possível colocar cada resposta em uma das categorias dentro do conjunto. 'Nenhuma resposta' deve ser deixada de fora por falta de uma categoria apropriada no conjunto que a incluirá.

Quaisquer que sejam as respostas, elas devem ser cobertas por alguma categoria dentro do conjunto. Por exemplo, se os povos do mundo fossem classificados com base em seu estoque racial, o conjunto de categorias constituído de três categorias, a saber, (a) caucasóide, (b) negróide e (c) mongolóide, claramente não ser um conjunto de categorias exaustivo de acordo com o requisito descrito acima, uma vez que não contém uma única categoria na qual muitos dos povos indígenas (e alguns outros) podem encontrar um lugar.

(3) O último requisito é um corolário do primeiro, a saber, que as categorias dentro do conjunto devem ser mutuamente exclusivas; isto é, as categorias não devem se sobrepor. Assim, nenhuma resposta seria reivindicada por mais de uma categoria dentro do conjunto.

O estabelecimento de categorias para dados característicos das ciências sociais nem sempre é uma tarefa fácil. O princípio classificatório pode muitas vezes ser um composto (em oposição ao simples, unitário). A tarefa de extrair todas as categorias mutuamente excludentes que juntas esgotariam o universo total de respostas, com base em um princípio classificatório composto, é de fato uma exigência, exigindo imaginação.

É de grande ajuda, em tais casos, reduzir os atributos que constituem o princípio composto de classificação a símbolos ou códigos e extrair, por meio da técnica de expansão booleana, toda a gama de categorias possíveis que compõem o conjunto de categorias.

Vamos dar um exemplo muito simples. Suponha que o pesquisador considere três atributos, por exemplo, sexo (masculino de fêmea), idade (abaixo de 21 anos ou acima de 21 anos) e estado civil (casado ou solteiro) como constituintes de seu único (mas composto) princípio de classificação. e reduz estes para símbolos como abaixo:

Macho = S, fêmea = S

Abaixo de 21 anos de idade = A, acima de 21 anos de idade = A̅

Casado = M, solteiro = M̅

O conjunto de categorias resultante será a totalidade exaustiva que consiste em todas as combinações possíveis desses três atributos que compõem o princípio classificatório composto. As combinações possíveis, isto é, as categorias, serão 2 ³ = 2 x 2 x 2 = 8 em número.

Estes são como abaixo:

(1) SAM

(2) S̅ AM

(3) S A̅ M

(4) SA M̅

(5) S̅ A̅ M

(6) S̅ A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

Decodificando, isto é, substituindo as conotações reais pelos símbolos, obtemos oito categorias mutuamente exclusivas que são lidas como abaixo:

(1) Homens com menos de 21 anos e casados.

(2) Mulheres com menos de 21 anos e casadas.

(3) Homens acima de 21 anos e casados.

(4) Homens com menos de 21 anos e solteiros.

(5) Mulheres acima de 21 anos e casadas.

(6) Mulheres com menos de 21 anos e solteiras.

(7) Homens acima de 21 anos e solteiros.

(8) Mulheres acima de 21 anos e solteiras.

Da mesma forma, se o princípio de classificação composto é constituído de quatro atributos, teremos 2 ⁴ = 2x 2 x 2 x 2, isto é, 16 categorias mutuamente excludentes. Deve ficar claro agora como esse método de estabelecer categorias, em vez de intuição, torna a tarefa de classificação muito mais fácil e à prova de erros.

É óbvio que o estabelecimento de um conjunto de categorias é relativamente fácil se as respostas obtidas dos respondentes durante o estudo forem bastante simples e claras e, portanto, as categorias puderem ser facilmente definidas de maneira inequívoca. Embora seja assim que as categorias devem ser sempre definidas, a tarefa é muito mais difícil com determinados tipos de conteúdo.

Suponha que, em um estudo, o pesquisador perguntou aos alunos do sexo masculino: "Como você diria que as alunas se sentem estudando na mesma faculdade com alunos do sexo masculino como você?" As respostas provavelmente vão desde indicações de atitudes altamente favoráveis (imputadas a estudantes do sexo feminino). ) a imputações de atitudes altamente desfavoráveis. Suponha que estas são algumas das respostas recebidas dos respondentes.

(1) Eles gostam da ideia.

(2) "Eu não acho que eles se importem."

(3) "Eles acham que isso os abaixa".

(4) Eu não entro em contato com eles, então eu não saberia.

(5) 'Eles odeiam isso'.

(6) 'Alguns gostam disso, outros não'.

(7) 'Eles querem estudar aqui para poderem dizer que não são menos que os machos'.

(8) "Em uma faculdade puramente feminina, eles perderiam muito, então eles parecem gostar daqui."

Em relação às respostas acima, não seria difícil desenvolver um conjunto simples de categorias com base no princípio classificatório de atitudes favoráveis versus desfavoráveis imputadas a alunas. Mas descobrimos que respostas favoráveis e desfavoráveis transmitem diferentes matizes de significados.

O estudante do sexo masculino que diz: “Eles (as alunas) querem estudar aqui para poderem dizer que são nada menos que os homens” transmite algo diferente daquele que diz: “Eles gostam da ideia”. Da mesma forma, o estudante do sexo masculino diz "Eles acham que isso os abaixa" está novamente dizendo algo diferente daquele que diz: "Eles odeiam isso".

Assim, vemos que dois atributos, ou seja:

(1) Imputação de atitudes favoráveis ou desfavoráveis às meninas, e

(2) Referência explícita ou ausência de referência a benefícios ou danos que suportam atitudes favoráveis ou desfavoráveis são dois constituintes significativos de um princípio composto de classificação.

As categorias no conjunto de categorias, de acordo com os requisitos ideais de um conjunto de categorias discutido anteriormente, podem ser colocadas abaixo:

(1) Atitude favorável imputada a alunas, explicada em termos de benefícios que derivam de estudar na mesma faculdade com alunos do sexo masculino (por exemplo, 7ª e 8ª respostas).

(2) Atitude favorável imputada às meninas sem referência explícita aos benefícios obtidos ao estudar na mesma faculdade com os homens (por exemplo, a declaração nº 1).

(3) Atitude neutra ou acomodativa imputada às meninas (por exemplo, declaração n ° 1).

(4) Atitude desfavorável imputada às meninas, explicada em termos de desvantagens (benefícios negativos) que derivam de estudar na mesma faculdade com estudantes do sexo masculino.

(5) Atitude desfavorável imputada às meninas sem referência explícita a desvantagens ou perdas resultantes da co-educação (por exemplo, a declaração nº 5).

(6) Outras respostas, não posso dizer, nenhuma resposta, não sei (por exemplo, a declaração nº 4).

A ilustração acima daria uma idéia de quão complexa pode ser uma classificação em ciências sociais. Trabalhar com categorias tão complexas requer considerável cuidado e esforço na classificação. Mesmo quando as categorias foram elaboradas com cuidado, seu uso apresentará problemas maiores do que o uso de categorias definidas de forma mais restrita e exata.

Se um estudante do sexo masculino no exemplo acima disser: "eles gostam disso tudo bem aqui, eles sabem por quê", é uma questão discutível se essa afirmação implica ou não um benefício. Assim, regras adicionais teriam que ser estabelecidas para lidar com tais respostas.

Deve ser dito, mesmo ao custo de alguma repetição, que embora, em princípio, seja possível usar muitos atributos de respostas para a formulação de conjuntos de categorias, na prática, isso é muitas vezes desnecessário, antieconômico e pouco recompensador, pois nem todos esses princípios classificatórios suportar o objetivo do estudo.

Vamos agora nos voltar para considerar o problema de selecionar um princípio classificatório para categorizar material não estruturado (ou seja, informações coletadas por ferramentas não estruturadas).

Em estudos que usam instrumentos estruturados para reunir dados relevantes para questões ou hipóteses de pesquisa formuladas de forma clara, o princípio apropriado para a classificação de respostas é claramente prescrito pela natureza das perguntas e pelas respostas seguras.

Ao trabalhar com material não estruturado ou dados, no entanto, o primeiro problema é chegar a decisões sobre quais aspectos do material devem ser categorizados, ou seja, quais princípios classificatórios devem ser usados no estabelecimento de categorias.

Em estudos exploratórios que definicionalmente não se iniciam com um problema bem formulado ou com uma hipótese explícita, a decisão sobre os princípios classificatórios é difícil de alcançar. No momento da coleta de dados, o investigador não sabe quais aspectos podem se tornar mais importantes.

Ele deve, portanto, coletar uma grande quantidade de dados do tipo não estruturado. No decorrer da análise, o pesquisador se depara com o problema de lidar não apenas com materiais não estruturados, mas também com um grande volume deles.

É aconselhável, ao analisar os dados de um estudo exploratório, desenvolver hipóteses de trabalho que produzam princípios classificatórios satisfatórios viáveis. O pesquisador é obrigado a ler cuidadosamente todo o seu material, estando sempre alerta para as pistas latentes nos dados. Tais pistas são muitas vezes asseguradas através do estudo de materiais sobre assuntos ou situações que contrastam com os que ele está estudando.

Tal estudo ajuda o investigador a ver as diferenças importantes entre as duas situações. Outro procedimento para chegar a essas pistas é juntar os casos em grupos que pareçam ter um parentesco próximo ou pareçam estar juntos e depois se perguntem o que o levou a sentir que os casos que ele colocou em um único grupo são iguais.

No entanto, outra abordagem que pode estimular pistas para a formulação de hipóteses de trabalho é observar assuntos que parecem surpreendentes, seja em vista de certas expectativas teóricas ou do senso comum, e depois buscar uma possível explicação dos fenómenos surpreendentes ou imprevistos.

Deve, no entanto, ser lembrado que, mesmo com hipóteses claras, a análise de material não estruturado apresenta problemas especiais. Em primeiro lugar, há sempre a possibilidade de que informações sobre um determinado ponto possam estar faltando em alguns dos documentos.

Há também a probabilidade de uma grande quantidade de material não ter um impacto direto na hipótese. Além disso, existe o problema de decidir o tamanho das unidades do material ao qual as categorias serão aplicadas.

Por exemplo, se um pesquisador estava usando registros de casos mantidos por agências de assistência social, ele deve decidir qual unidade (por exemplo, clientes, declarações, atos, assistentes sociais, sessões com o cliente ou todo o registro) é mais apropriada para fornecer respostas à sua pesquisa. questões específicas de pesquisa.

Etapa # 2. Codificação:

Codificação consiste em atribuir símbolos, geralmente numerais para cada resposta que cai em uma classe predeterminada. Em outras palavras, a codificação pode ser considerada como o processo de classificação necessário para a tabulação subsequente. Através da codificação, os dados brutos são transformados em símbolos que podem ser tabulados e contados.

Essa transformação não é automática, envolve muito julgamento por parte do codificador. 'Codificador' é o título oficial para uma pessoa que é designada a responsabilidade de fornecer códigos específicos às respostas depois que as anotações registradas forem levadas ao escritório.

Deve-se lembrar, no entanto, que muitas vezes o julgamento de qual resposta deve ser atribuída a um código específico é feito por uma pessoa que não seja aquela que usa a designação oficial de 'codificador'.

A codificação pode ocorrer em três pontos diferentes em um estudo em cada um dos quais, diferentes tipos de pessoas podem ser responsáveis por atribuir códigos aos dados brutos. Em muitos estudos, o próprio respondente pode ser solicitado a atribuir códigos à sua própria reação ou situação.

Isso é verdade para muitas perguntas do tipo pesquisa e de múltipla escolha. Por exemplo, quando o entrevistado é solicitado a indicar em qual das classes (digamos, grupos de renda) ele pertence, por exemplo, (a) abaixo de 3000 rúpias pm, (b) Rs. 3001 / - para Rs. 6000 / - pm, (c) Rs. 6001 / - para Rs. 9000 / - pm, (d) Rs. 9001 / - e acima, o respondente codifica sua resposta simplesmente assinalando sua posição entre as alternativas dadas.

O segundo ponto no qual a codificação pode ocorrer é quando, no decorrer da coleta de dados, o entrevistador ou o observador categoriza as respostas dos sujeitos. Isso é o que está sendo feito quando um entrevistador ou um observador emprega uma escala de classificação para descrever a resposta ou o comportamento de uma pessoa.

O ponto final no qual a codificação pode ocorrer é, naturalmente, quando os dados brutos não categorizados (coletados especialmente através de instrumentos não estruturados de coleta de dados) são depositados no escritório do projeto e os codificadores oficiais aqui exercem seu julgamento para atribuir códigos particulares a determinados respostas ou dados.

Vamos comparar e comparar brevemente os prós e contras da codificação pelos codificadores oficiais no escritório e codificar pelos entrevistadores ou observadores feitos no decorrer da coleta de dados no campo.

Os entrevistadores ou observadores estão em posição de perceber a situação e o comportamento do indivíduo. Assim, eles têm mais informações sobre as quais basear seus julgamentos em relação à categorização apropriada das respostas em comparação com os codificadores que trabalham com base em registros escritos que podem não dar uma idéia completa sobre o real significado da resposta.

Outra vantagem da codificação pelos próprios coletores de dados é que tanto o tempo quanto o trabalho podem ser salvos.

Pelo contrário, codificação no escritório por codificadores tem certas vantagens de sinal. A codificação de dados complexos, que requer tempo para reflexão, deve ser aconselhada pelos codificadores do escritório. O julgamento codificado no local feito pelos coletores de dados pode não ser tão criterioso quanto os julgamentos feitos com mais tempo para deliberação.

O julgamento dos coletores de dados pode ser colorido por muitos fatores, a saber, as aparências do respondente, sotaques e respostas a questões anteriores, maneirismos, etc. Em segundo lugar, existe o perigo de falta de uniformidade dos coletores de dados ao codificar as respostas.

Assim, a comparabilidade dos dados obtidos de um grande número de respondentes é dificultada. Em terceiro lugar, os entrevistadores ou observadores podem desenvolver suas próprias estruturas de referência em relação ao material que estão codificando. Isso tenderia a tornar suas categorizações pouco confiáveis após algum tempo. Um quadro comum de referências é mais fácil de obter e manter na operação de codificação do escritório do que no campo.

Vamos discutir alguns dos problemas importantes relacionados à confiabilidade na codificação. Há muitas coisas que podem funcionar para tornar o julgamento dos programadores pouco confiáveis. Alguns dos fatores podem surgir dos dados a serem categorizados, alguns da natureza das categorias que devem ser aplicadas e ainda outros podem emanar dos próprios codificadores.

Vamos agora considerar brevemente alguns desses fatores e as maneiras pelas quais eles podem ser protegidos.

Muitas das dificuldades que ocorrem na codificação resultam das inadequações dos dados. Frequentemente, os dados não fornecem informações relevantes suficientes para uma codificação confiável. Isso pode ser devido a procedimentos de coleta de dados deficientes e inadequados. Essas dificuldades, no entanto, geralmente podem ser superadas pela edição cuidadosa dos dados. O processo que consiste em examinar os dados para melhorar sua qualidade de codificação conhecida como edição.

Quando o coletor de dados entrega seu material ao escritório do projeto, ainda existe a possibilidade de eliminar muitas dificuldades potenciais de codificação. Um exame cuidadoso dos dados assim que eles são coletados e, se necessário, um questionamento sistemático dos entrevistadores ou observadores ajuda a evitar muitos problemas de codificação.

A edição não apenas ajuda a evitar problemas de codificação posteriores, como também pode melhorar substancialmente a qualidade da coleta de dados, apontando para onde os entrevistadores ou observadores podem ter instruções mal interpretadas ou podem não ter registrado os dados com detalhes suficientes.

De fato, a edição deve ser feita no decorrer do pré-teste da entrevista ou do cronograma de observação, treinando os entrevistadores ou observadores e, de fato, durante todo o período de coleta de dados. A edição no escritório do projeto ajuda muito na remoção de problemas de codificação.

Assim, a edição deve ser feita enquanto os entrevistadores ou observadores podem ser facilmente disponibilizados para o questionamento. A edição envolve um exame minucioso da entrevista ou dos cronogramas de observação.

Estes devem ser verificados para:

(1) Integralidade: os editores precisam ver que todos os itens estão devidamente preenchidos. Um espaço em branco próximo a uma pergunta em um cronograma de entrevistas, por exemplo, pode significar 'sem resposta' ou 'Não sei' ou recusa a resposta ou inaplicabilidade da questão, ou a questão ter sido omitida pela supervisão, etc.

(2) O editor deve examinar a entrevista ou os cronogramas de observação para descobrir se a caligrafia ou os símbolos ou códigos atribuídos pelo entrevistador ou observador podem ser facilmente compreendidos pelo codificador.

É sempre aconselhável verificar a legibilidade quando o material é entregue e, se necessário, pedir ao entrevistador ou observador para reescrevê-lo. Se isso não for feito, a codificação pode ficar presa em um estágio em que os entrevistadores ou observadores podem não ser facilmente lembrados para o questionamento.

(3) A edição também envolve o exame dos cronogramas para compreensão. Acontece frequentemente que uma resposta gravada é perfeitamente compreensível para o entrevistador ou observador, mas não inteligível para o codificador, porque o contexto de comportamento ou resposta não é conhecido pelo codificador. O questionamento sistemático dos coletores de dados eliminará a confusão e as ambiguidades e melhorará consideravelmente a qualidade da codificação.

(4) Os dados também devem ser examinados ou verificados para descobrir se há certas inconsistências em relação às respostas registradas no cronograma.

Por exemplo, um entrevistado poderia ter dito em resposta a uma das perguntas anteriores que ele nunca havia conhecido pessoas de determinado grupo e, no entanto, em resposta a uma pergunta posterior, ele poderia ter dito algo sobre visitar certas pessoas desse grupo no curso de sua vida. rodadas. Se for esse o caso, há uma necessidade óbvia de investigar essa inconsistência e esclarecê-la através do questionamento dos coletores de dados.

(5) Também é necessário verificar o grau de uniformidade com que os entrevistadores seguiram as instruções para coletar e registrar os dados. A codificação pode ser dificultada se uma resposta for registrada em unidades diferentes das especificadas nas instruções.

(6) Deve-se notar que alguma resposta pode simplesmente parecer irrelevante para o propósito da investigação. É provável que isso aconteça caso uma questão não seja claramente trabalhada ou não seja feita de forma inteligente. Os dados devem, portanto, ser cuidadosamente examinados com o objetivo de segregar as respostas inadequadas das apropriadas.

O valor da categorização dos dados depende naturalmente da solidez das categorias empregadas. É necessário que as categorias, além de serem relevantes para o propósito da pesquisa, também sejam definidas do ponto de vista conceitual.

A codificação não será confiável se as categorias não forem claramente definidas em termos de indicadores aplicáveis aos dados, aqui e agora. Na prática, as categorias são definidas por meio de exemplos dos dados em mãos. É muito útil se as ilustrações dos dados mostrarem não apenas que tipo de respostas tipificam a categoria, mas também ajudam a distinguir a linha divisória entre categorias aparentemente semelhantes.

É óbvio que a qualidade da codificação é afetada pela competência dos codificadores. O treinamento de codificadores é, portanto, um passo importante em qualquer estudo.

A formação dos codificadores pode prosseguir nas seguintes etapas:

Em primeiro lugar, os vários códigos são explicados aos treinamentos (codificadores) e ilustrados com exemplos dos dados a serem categorizados.

Em segundo lugar, todos os codificadores de estágio então praticam em uma amostra dos dados, os problemas que surgem são discutidos pelos codificadores como um grupo com o supervisor para desenvolver procedimentos e definições comuns.

Em terceiro lugar, as pistas resultantes da prática de codificação são usadas para efetuar revisões nas categorias para torná-las mais aplicáveis ao material e para escrever os procedimentos e definições que evoluíram durante a codificação preliminar.

Em quarto lugar, em algum momento do período de prática, quando relativamente poucos novos problemas surgem, os codificadores trabalham em uma porção idêntica de dados sem consultar um ao outro ou ao supervisor. A consistência ou a confiabilidade da codificação é então calculada para determinar se é viável começar a codificar corretamente.

Dependendo dos resultados das verificações de confiabilidade ou consistência, pode ser decidido eliminar as categorias que parecem pouco confiáveis ou gastar mais tempo treinando codificadores ou eliminar codificadores que são mais inconsistentes e assim por diante.

Por fim, são feitas verificações periódicas para garantir que os codificadores não se tornem descuidados com mais experiência ou que não desenvolvam métodos pessoais idiossincráticos para lidar com novos problemas no material. Para assegurar a uniformidade, a decisão tomada após o início da codificação deve ser comunicada a todos os codificadores sem demora.

Obviamente, a consistência e adequação com que um determinado tipo de resposta é atribuído a uma determinada categoria terá uma influência importante no resultado da análise, portanto, é importante verificar a confiabilidade da codificação e aumentar o acordo entre codificadores quanto que possível.

É, evidentemente, difícil estabelecer qualquer nível de confiabilidade como o padrão a ser atingido. Diferentes tipos de material apresentam diferentes graus de dificuldade para alcançar confiabilidade. Via de regra, quanto mais estruturado o material a ser codificado e, portanto, mais simples as categorias utilizadas, maior a confiabilidade.

Deve-se notar que os tipos de códigos utilizados em um estudo serão diferentes, dependendo se os dados devem ser tabulados por máquina ou manualmente. Se os dados devem ser classificados manualmente, uma descrição de palavras das classes é satisfatória.

Também podem ser utilizadas abreviaturas ou letras de alfabetos, por exemplo, 'Y para Sim', 'N' para Não, etc. A tabulação da máquina, por outro lado, exige que as classes sejam expressas em símbolos numéricos, uma vez que as máquinas só podem ser alimentadas com dados numéricos.

A tabulação mecânica requer o uso de cartões perfurados. No entanto, o número de classes diferentes que podem ser mostradas no cartão perfurado é limitado. Em qualquer caso, todos os códigos utilizados para a tabulação da máquina também podem ser usados para tabulação manual.

Se os códigos devem ser colocados em cartões perfurados dos quais dois tamanhos são de uso geral, isto é, 80 cartões de coluna e 54 cartões de coluna, é desejável usar dez em menos classes / categorias para a maioria dos itens de informação ou resposta.

O cartão perfurado contém 10 espaços numerados e um X e Y em cada coluna, perfazendo um total de 12 códigos que podem ser usados. É um procedimento bastante complicado para obter mais de um tipo de item em uma coluna. Por exemplo, natividade e códigos de idade não podem ser perfurados em uma única coluna, a menos que apenas seis grupos de idade sejam usados para cada um.

Etapa # 3. Tabulação:

A tabulação é uma parte do processo técnico na análise estatística dos dados. O elemento essencial na tabulação é a sumarização dos resultados na forma de tabelas estatísticas.

Somente quando dados brutos são divididos em grupos e contagens feitas do número de casos que caem nesses vários grupos, é possível para o pesquisador determinar o significado de seus resultados e transmitir suas descobertas ao consumidor de uma forma que pode ser prontamente entendido.

A tabulação depende, naturalmente, do estabelecimento de categorias para dados brutos, edição e codificação de resposta (perfuração e execução dos cartões através de máquinas para tabulação mecânica e classificação e contagem para tabulação manual).

Pesquisadores experientes geralmente desenvolvem planos de tabulação quase ao mesmo tempo em que elaboram ou constroem os instrumentos de coleta de dados e fazem planos de amostragem. Os pesquisadores inexperientes raramente se preocupam com os planos de tabulação até que os dados sejam coletados. É claro que é impossível para o pesquisador prever toda a gama de tabulação que será posteriormente desejada.

Ele deve estar familiarizado o suficiente com seu problema de pesquisa ou com o assunto da investigação para poder elaborar tabelas que forneçam respostas às perguntas que deram origem ao estudo. O pesquisador deve ser capaz de preparar planos de tabulação adequados se usar as descobertas das pesquisas anteriores que tenham elementos em comum com aqueles para os quais os planos estão sendo elaborados.

Em estudos exploratórios, um procedimento melhor e mais seguro é pré-teste do instrumento de coleta de dados em uma amostra de população do tipo que seria coberta no estudo final. Dessa forma, algumas pistas sobre qual tipo de tabulação seria significativa podem geralmente ser obtidas.

Tabulação, pode ser feito inteiramente por métodos manuais; isto sendo conhecido como tabulação de mão. Alternativamente, pode ser feito por métodos mecânicos utilizando máquinas automáticas e rápidas para a maioria dos dados, sendo o processo conhecido como tabulação mecânica.

O pesquisador deve decidir antes de desenhar planos de tabulação detalhados para o seu estudo, que método de tabulação ele usaria. Esta decisão será baseada em várias considerações, como custo, tempo, pessoal, etc.

Tanto a tabulação manual quanto os procedimentos de tabulação mecânica têm seus respectivos méritos e limitações. O pesquisador alerta para esses méritos e deméritos está em uma maneira melhor de decidir qual método seria adequado para seu problema.

Vamos rever brevemente os méritos destes dois métodos de tabulação:

(1) A tabulação mecânica envolve muito trabalho administrativo e operações especializadas. Evidentemente, isso facilita a velocidade, mas a velocidade nem sempre é uma compensação adequada para o trabalho administrativo extra.

(2) Se o número e os tipos de tabelas desejadas não forem decididos antes do início do trabalho de tabulação. a tabulação da máquina pode ser mais conveniente. Mas, se a tabulação manual for considerada eficiente, a ordem em que os diversos tipos e contagens seriam feitos é determinada antes da tabulação.

(3) Uma grande vantagem da tabulação de máquinas é que facilita as classificações cruzadas. Em estudos de larga escala, onde muitas variáveis devem ser correlacionadas ou classificadas de forma cruzada, a tabulação da máquina é razoavelmente preferível.

É por essa razão que a tabulação mecânica é usada em estudos que requerem muitas correlações inter entre variáveis. Mas, se o número total de respondentes for pequeno, uma contagem manual deles de acordo com o princípio de classificação cruzada pode ser relativamente econômica.

(4) Quando há uma grande quantidade de informações codificadas e vários cartões perfurados necessários para cada caso, a tabulação manual pode ser preferível.

(5) Se for desejado manter os dados em uma forma pronta para nova tabulação, em um prazo relativamente curto, os cartões perfurados são normalmente úteis. A tabulação mecânica é útil para estudos periódicos ou pesquisas em que o mesmo tipo de informação é necessário para ser coletado em intervalos freqüentes.

(6) O processo de classificação e contagem é menos provável de produzir erros se feito por máquina do que se feito manualmente. Erros, é claro, podem e surgem na tabulação da máquina e, quando o fazem, geralmente são muito difíceis de identificar e verificar.

Quaisquer erros descobertos nas etapas de codificação, edição ou trabalho de campo da pesquisa podem atrasar o trabalho de tabulação da máquina. Muitas vezes, é desejável prosseguir com a tabulação manual juntamente com o trabalho de campo.

(7) O custo das operações de tabulação é uma preocupação importante do pesquisador. A tabulação de máquinas geralmente envolve um custo muito maior, já que a maioria dos cartões perfurados, encargos de perfuração e verificação, custos de máquinas de classificação e tabulação e despesas na contratação de serviços especializados de tipos específicos de operadores de máquinas muitas vezes somam muito mais do que os envolvidos tabulação.

(8) Outra consideração importante é o tempo. Na tabulação mecânica, o trabalho de tabulação como tal é feito em muito pouco tempo, mas as etapas preparatórias, como também a formação, supervisão e possível indisponibilidade de certos tipos de máquinas em aluguer, resultando em deslocação do trabalho, podem inevitavelmente contribuir para o desperdício de tempo.

(9) As considerações de conveniência dificilmente podem ser ignoradas. Se a tabulação mecânica exigir o envio de dados brutos para algum escritório longe do escritório do projeto, serão causadas inconveniências envolvidas na embalagem, transporte, etc.

(10) Por fim, a quantidade de material de comentário a ser registrado e analisado também pode afetar a escolha dos métodos de tabulação. Em algumas pesquisas de opinião, os comentários verbais dos informantes são importantes. O cartão com código de mão usado apenas na tabulação manual pode fornecer espaço para tais observações ou comentários.

As máquinas que lidam com o trabalho de tabulação são de vários tipos. Os desenvolvimentos neste campo foram extremamente rápidos durante os últimos anos. Algumas máquinas simplesmente classificam e contam os cartões, outras classificam, contam e imprimem os resultados, outras ainda estão preparadas para executar operações ou cálculos estatísticos mais complicados.

Estas máquinas mencionadas são extremamente complexas e devem ser programadas para uma dada operação por um especialista na linha. Uma tabela é uma exibição dos dados numéricos organizados sistematicamente em colunas rotuladas (vertical) e linhas (horizontal).

Uma tabela simples ou elementar indica contagens simples das frequências com as quais as várias categorias em cada conjunto ocorrem nos dados, por exemplo, o número de pessoas na amostra que frequentaram o ensino médio, mas não passaram, o número de pessoas que compareceram faculdade, mas não se formou e assim por diante. A tabela abaixo indica simplesmente as freqüências de visitas de cinquenta entrevistados ao cinema.

Na pesquisa, estamos freqüentemente interessados em descobrir a correlação entre duas ou mais variáveis, por exemplo, educação e renda e fertilidade, tabelas simples (ilustradas acima) mostrando a distribuição de freqüência dos entrevistados em relação a uma única característica, por exemplo, educação ou renda. ou fertilidade, não nos ajuda a ver a relação entre duas ou mais variáveis.

A maneira de ver o relacionamento é preparar tabelas cruzadas ou tabelas de divisão. Tais tabelas possibilitam o agrupamento de casos que ocorrem conjuntamente em duas ou mais categorias, por exemplo, tabulação do número de casos que possuem alta escolaridade, baixa renda e possuem entre 2 e 3 filhos, ou o número de casos que são baixa na educação, baixa renda e ter entre 4 e 5 filhos e assim por diante. A forma mais elementar de tabulação cruzada com a qual os alunos estão familiarizados é o horário da faculdade.

Suponha que um pesquisador queira ver a relação entre três variáveis, a saber, ocupação, renda e fertilidade. Ele deve empregar um esquema de tabulação que ofereça todas as combinações possíveis das diferentes categorias dessas três variáveis.

A tabulação cruzada dos dados numa amostra hipotética de 100 pessoas pode ser apresentada como abaixo:

Na tabela acima, indicamos o número de filhos em linhas. Esta variável de fertilidade foi dividida em cinco categorias, ou seja, sem problema, 1 a 2 questões, 3 a 4, 5 a 6, 7 e acima. Então, na margem da esquerda, temos essas 5 categorias de fertilidade. Nós indicamos a renda de 100 respondentes em colunas.

A variável renda foi subdividida em cinco categorias, ou seja, abaixo de Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Assim, temos cinco colunas correspondentes a essas categorias.

Novamente, uma vez que temos mais uma variável, isto é, ocupação para acomodar, as colunas de renda foram subdivididas em duas partes correspondentes às duas categorias nas quais as ocupações foram divididas, isto é, ocupação de colarinho branco e ocupação de colarinho azul. .

Assim, temos dez colunas verticais, correspondentes a renda e ocupação. O número de linhas horizontais que temos para as categorias da variável de fertilidade é cinco. Assim, temos dez colunas cruzadas por cinco linhas que compõem o corpo da mesa.

A intersecção das colunas e linhas efetuou 50 (cinquenta) células ou caixas. Cada uma dessas caixas ou células abriga um determinado número de casos que são diferentes daqueles em outras células, seja em relação a renda ou ocupação, em fertilidade ou em quaisquer dois destes ou em todos eles. Vamos ler a tabela para ter uma ideia do que ela representa.

Do total da amostra de 100 casos, existem 25 que têm entre 3 e 4 questões. Destes 25, lendo do lado esquerdo, 5 pessoas (com entre 3 e 4 crianças) têm renda abaixo de Rs.200 / - e são empregadas em ocupações de colarinho branco.

Duas pessoas (com entre 3 e 4 filhos) têm renda abaixo de Rs.200 e são empregadas em ocupações de operários. Vamos agora pegar a segunda linha. Do total de entrevistados, 38 têm entre 1 e 2 filhos. 11 (na 7ª célula) que têm entre 1 e 2 filhos são do grupo de renda Rs.601 para Rs.800 e estão empregados na ocupação de colarinho branco.

Este exercício deve deixar bem claro que a tabulação cruzada é um passo essencial na descoberta ou teste de relações entre as variáveis contidas nos dados.

A tabulação é um meio de apresentar dados de forma resumida, de modo a facilitar os cálculos estatísticos necessários. Os dados podem, no entanto, ser apresentados de outras formas, ou seja, em vez de apresentá-los em uma forma tabular, o pesquisador pode apresentá-los na forma de diagramas ou gráficos. Tais representações diagramáticas ou gráficas têm o mérito de serem inteligíveis para um leitor menos conhecedor.

Mas eles sofrem com a limitação de não serem tão úteis como base para cálculos estatísticos. Vamos agora prosseguir para discutir a próxima operação, ou seja, a análise estatística dos dados. A tabulação é um pré-requisito ou um primeiro passo nessa direção.

Etapa # 4. Análise Estatística de Dados :

Na pesquisa, não estamos preocupados com cada respondente individual. O objetivo da pesquisa é mais amplo do que isso. Ou seja, desejamos saber muito mais do que simplesmente que um determinado entrevistado, por exemplo, tem uma atitude extremamente favorável em relação ao desarmamento e que outro entrevistado tem atitudes moderadamente desfavoráveis em relação ao mesmo assunto. Mas esta informação não é suficiente.

Pesquisas de ciências sociais são geralmente direcionadas para fornecer informações sobre uma determinada população de entrevistados principalmente por meio de uma amostra. A amostra da totalidade pode ser perguntada sobre certas questões relacionadas ao problema do nosso estudo, ou ser submetida a alguma forma de observação.

Vamos supor que pedimos a uma amostra de mil estudantes universitários que estudam em turmas de "pós-graduação" uma série de perguntas com o objetivo de obter informações sobre seus hábitos de estudo. Nossa pesquisa seria, portanto, direcionada para fornecer informações sobre a 'população' de alunos de pós-graduação dos quais os mil casos são uma amostra.

Como um passo necessário para caracterizar essa 'população', teríamos que descrever ou resumir as informações sobre os hábitos de estudo que obtivemos na sua amostra. A tabulação é apenas uma parte deste passo. Além disso, devemos estimar a confiabilidade das generalizações da 'população' a partir dos dados obtidos. Os métodos estatísticos são úteis no cumprimento de ambos os fins.