4 melhores características de um bom teste

Este artigo lança luz sobre as quatro características importantes de um bom teste. As quatro características são: 1. Confiabilidade 2. Validade 3. Objetividade 4. Usabilidade.

Característica # 1. Confiabilidade:

O significado do dicionário de confiabilidade é consistência, dependência ou confiança. Assim, na confiabilidade da medição, a consistência com a qual um teste produz o mesmo resultado é medir o que ele mede. Uma pontuação no teste é considerada confiável quando temos razão para acreditar que a pontuação é estável e digna de confiança. A estabilidade e a confiabilidade dependem do grau em que a pontuação é um índice de confiabilidade do tempo "está livre de erros aleatórios". Portanto, a confiabilidade pode ser definida como o grau de consistência entre duas medidas da mesma coisa.

Por exemplo, administramos um teste de aproveitamento no Grupo-A e encontramos um escore médio de 55. Novamente, após 3 dias, aplicamos o mesmo teste no Grupo A e encontramos um escore médio de 55. Isso indica que o instrumento de medição (teste de desempenho) está fornecendo um resultado estável ou confiável. Por outro lado, se na segunda medição o teste fornecer uma pontuação média em torno de 77, então podemos dizer que as pontuações dos testes não são consistentes.

Nas palavras de Gronlund e Linn (1995), “confiabilidade refere-se à consistência da mensuração - isto é, quão consistentes os resultados dos testes ou outros resultados de avaliação são de uma medida para outra”.

CV Good (1973) definiu confiabilidade como a “dignidade com que um dispositivo de medição mede alguma coisa; o grau em que um teste ou outro instrumento de avaliação mede consistentemente o que ele realmente mede ”.

De acordo com Ebel e Frisbie (1991), “o termo confiabilidade significa a consistência com que um conjunto de notas de teste mede tudo o que elas medem”.

Teoricamente, a confiabilidade é definida como a razão entre o escore verdadeiro e a variação do escore observado.

De acordo com Davis (1946), “o grau de precisões relativas de medição de um conjunto de escores de teste é definido como confiabilidade”.

Assim, a confiabilidade responde às seguintes questões:

Gronlund e Linn (1995)

Quão parecidos são os resultados dos testes se a perda é administrada duas vezes?

Qual a similaridade das pontuações nos testes se duas formas equivalentes de testes são administradas?

Até que ponto as pontuações de qualquer ensaio ensaio. Diferencia quando é pontuada por professores diferentes?

Nem sempre é possível obter resultados perfeitamente consistentes. Porque existem vários fatores como saúde física, memória, adivinhação, fadiga, esquecimento, etc., que podem afetar os resultados de uma medição para outra. Essas variáveis ​​estranhas podem introduzir algum erro nos resultados dos nossos testes. Este erro é chamado como erros de medição. Portanto, ao determinar a confiabilidade de um teste, devemos levar em consideração a quantidade de erro presente na medição.

Natureza da Confiabilidade:

1. Confiabilidade refere-se à consistência dos resultados obtidos com um instrumento, mas não ao próprio instrumento

2. Confiabilidade refere-se a uma interpretação particular dos resultados dos testes. Por exemplo, uma pontuação de teste que é confiável durante um período de tempo pode não ser confiável de um teste para outro teste equivalente. Assim, a confiabilidade não pode ser tratada como características gerais.

3. A confiabilidade é um conceito estatístico para determinar a confiabilidade em que administramos um teste a um grupo uma ou mais de uma vez. Então, a consistência é determinada em termos de mudanças na posição relativa de uma pessoa no grupo ou na quantidade de variação esperada na pontuação de um indivíduo. O deslocamento da posição relativa de um indivíduo está relacionado por meio de um coeficiente de correlação denominado "Coeficiente de Confiabilidade" e a quantidade de variação é informada por "Erro padrão de medição". Ambos os processos são estatísticos.

4. A confiabilidade é necessária, mas não é condição suficiente para a validade. Um teste que não é confiável não pode ser válido. Mas não é que um teste com alta confiabilidade possua alta validade. Porque um teste altamente consistente pode medir algo diferente daquele que pretendemos medir.

Métodos para Determinar Confiabilidade:

Para a maioria dos testes educacionais, o coeficiente de confiabilidade fornece o índice estatístico de qualidade mais revelador que está normalmente disponível. As estimativas da confiabilidade do teste fornecem informações essenciais para julgar sua qualidade técnica e motivar esforços para melhorá-las. A consistência de uma pontuação de teste é expressa em termos de mudanças na posição relativa de um indivíduo no grupo ou em termos de quantidade de variação na pontuação de um indivíduo.

Com base nessa estimativa de confiabilidade, encontramos duas classificações gerais:

(Eu) Confiabilidade Relativa ou Coeficiente de Confiabilidade:

Nesse método, a confiabilidade é declarada em termos de um coeficiente de correlação conhecido como coeficiente de confiabilidade. Assim, determinamos o deslocamento da posição relativa da pontuação de um indivíduo pelo coeficiente de correlação.

(ii) Confiabilidade Absoluta ou Erro Padrão de Medição:

Neste método, a confiabilidade é declarada em termos do erro padrão de medição. Indica a quantidade de variação da pontuação de um indivíduo.

Métodos para Determinar Confiabilidade Relativa ou Coeficiente de Confiabilidade:

Para determinar o coeficiente de confiabilidade, temos que obter dois conjuntos de medições em condições idênticas e comparar os dois conjuntos. Mas é apenas uma condição teórica, porque é impossível da nossa parte obter duas medições em exatamente duas condições idênticas. Assim, vários métodos foram desenvolvidos para determinar a confiabilidade relativa.

Eles são os seguintes (Gronlund e Linn - 1995):

(i) A mesma forma de teste pode ser administrada duas vezes ao mesmo grupo de indivíduos.

ii) Duas formas separadas mas equivalentes do teste podem ser administradas aos mesmos indivíduos.

(iii) Os itens de teste de um único teste são divididos em dois conjuntos separados e as pontuações de dois conjuntos são correlacionadas.

Os métodos são semelhantes, pois todos envolvem a correlação de dois conjuntos de dados, obtidos a partir do mesmo instrumento de avaliação ou de formas equivalentes do mesmo procedimento. Esse coeficiente de confiabilidade deve ser interpretado em termos dos tipos de consistência que estão sendo investigados.

Diferentes tipos de consistência são determinados por diferentes métodos. Estes são os seguintes:

1. Consistência durante um período de tempo.

2. Consistência sobre diferentes formas de instrumento.

3. Consistência no próprio instrumento

Existem quatro métodos para determinar o coeficiente de confiabilidade, como:

(a) Método Teste-Reteste.

(b) Método das formas equivalentes / formas paralelas.

c) Método da divisão parcial.

d) Equivalência Racional / Método de Kuder-Richardson.

(a) Método Teste-Reteste:

Esse é o método mais simples de determinar a confiabilidade do teste. Para determinar a confiabilidade neste método, o teste é dado e repetido no mesmo grupo. Em seguida, é obtida a correlação entre o primeiro conjunto de pontuações e o segundo conjunto de pontuações.

Um alto coeficiente de correlação indica alta estabilidade dos resultados dos testes. Nas palavras de Gronlund, Medidas de estabilidade nas .80 e .90 são comumente relatadas para testes padronizados em ocasiões dentro do mesmo ano. Mas este método sofre de alguns inconvenientes sérios. Primeiro de tudo, qual deve ser o intervalo entre duas administrações.

Se for administrado dentro de um curto intervalo, digamos um ou dois dias, o aluno recordará as primeiras respostas e gastará seu tempo em material novo. Ele tenderá a aumentar sua pontuação nas segundas administrações. Se o intervalo for muito longo, digamos um ano, o efeito de maturação afetará os escores do reteste e tenderá a aumentar os escores do reteste.

Em ambos os casos, tenderá a diminuir a confiabilidade. Então, qual deve ser o intervalo de tempo entre duas administrações depende em grande parte do uso e interpretação dos resultados dos testes. Devido às dificuldades em controlar as condições que influenciam os escores de reteste, reduz o uso do método de teste-reteste na estimativa do coeficiente de confiabilidade.

(b) Método de Formulários Equivalentes / Formulários Paralelos:

A confiabilidade dos resultados dos testes pode ser estimada pelo método de formas equivalentes. Também é conhecido como formas alternativas ou método de formas paralelas. Quando duas formas equivalentes de testes podem ser construídas, a correlação entre as duas pode ser tomada como uma medida da autocorrelação do teste. Neste processo, duas formas paralelas de testes são administradas ao mesmo grupo de alunos em um curto intervalo de tempo, então as pontuações de ambos os testes são correlacionadas. Essa correlação fornece o índice de equivalência. Geralmente, no caso de testes psicológicos e de desempenho padronizados, as formas equivalentes estão disponíveis.

Ambos os testes selecionados para administração devem ser paralelos em termos de conteúdo, dificuldade, formato e comprimento. Quando o intervalo de tempo entre as administrações de duas formas de testes é fornecido, o coeficiente de pontuação do teste fornece uma medida de confiabilidade e equivalência. Mas a principal desvantagem desse método é obter duas formas paralelas de testes. Quando os testes não são exatamente iguais em termos de conteúdo, a dificuldade, a duração e a comparação entre as pontuações obtidas desses testes podem levar a decisões erradas.

c) Método Split-Half:

Existem também métodos pelos quais a confiabilidade pode ser determinada por uma única administração de um único teste. Um de tal método é o método de meio-meio. Neste método, um teste é administrado a um grupo de alunos da maneira usual. Em seguida, o teste é dividido em dois valores equivalentes e a correlação para esses meios-testes é encontrada.

O procedimento comum de dividir o teste é pegar todos os itens ímpares, isto é, 1, 3, 5, etc. em uma metade e todos os itens pares, ie 2, 4, 6, 8 etc. na outra metade. as metades são correlacionadas usando a fórmula de Spearman-Brown.

Por exemplo, correlacionando ambas as metades, encontramos um coeficiente de 0, 70.

Usando a fórmula (5.1), podemos obter o coeficiente de confiabilidade no teste completo como:

O coeficiente de confiabilidade 0, 82 quando o coeficiente de correlação entre o meio teste é 0, 70. Indica em que medida a amostra de itens de teste é uma amostra confiável do conteúdo que está sendo medido - consistência interna.

Gronlund (1995) é da opinião de que “as fidedignas de metade dividida tendem a ser mais altas do que o fidedigno de forma equivalente porque o método da metade dividida é baseado na administração de um único formulário de teste.” Esse método supera o problema do método de formas equivalentes introduzido devido a diferenças de forma para forma, atenção, velocidade de trabalho, esforço, fadiga e conteúdo de teste, etc.

(d) Método Racional Equivalente / Kuder Richardson:

A equivalência racional é outro método de determinar a confiabilidade usando a fórmula desenvolvida por Kuder e Richardson. Como o método da metade-metade, este método também fornece uma medida de consistência interna. Não requer a administração de duas formas equivalentes de testes, nem exige dividir os testes em duas metades iguais. O coeficiente de confiabilidade é determinado usando a fórmula Kuder-Richardson-20, que se lê assim.

Esse método fornece informações sobre o grau em que os itens no teste medem características semelhantes. Embora a simplicidade de aplicar este método o tenha ampliado, ele ainda tem algumas limitações.

1. O método de Kuder-Richardson e o método da metade dividida não são apropriados para testes de velocidade.

2. Tanto Kuder-Richardson como o método da metade dividida não medem a consistência da resposta da pupila no dia a dia.

3. O método de Kuder-Richardson é complicado de calcular a menos que a informação já esteja disponível sobre a proporção de passagem.

Métodos para Determinar Confiabilidade Absoluta ou Erros Padrão de Medição:

Se administrarmos um teste repetidas vezes, encontraremos alguma variação nas pontuações. Porque o escore obtido é um índice do escore verdadeiro do examinando mais: erros de mensuração. HE Garrett (1985) definiu um escore verdadeiro como “uma medida que seria obtida tomando a média de um número infinito de medidas de um determinado indivíduo em testes similares sob condições similares. Uma pontuação verdadeira não pode, é claro, ser determinada experimentalmente ” .

Se os resultados dos testes incluírem um grande componente de erro, sua confiabilidade é baixa e, se incluir um pouco de erros, sua confiabilidade é alta. Assim, a medida em que um escore verdadeiro excede, o erro nos escores obtidos pode ser indicado pelo coeficiente de confiabilidade.

Essa relação entre o escore verdadeiro, os escores obtidos e o erro pode ser expressa matematicamente da seguinte maneira:

Podemos descobrir o erro padrão de medição (SE) quando o coeficiente de confiabilidade e o desvio padrão da distribuição são fornecidos.

A fórmula (Garrett — 1985) para calcular o erro padrão de medição é a seguinte:

Por exemplo, em um grupo de 200 estudantes do ensino médio, o coeficiente de confiabilidade de um teste de aproveitamento em matemática é 0, 70, média = 65 e o = 20. Lipu atinge uma pontuação de 60. Qual é o SE dessa pontuação.

Colocando o valor na fórmula (5.3):

Assim, a pontuação verdadeira de Lipu é de 60 ± 10, 95, ou seja, 70, 50 a 49, 05.

Nenhuma pontuação obtida nos diz qual é a pontuação verdadeira, mas o conhecimento da SE indica a diferença entre a pontuação obtida e a pontuação verdadeira. Quando o SE é pequeno, indica que o escore verdadeiro está mais próximo do escore obtido e também indica se a diferença entre escores de dois indivíduos é diferença ou diferença real devido a erros de mensuração.

Fatores que afetam a confiabilidade:

Há vários fatores que afetam as medidas de confiabilidade. Assim, quando interpretamos e usamos as pontuações, devemos ser cautelosos e manipular esses fatores através da preparação e administração do teste.

Os principais fatores que afetam a confiabilidade do teste, os escores podem ser categorizados em três títulos:

1. Fatores relacionados ao teste.

2. Fatores relacionados ao testado.

3. Fatores relacionados ao procedimento de teste.

1. Fatores relacionados ao teste:

(a) Comprimento do teste:

A fórmula de Spearman Brown indica que quanto maior o teste, maior será a confiabilidade. Porque um teste mais longo fornecerá uma amostra adequada do comportamento. Outra causa é que o fator de adivinhação pode ser neutralizado em um teste mais longo.

Por exemplo, se vamos dar um cálculo para medir a capacidade numérica dos alunos. Aqueles que computaram corretamente são perfeitos em habilidades numéricas. Aqueles que falharam são falhas completas. Se o cálculo for difícil, a maioria dos alunos falhará. Se for fácil, a maioria dos alunos irá computá-lo corretamente. Então, essa pontuação de item único nunca dá um resultado confiável.

b) Conteúdo do teste:

De acordo com Guilford, a homogeneidade do conteúdo do teste também aumenta a confiabilidade dos resultados dos testes. Um teste de 50 itens sobre a Civilização Védica fornecerá pontuações mais confiáveis ​​do que um teste de 50 itens sobre a história da Índia. Segundo Ebel (1991), “o assunto em alguns cursos, como matemática e língua estrangeira, é mais organizado, com maior interdependência de fatos, princípios, habilidades e realizações do que na literatura ou na história do assunto”. também é um fator que resulta em alta confiabilidade.

c) Características dos itens:

O nível de dificuldade e a clareza de expressão de um item de teste também afetam a confiabilidade dos resultados dos testes. Se os itens de teste forem muito fáceis ou difíceis para os membros do grupo, tenderão a produzir escores de baixa confiabilidade. Porque ambos os testes têm uma distribuição restrita de pontuações.

(d) Propagação de pontuações:

De acordo com Gronlund e Minn (1995) “outras coisas sendo iguais, maior a propagação das pontuações é quanto maior a estimativa de confiabilidade será.” Quando a propagação das pontuações é grande, há maior chance de um indivíduo permanecer na mesma posição relativa em um grupo de um teste para outro. Podemos dizer que os erros de medição afetam menos a posição relativa do indivíduo quando a disseminação das pontuações é grande.

Por exemplo, no Grupo A, os alunos têm notas seguras de 30 a 80 e no Grupo B têm notas seguras que variam de 65 a 75. Se administrarmos os testes pela segunda vez no Grupo A, os resultados dos testes podem variar em vários pontos. com muito pouca mudança na posição relativa dos membros do grupo. É porque a propagação de pontuações no Grupo A é grande.

Por outro lado, as pontuações no Grupo B são mais propensas a mudar de posição em uma segunda administração do teste. Como a disseminação das pontuações é de apenas 10 pontos, da pontuação mais alta para a pontuação mais baixa, a mudança de poucos pontos pode trazer mudanças radicais na posição relativa dos indivíduos. Assim, quanto maior a propagação, maior é a confiabilidade.

2. Fatores relacionados ao testado:

Variabilidade na realização, facilidade de teste dos indivíduos e motivação dos alunos também influenciam a confiabilidade dos resultados dos testes.

A seguir estão alguns dos fatores importantes com o testado que afetam a confiabilidade do teste:

(a) Heterogeneidade do grupo:

Quando o grupo é homogêneo, é provável que a dispersão dos resultados dos testes seja menor e, quando o grupo testado for heterogêneo, a disseminação de pontuações provavelmente será maior. Portanto, o coeficiente de confiabilidade para um grupo heterogêneo será mais do que um grupo homogêneo.

(b) Teste de sabedoria dos estudantes:

A experiência de realização de testes também afeta a confiabilidade dos resultados dos testes. A prática dos alunos em fazer testes sofisticados aumenta a confiabilidade do teste. Mas, quando em um grupo, todos os alunos não têm o mesmo nível de capacidade de teste, isso leva a maiores erros de medição.

c) Motivação dos estudantes:

Quando os alunos não estão motivados para fazer o teste, eles não representam sua melhor realização. Isso deprime as pontuações do teste.

3. Fatores relacionados ao procedimento de teste:

Como os fatores relacionados ao teste e os fatores relacionados ao testado afetam a confiabilidade dos resultados dos testes, também os fatores relacionados ao procedimento de teste também afetam os resultados do teste. Se os usuários de teste puderem controlar esses fatores, eles poderão aumentar a consistência das pontuações dos testes.

(a) Prazo de teste:

De acordo com Ebel e Frisbie (1991), “pontuações de um teste dado sob condições altamente rápidas normalmente mostram um coeficiente de confiabilidade de consistência interna maior do que seria obtido para pontuações do mesmo teste dado ao mesmo grupo sob limites de tempo mais generosos”. quando os alunos têm mais tempo para fazer o teste, podem fazer mais adivinhações, o que pode aumentar os resultados dos testes. Portanto, acelerando um teste, podemos aumentar a confiabilidade do teste.

(b) Batalha oportunidade dada aos alunos:

A trapaça dos alunos durante a administração do teste leva a erros de medição. Alguns alunos podem fornecer respostas corretas copiando-as de folhas de dicas ou ouvindo de outros alunos sem saber a resposta correta. Isso causará uma pontuação maior desses alunos do que eles realmente merecem. Isso fará com que a pontuação observada de trapaceiros seja maior do que a pontuação verdadeira.

Qual deve ser a maior confiabilidade?

Obviamente, os dispositivos de avaliação nunca são perfeitamente confiáveis. O quão pouco confiável um teste pode ser e ainda é útil depende principalmente da finura de discriminação desejada dos resultados dos testes. (Rem-mers. 1967) O grau de coeficiente de confiabilidade depende da natureza do teste, do tamanho e da variabilidade do grupo, do propósito para o qual o teste foi administrado e do método usado para estimar a confiabilidade. Um teste com baixa confiabilidade pode ter maior validade e, portanto, pode ser usado. Mas, nas palavras de Remmers (1967), o teste mais padronizado publicado para uso escolar tem coeficientes de confiabilidade de pelo menos 0, 80 na população para a qual foram projetados.

Quando se escolhe um teste padronizado para interpretar seus resultados, não basta apenas olhar para o valor numérico da estimativa de confiabilidade, também é preciso levar em conta como essa estimativa foi obtida. Gronlund (1976) observou sobre a importância dos métodos de estimar a confiabilidade.

Segundo ele, “o método da metade dividida dá os maiores valores numéricos ao coeficiente de confiabilidade. O método de formas equivalentes e o teste de reteste tendem a fornecer menor valor numérico ao coeficiente de confiabilidade. Normalmente, esses dois métodos fornecem coeficiente médio a grande de confiabilidade. O método de formas equivalentes normalmente fornece o menor coeficiente de confiabilidade para um determinado teste. ”

Portanto, pode-se dizer que o professor deve buscar um teste padronizado cuja confiabilidade seja a mais alta possível. Mas ele deve interpretar esse coeficiente de confiabilidade à luz dos grupos de alunos nos quais se baseia, a variabilidade desse grupo e os métodos de estimar a confiabilidade.

Característica # 2. Validade:

“Na seleção ou construção de um instrumento de avaliação, a questão mais importante é; Até que ponto os resultados servirão aos usos específicos a que se destinam? Essa é a essência da validade. ” —GRONLUND

A validade é a característica mais importante de um programa de avaliação, pois, a menos que um teste seja válido, ele não serve para nenhuma função útil. Psicólogos, educadores, conselheiros de orientação usam os resultados dos testes para uma variedade de propósitos. Obviamente, nenhuma finalidade pode ser cumprida, mesmo que parcialmente, se os testes não tiverem um grau de validade suficientemente alto. Validade significa verdade-plenitude de um teste. Isso significa até que ponto o teste mede isso, o que o testador pretende medir.

Inclui dois aspectos:

O que é medido e quão consistentemente é medido. Não é uma característica de teste, mas se refere ao significado das pontuações dos testes e às maneiras como usamos as pontuações para tomar decisões. As definições dadas pelos especialistas darão uma imagem clara da validade.

Gronlund e Linn (1995) - "Validade refere-se à adequação da interpretação feita a partir dos resultados dos testes e outros resultados da avaliação em relação a um uso particular."

Ebel e Frisbie (1991) - “O termo validade, quando aplicado a um conjunto de pontuações de testes, refere-se à consistência (precisão) com a qual as pontuações medem uma habilidade cognitiva particular de interesse.”

CV Good (1973) - No dicionário de educação define validade como a “medida em que um teste ou outro instrumento de medição cumpre o propósito para o qual é usado”.

Anne Anastasi (1969) escreve que “a validade de um teste diz respeito ao que o teste mede e quão bem ele o faz”.

De acordo com Davis (1964), validade é a extensão na qual a ordem de classificação dos escores dos examinandos para os quais um teste é apropriado é a mesma que a ordem de classificação dos mesmos examinados na propriedade ou característica que o teste está sendo usado para medir . Essa propriedade ou característica é chamada de critério. Como qualquer teste pode ser usado para muitos propósitos diferentes, segue-se que ele pode ter muitas validações, uma correspondendo a cada critério ”.

Freeman (1962) define, “um índice de validade mostra o grau em que um teste mede o que ele pretende medir, quando comparado com os critérios aceitos”.

Lindquist (1942) disse que “a validade de um teste pode ser definida como a precisão com a qual ele mede aquilo que pretende medir, ou como o grau em que se aproxima da infalibilidade ao medir o que se propõe a medir”.

Das definições acima, fica claro que a validade de um dispositivo de avaliação é o grau em que ele mede o que se pretende medir. A validade está sempre preocupada com o uso específico dos resultados e a solidez da nossa interpretação proposta.

Também não é necessário que um teste que seja confiável também possa ser válido. Por exemplo, suponha que um relógio esteja adiantado dez minutos. Se o relógio é um bom momento, o tempo que ele nos diz será confiável. Porque dá um resultado constante. Mas não será válido como julgado por 'Standard time'. Isso indica "o conceito de que a confiabilidade é uma condição necessária, mas não suficiente, para validade".

Natureza da Validade:

1. Validade refere-se à adequação dos resultados do teste, mas não ao próprio instrumento.

2. A validade não existe em uma base de tudo ou nada, mas é uma questão de grau.

3. Os testes não são válidos para todos os propósitos. A validade é sempre específica para uma interpretação particular. Por exemplo, os resultados de um teste de vocabulário podem ser altamente válidos para testar o vocabulário, mas podem não ser tão válidos para testar a capacidade de composição do aluno.

4. A validade não é de tipos diferentes. É um conceito unitário. Baseia-se em vários tipos de evidências.

Fatores que afetam a validade:

Assim como a confiabilidade, existem vários fatores que afetam a validade dos resultados dos testes. Existem alguns fatores sobre os quais estamos alertas e podemos evitar facilmente. Mas há alguns fatores sobre os quais somos ignorantes e torna os resultados do teste inválidos, para o uso pretendido.

Alguns desses fatores são os seguintes:

1. Fatores no teste:

(i) instruções pouco claras para os alunos responderem ao teste.

(ii) Dificuldade do vocabulário de leitura e estrutura das frases.

(iii) Itens de teste muito fáceis ou muito difíceis.

(iv) Declarações ambíguas nos itens de teste.

(v) Itens de teste inadequados para medir um determinado resultado.

vi) Tempo inadequado para fazer o teste.

(vii) O comprimento do teste é muito curto.

(viii) Itens de teste não organizados em ordem de dificuldade.

(ix) Padrão identificável de respostas.

Fatores em Administração de Teste e Pontuação:

(i) Ajuda injusta a estudantes individuais, que pedem ajuda,

(ii) Engano pelos alunos durante o teste.

(iii) Pontuação não confiável de respostas do tipo ensaio.

(iv) Tempo insuficiente para concluir o teste.

(v) Condições físicas e psicológicas adversas no momento do teste.

Fatores relacionados ao Testee:

(i) Testar a ansiedade dos alunos.

(ii) estado físico e psicológico do aluno,

(iii) Conjunto de respostas - uma tendência consistente para seguir um certo padrão ao responder os itens.

Característica # 3. Objetividade:

A objetividade é uma característica importante de um bom teste. Afeta tanto a validade quanto a confiabilidade dos resultados dos testes. A objetividade de um instrumento de medição demonstra o grau em que pessoas diferentes pontuando o recibo de resposta chegam ao mesmo resultado. CV Good (1973) define objetividade no teste é “a medida em que o instrumento está livre de erros pessoais (parcialidade pessoal), isto é, subjetividade por parte do apontador”.

Gronlund e Linn (1995) afirmam que “A objetividade de um teste se refere ao grau em que escores igualmente competentes obtêm os mesmos resultados. Portanto, um teste é considerado objetivo quando se trata de eliminar a opinião pessoal e o julgamento de viés do apontador. Nesse contexto, há dois aspectos da objetividade que devem ser mantidos em mente durante a construção de um teste ”.

(i) Objetividade na pontuação.

(ii) Objetividade na interpretação dos itens do teste pelo testado.

(i) Objetividade da pontuação:

A objetividade da pontuação significa que a mesma pessoa ou pessoas diferentes que pontuam o teste a qualquer momento chega ao mesmo resultado sem que ocorra um erro aleatório. Um teste para ser objetivo deve necessariamente ser redigido de modo que apenas uma resposta correta possa ser dada a ele. Em outras palavras, o julgamento pessoal do indivíduo que pontua o roteiro de resposta não deve ser um fator que afeta os resultados do teste. Para que o resultado de um teste possa ser obtido de maneira simples e precisa, se o procedimento de pontuação for objetivo. O procedimento de pontuação deve ser tal que não haja dúvidas sobre se um item é certo ou errado ou parcialmente correto ou parcialmente errado.

(ii) Objetividade dos Itens de Teste:

Por objetividade de item, queremos dizer que o item deve exigir uma resposta única e definitiva. Itens de teste bem construídos devem levar-se a uma e apenas uma interpretação pelos alunos que conhecem o material envolvido. Isso significa que os itens de teste devem estar livres de ambiguidade. Um determinado item de teste deve significar a mesma coisa para todos os alunos que o testador pretende perguntar. Frases duplas de significado, itens com mais de uma resposta correta não devem ser incluídos no teste, pois tornam o teste subjetivo.

Característica # 4. Usabilidade:

Usabilidade é outra característica importante dos instrumentos de medição. Porque considerações práticas dos instrumentos de avaliação não podem ser negligenciadas. O teste deve ter valor prático do ponto de vista do tempo, economia e administração. Isso pode ser denominado como usabilidade.

Portanto, ao construir ou selecionar um teste, os seguintes aspectos práticos devem ser levados em consideração:

(i) Facilidade de Administração:

Isso significa que o teste deve ser fácil de administrar para que os professores gerais possam usá-lo. Portanto, instruções simples e claras devem ser dadas. O teste deve possuir poucos subtestes. O tempo do teste não deve ser muito difícil.

(ii) Tempo requerido para administração:

Prazo apropriado para fazer o teste deve ser fornecido. Se, a fim de fornecer tempo suficiente para fazer o teste, tornaremos o teste mais curto do que a confiabilidade do teste será reduzida. Gronlund e Linn (1995) são da opinião que "Em algum lugar entre 20 e 60 minutos de tempo de teste para cada pontuação individual produzida por um teste publicado é provavelmente um bom guia".

(iii) Facilidade de Interpretação e Aplicação:

Outro aspecto importante dos resultados dos testes é a interpretação dos resultados dos testes e a aplicação dos resultados dos testes. Se os resultados forem mal interpretados, é prejudicial, por outro lado, se não for aplicado, então é inútil.

(iv) Disponibilidade de Formulários Equivalentes:

Testes de formulários equivalentes ajudam a verificar as pontuações dos testes questionáveis. Também ajuda a eliminar o fator de memória enquanto testa novamente os alunos no mesmo domínio de aprendizagem. Portanto, formas equivalentes do mesmo teste em termos de conteúdo, nível de dificuldade e outras características devem estar disponíveis.

v) Custo do teste:

Um teste deve ser econômico do ponto de vista de preparação, administração e pontuação.