Métodos utilizados para avaliar o desempenho do trabalho

O psicólogo industrial tem uma escolha de métodos para estabelecer um procedimento para avaliar o desempenho do trabalho envolvendo julgamentos por parte dos indivíduos. Esses métodos podem ser agrupados em classes, dependendo do tipo de comparação exigida do indivíduo que faz a avaliação. Os três mais utilizados são sistemas de classificação, sistemas de classificação e comparações pareadas.

1. Sistemas de Classificação:

A mecânica de qualquer sistema de escala de classificação é bastante simples. A tarefa do juiz é fazer um julgamento sobre o grau em que o indivíduo possui, ou é descrito por, uma característica particular. Embora possa assumir muitas formas diferentes, sua única característica distintiva é que o juiz pode dar a dois indivíduos a mesma pontuação, uma característica que não é encontrada nos outros dois métodos.

Escalas Numéricas de Classificação:

Esta forma é provavelmente o tipo mais popular e comum de escala de classificação. Tais escalas são freqüentemente chamadas de "escalas gráficas".

Um exemplo é dado abaixo:

A tarefa do juiz é dar a cada trabalhador uma pontuação de 1 a 9 que melhor descreva seu “grau de confiabilidade”. A pontuação do critério para um trabalhador é geralmente a pontuação média de todos os juízes. Na situação em que uma série de diferentes questões compõem o critério (por exemplo, grau de confiabilidade, nível geral de conhecimento do trabalho, relações com outros trabalhadores etc.), o problema se torna mais complicado. Muitas vezes, o critério total usado é simplesmente a pontuação total de todas as perguntas.

No entanto, quando várias perguntas são usadas para avaliar os trabalhadores, uma delas deve enfrentar imediatamente o problema composto versus critério múltiplo. Uma abordagem que se torna mais popular em tais situações é fatorar a análise das questões para determinar as dimensões de critério independentes subjacentes e, em seguida, atribuir “pontuações de fatores” em cada uma dessas dimensões que são usadas como critérios.

Escalas Padrão:

Outro tipo de escala de classificação envolve o uso de um conjunto de padrões ou exemplos para fins de comparação. Estes são usados no lugar de, ou junto com, os pontos de ancoragem verbais encontrados na escala gráfica.

Uma escala padrão projetada para avaliar a confiabilidade pode ser assim:

O avaliador pode então comparar o homem que ele está avaliando com homens no trabalho que são designados como pontos de referência de escala. Este método também é conhecido como escala de comparação homem-a-homem. A maior dificuldade com escalas padrão existe em encontrar padrões apropriados. Isso geralmente requer um pré-dimensionamento cuidadoso de um grupo de funcionários atuais. Há também o problema muito delicado de usar os nomes desses homens sem qualquer embaraço. Assim, é preciso ter muito cuidado para que a escala padrão não seja divulgada publicamente. Outra dificuldade é que os intervalos entre os homens na escala geralmente não são de igual magnitude.

A vantagem do método é bastante clara. Enquanto um grupo de juízes puder concordar com as qualificações de um pequeno grupo de trabalhadores que são bem conhecidos de todos os juízes, uma escala de comparação pronta é fornecida, a qual assegura que todos os juízes terão um referente comum na classificação do restante. os homens.

Escala de Pontos Cumulados (Check List):

Muitas escalas de classificação exigem que o juiz marque ou indique quais de várias declarações, adjetivos ou atributos são descritivos da pessoa que está sendo avaliada. Por exemplo, o formulário de classificação mostrado na Figura 7.3 é representativo de uma lista de verificação de adjetivos.

Cada pessoa recebe uma pontuação total com base nos itens específicos verificados. No exemplo mostrado, uma pessoa pode receber um + 1 para cada adjetivo favorável e um - 1 para cada adjetivo desfavorável. Em listas de verificação mais elaboradas, os diferentes itens podem receber pesos diferenciados. Por exemplo, Uhrbrock (1961) escalou 2000 declarações relativas ao comportamento do trabalhador.

Cada afirmação recebeu um valor médio de escala de sua percepção de favorabilidade ao descrever um trabalhador. As declarações podem ser selecionadas para uso em uma lista de verificação, que por sua vez é usada pelos supervisores para classificar seus funcionários. O método de pontuação pode basear-se na pontuação total (soma algébrica) para os itens marcados ou, talvez, no valor médio da escala (média) de todos os itens marcados. Alguns exemplos de declarações da Uhrbrock, juntamente com seus valores de escala, são mostrados na Tabela 7.3.

Lista de verificação de incidentes críticos:

A técnica do incidente crítico é um procedimento desenvolvido por Flanagan (1954). Como normalmente usado, pode ser melhor descrito como um procedimento de classificação de lista de verificação. No entanto, também é suficientemente diferente em seu desenvolvimento que mereça menção separada.

O método envolve três etapas distintas:

1. Coleta de incidentes críticos

2. Escalando os incidentes

3. Construindo a escala da lista de verificação

O primeiro passo é o que torna esse método único. O termo incidente crítico refere-se a todos os comportamentos no trabalho de pessoas que o supervisor consideraria “dignos de nota”. Digno de nota, por sua vez, pode se referir a casos de “bom” ou “ruim” comportamento de trabalho. Cada supervisor, em outras palavras, é solicitado a fornecer o maior número de instâncias de comportamento de trabalho real que ele possa lembrar. Esses incidentes de trabalho são então apresentados (etapa dois) a um grupo de especialistas que atribui valores de escala quanto ao grau de conveniência desse incidente.

Na terceira etapa, é elaborada uma lista de verificação que inclui apenas as declarações ou incidentes considerados relevantes para a definição de trabalhadores “bons” e “pobres”. Essas listas de verificação podem ser usadas por um supervisor para avaliar seus funcionários. Ao classificar um trabalhador, ele simplesmente coloca uma marca de seleção ao lado de cada incidente que ele observou que o trabalhador “compromete” ou exibe. A pontuação de um trabalhador é geralmente tomada como o valor médio ou médio da escala de todos os incidentes verificados para ele (a pontuação total também pode ser usada).

A lista de verificação de incidentes críticos tem a grande vantagem de basear-se em comportamentos ou incidentes de trabalho reais. Um supervisor não é colocado na posição de ser forçado a julgar traços ou para classificar seus trabalhadores, etc. Ele só tem que responder em termos de ter observado ou não um incidente em particular por parte de cada trabalhador. Kirchner e Dunnette (1957) relataram resultados favoráveis em um estudo seguindo um pouco o procedimento descrito acima.

Antes de deixar o método de incidente crítico, deve-se salientar que ele tem mais generalidade e aplicação do que simplesmente ser uma fonte para itens da lista de verificação de avaliação de desempenho. Incidentes de comportamento baseados no trabalho têm sido usados com muito sucesso em pesquisas nas áreas de liderança (Fleishman, 1955), valores organizacionais (Shartle, Brumback e Rizzo, 1964) e criatividade (Buel, 1960).

2. Sistemas de Classificação:

Uma característica de um sistema de classificação é que ele permite que dois ou mais indivíduos tenham a mesma classificação ou valor de escala. Um sistema de classificação por sua natureza desencoraja isso. A classificação simples exige que o juiz ordene os indivíduos do maior para o menor.

Assim, um grupo específico de supervisores pode classificar dez funcionários como mostrado abaixo:

Os sistemas de classificação têm a vantagem inerente de serem extremamente simples de explicar e geralmente são facilmente aceitos pelas pessoas designadas como juízes. O procedimento “faz sentido” para eles. Também tem a vantagem de permitir que um avaliador classifique um número razoavelmente grande de indivíduos sem grande dificuldade. Uma regra geral reconhece que resultados satisfatórios e confiáveis com um sistema de classificação podem ser alcançados com Ns tão grandes quanto 50 a 60.

Guilford (1954) apontou outra vantagem do ranking. Uma vez que o juiz é forçado a fazer comparações de homem para homem, em vez de comparações absolutas, ele deve comparar indivíduos ao decidir colocar um sobre o outro.

O método força o juiz a discriminar entre os indivíduos que estão sendo classificados independentemente de se sentirem realmente diferentes! Suponha que os dez homens dados em nosso exemplo anterior fossem bem iguais em suas habilidades. Os juízes provavelmente teriam um tempo extremamente difícil tentando ordenar os homens, e a classificação de um juiz seria altamente ilusória quanto aos méritos relativos dos dez homens em questão.

Uma maneira de verificar essa possibilidade, é claro, é usar vários juízes. Se os juízes concordarem em termos de seus rankings, a possibilidade de não haver diferenças “reais” ou verdadeiras entre os homens pode ser descartada. No exemplo anterior, os juízes parecem ser razoavelmente consistentes em julgar quem é bom e quem é um trabalhador pobre. Assim, suas escolhas devem ser baseadas em algumas razões reais e não aleatórias para ordenar os homens em questão. Esta é uma excelente razão para usar múltiplos juízes sempre que possível e para calcular a concordância entre juízes com algum índice, como um coeficiente de correlação.

3. Comparações emparelhadas:

Embora os sistemas de ordem de classificação impliquem implicitamente que um homem seja comparado a outros na lista durante o processo de classificação, isso não é sistematicamente incorporado ao método. Um procedimento que força sistematicamente o avaliador a comparar cada homem com todos os outros homens é conhecido como o método de comparação emparelhada. Por exemplo, considere a situação em que quatro funcionários estão sendo avaliados por um supervisor. Se formarmos todos os possíveis pares de homens, teremos N (N-l) / 2 tais pares formados; no nosso caso, 4 (3/2) = 6 pares.

O procedimento usual, então, é apresentar cada um dos pares (um de cada vez) ao supervisor. O supervisor indica (geralmente com uma marca de verificação) qual dos dois homens ele considera melhor. Uma matriz de comparação pareada pode então ser construída como a mostrada abaixo, na qual a seguinte regra é usada: Sempre que um supervisor preferir uma coluna a uma linha, coloque uma marca nessa célula.

Suponha que o supervisor X faça os seguintes julgamentos sobre os seis pares de trabalhadores:

Se colocarmos marcas na nossa matriz usando a regra acima, temos o seguinte:

Assim, este supervisor classifica B como o melhor trabalhador, seguido por ordem C, A e D. Na prática, os julgamentos de um número de juízes são incluídos na matriz para fornecer uma estimativa mais estável da ordem de mérito dos juízes. os homens sendo avaliados. Além disso, é uma prática comum converter as proporções dentro de cada célula em pontuações padrão (escores Z) e, em seguida, encontrar uma pontuação Z média para cada coluna.

Essa pontuação Z média é então o valor da escala para a pessoa representada por essa coluna na matriz. A vantagem deste último procedimento é que esses valores de escala podem ser tomados como representando não apenas a ordem de classificação da habilidade do trabalhador, mas também como uma indicação do grau em que dois trabalhadores diferem em habilidade.

Uma ilustração simples baseada nas respostas de dez supervisores hipotéticos aos quatro homens avaliados acima pode ser útil. Primeiro, vamos considerar a seguinte matriz de registro

Agora vamos converter a matriz de cálculo em uma matriz de proporção, onde definimos uma proporção como ⁿ / _N, onde n é igual ao número de marcas de registro em uma célula e N é igual ao número de juízes ou número de marcas possíveis. Costuma-se entrar com proporções de 0, 50 em todas as células da diagonal, mesmo que na verdade nunca apresentemos uma pessoa emparelhada com ele aos juízes.

O próximo passo é converter as proporções em pontuações Z. (Uma tabela para fazer isso pode ser encontrada em qualquer livro elementar sobre estatísticas.)

Se adicionarmos uma constante de 0, 78 a todos os valores de escala para remover os sinais negativos, os indivíduos podem ser representados ao longo de um continuum de mérito

Observe que a distância entre C e A é consideravelmente maior que a distância entre D e A ou B e C. Se as suposições desse método tiverem sido atendidas, essas distâncias relativas podem ser consideradas como indicativas das diferenças relativas de mérito entre os indivíduos sendo avaliados - uma característica atraente desse método de avaliação de desempenho. Para uma cobertura mais detalhada da comparação emparelhada, consulte Edwards (1957) ou Guilford (1954).

Uma das desvantagens do método de comparações pareadas é que ele não é particularmente útil quando o número de indivíduos a serem classificados se torna grande. Anteriormente, foi apontado que um supervisor provavelmente poderia classificar com sucesso a ordem de 50 ou 60 trabalhadores. Se tentássemos usar o procedimento de comparações pareadas, teríamos

50 (49) 72 = 1225 pares

Mesmo se um supervisor pudesse trabalhar à taxa de seis pares por minuto, seriam necessárias mais de três horas para obter a classificação. Quanto maior o número de pessoas a serem classificadas, mais astronômico se torna o requisito de tempo.