Problemas e procedimentos envolvidos na seleção de trabalho

Antes de procedermos a um exame dos modelos básicos de seleção que estão disponíveis para o psicólogo, é necessário nos preocuparmos com um breve exame do modelo geral de múltiplas predições. Esse modelo é geralmente chamado de modelo de regressão múltipla. No paradigma geral de predição, desenvolvemos uma linha de regressão para ajustar o conjunto de pontos de dados definidos pelos escores das pessoas em um preditor (o eixo x ou abscissa) e no critério (o eixo y ou ordenada).

A figura 3.1 mostra essa situação. A linha de regressão na Figura 3.1 é uma linha reta e está localizada de forma que a soma das distâncias de um ponto à linha (correndo paralelamente ao eixo y) seja a menor possível. Usamos uma linha reta de melhor ajuste, uma vez que assumimos uma relação linear entre xe y.

A fórmula básica para uma linha reta é

y = a + bx

Onde y = pontuação prevista no critério

a = uma constante indicando o ponto no qual a linha de regressão cruza o eixo y

b = declive da linha, representado por ∆y / ∆x, ou a mudança em y observada para uma mudança correspondente em x

x = pontuação observada no preditor

Assim, o modelo básico de linha de regressão aparece como mostrado na Figura 3.2.

Observe que na Figura 3.2 a linha de regressão cruza o eixo y com um valor de 2. Assim, a = 2. Observe também que para cada aumento de 2 unidades em x existe um aumento correspondente de 1 unidade em y. Assim, /y / ∆x = 1/2 = 0, 5 = b. A equação de regressão torna-se então

y = 2 + 0, 5x

Dado qualquer valor de x, temos uma linha de regressão que nos permite prever uma pontuação correspondente a ela. Por exemplo, se x fosse 8, então

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Resumindo: No caso do preditor único, calcula-se uma linha reta de melhor ajuste para os pontos observados, onde o termo “melhor ajuste” significa que a soma dos desvios quadrados dos valores observados ao redor da linha será um mínimo.

As fórmulas necessárias para calcular as constantes a e b que definem essa linha de melhor ajuste são chamadas de fórmulas de “mínimos quadrados” e são as seguintes:

A fórmula para b é uma razão entre a covariância entre o preditor e o critério e a variação total no preditor. Quando a variância do critério e a variante do preditor são iguais, então b = r, ou a inclinação da linha de regressão é igual ao coeficiente de correlação.

Dois Preditores:

É lógico supor que, se o preditor X 1 pode contribuir para a previsão bem-sucedida de pontuações de critério e se o preditor X 2 também puder contribuir para a previsão bem-sucedida de pontuações de critério, usar os dois preditores juntos deve permitir uma previsão geral melhor do que usar preditor individualmente. No entanto, o grau em que os dois preditores (quando combinados) melhorarão a previsibilidade depende de vários fatores, dos quais o mais importante é a correlação entre os dois preditores.

Considere, por exemplo, a situação em que dois preditores se correlacionam substancialmente com um critério, mas não se correlacionam entre si, como segue:

Claramente, uma grande quantidade de critério adicional de variância pode ser explicada usando o preditor 2 juntamente com o preditor 1. A relação combinada entre dois ou mais preditores e um critério é chamada de correlação múltipla e tem o símbolo R. Como foi o caso com r 2, o valor de R ”representa a quantidade total de variação de critério que pode ser explicada usando vários preditores. Quando os preditores 1 e 2 não estão correlacionados entre si, o coeficiente de correlação múltipla ao quadrado pode ser mostrado como uma função aditiva dos coeficientes de correlação individuais do quadrado, ou

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Assim, quando (a inter-correlação dos preditores) é zero, então a validade múltipla ao quadrado é a soma das validações individuais quadradas.

Quando dois preditores estão correlacionados entre si, as coisas se tornam um pouco mais complexas. Considere uma situação (como no diagrama a seguir) em que cada preditor tem validade individual substancial, mas em que r12 também é bastante grande.

Por causa da inter-correlação entre estes preditores, o diagrama mostra que a quantidade de sobreposição entre o preditor 2 e o critério pode ser dividida em duas partes: aquela área única para o preditor 2 e aquela área compartilhada com o preditor 1. Assim, o uso de preditor um segundo preditor nessa situação nos permite contabilizar mais variância de critério do que poderia ser feito usando o preditor 1 sozinho, mas toda a variância de critério prevista por 2 não é nova variância. Uma regra geral pode, portanto, ser declarada em relação a múltiplos preditores.

Todas as outras coisas sendo iguais, quanto maior a correlação entre os preditores, menos a previsão geral será melhorada usando os dois preditores juntos. O caso extremo, é claro, seria a situação em que os preditores estavam perfeitamente correlacionados e não teríamos nenhuma variação adicional de critério contabilizada pela adição do preditor 2 à nossa bateria de seleção.

No caso de dois preditores que estão correlacionados entre si, podemos expressar R 2 como uma função das validações separadas e do tamanho da inter-correlação entre os preditores com a fórmula 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

note que se r 12 = 0, então a fórmula 3.2 reduz para

R 2 c . 12 = r 2 1c + r 2 2c

qual é a fórmula 3.1.

Uma ilustração mais explícita da influência da inter-correlação do preditor sobre o tamanho dos coeficientes de correlação múltipla pode ser obtida a partir da Tabela 3.1, onde exemplos de valores de R e R 2 são dados para pares de preditores com validades de 0.30, 0.50 e 0.70 sob condições hipotéticas de 0, 00, 0, 30 e 0, 60 inter-correlação. A Figura 3.3 mostra a tendência geral usando os dados apresentados na Tabela 3.1. A moral do psicólogo é bastante evidente - evite usar preditores que possam ser altamente relacionados entre si.

Equações de previsão:

A equação de previsão em uma situação de dois preditores é uma extensão do modelo de um preditor. A forma geral da equação é

y = a + b 1 x 1 + b 2 x 2 (3.3)

Esta é a equação de um avião em vez de uma linha reta. Para o leitor familiarizado com a geometria, a Figura 3.4 apresenta um desenho tridimensional das relações entre as variáveis ​​x 1, x 2 ey correspondendo à equação 3.3. Fórmulas estão disponíveis que permitem calcular as constantes a, b, e que resultarão no plano de regressão mais adequado. Uma vez que essas constantes tenham sido determinadas, a equação resultante pode ser usada para fazer previsões de desempenho de critério de novos candidatos a emprego, dadas suas pontuações nos preditores separados.

Para ilustrar, suponha que os dados estejam disponíveis em 100 homens contratados para o cargo X durante um determinado mês, o que inclui pontuações em dois testes, bem como dados de critério após um período de seis meses. Esses dados podem ser analisados ​​para determinar os valores de a, b 1 e bi que melhor descrevem as relações entre as variáveis.

Suponha que a seguinte equação fosse o resultado final:

y = 2 + 0, 5x 1 + 0, 9x2 (3, 4)

Esta equação diz que a pontuação de critério mais provável para qualquer nova contratação será igual a metade de sua pontuação no teste 1, mais nove décimos de sua pontuação no teste 2 mais dois. Assim, se um novo candidato pontuou 20 no teste 1 e 30 no teste 2, seu desempenho de critério previsto no final de seis meses a partir do momento da contratação seria

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

A extensão do modelo de dois preditores para um modelo preditivo de k, onde k é um grande número de potenciais preditores de sucesso no trabalho, não é conceitualmente muito difícil. Nosso modelo se expande para a forma

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +… + b k x k (3, 5)

No entanto, os procedimentos computacionais para resolver os valores de mínimos quadrados de todas as constantes em tal equação tornam-se bastante complexos, a menos que haja instalações de computação disponíveis. O leitor também é alertado para lembrar que, em toda a discussão anterior, houve a suposição implícita de um mundo linear, ou seja, todas as relações entre pares de variáveis ​​são lineares. É possível modificar o modelo de regressão múltipla para evitar essa suposição, mas isso está além do escopo deste livro.

Moderadores:

Um dos conceitos mais importantes na teoria de seleção e colocação é o conceito da variável moderadora. Algumas vezes referida como variável de controle populacional, uma variável moderadora pode ser vista como qualquer variável que, quando variada sistematicamente, tem um efeito sobre a magnitude da relação entre duas ou mais outras variáveis.

Talvez um exemplo hipotético (Figura 3.15) de como um moderador possa funcionar servirá para ilustrar sua influência sobre o processo de seleção. O gráfico de dispersão superior ilustra uma validade geral de 0, 50 entre o preditor e um critério. No entanto, a “população” representada no gráfico de dispersão é aquela que inclui ambos os sexos, ou seja, homens e mulheres são agrupados para determinar a validade. Mesmo uma inspeção casual do gráfico top de dispersão indica (se homens e mulheres são codificados diferentemente, como foi feito aqui) que o padrão de pontuação observado para homens difere daquele observado para mulheres.

Para obter uma imagem mais clara de como elas diferem, os dois diagramas de dispersão mais baixos da Figura 3.15 mostram as relações de critério-preditor separadamente para homens e para mulheres. Agora a diferença é impressionante. Para os homens, observamos um alto relacionamento positivo - um que produz uma validade de 0, 80. Para as mulheres, por outro lado, vemos que praticamente não há relação entre o preditor e o critério. A validade para as mulheres é de 0, 05.

A variável moderadora no exemplo acima é, obviamente, a variável do sexo. A relação entre preditor e critério é drasticamente afetada pela variação do moderador. A questão “qual é a validade do meu preditor” torna-se claramente mais complexa. O que inicialmente parecia ser uma validade moderadamente respeitável agora se transformou em duas validades distintas e separadas - uma muito alta e outra muito baixa.

Um nome para essas últimas validações pode ser validações condicionais, isto é, a validade do preditor, dado que a população é constituída de mulheres ou se a população é composta por homens. Uma característica interessante das variáveis ​​moderadoras é que um moderador não precisa ter qualquer relação direta com o preditor ou com a variável critério (isto é, rym e r im = 0).

Exemplos de moderadores:

Exemplos reais de moderadores foram encontrados em várias investigações de pesquisa. Vroom (1960), por exemplo, encontrou efeitos moderadores bastante marcantes usando o grau de motivação de gerentes e supervisores de primeira linha como variável moderadora. Todos os homens estudados eram funcionários da fábrica de Chicago ou de Nova York de uma empresa de serviços de entrega nacional especializada em entregar pequenas encomendas e pacotes de departamentos e outras lojas de varejo a residências particulares. Os dados do estudo que melhor ilustram o conceito de moderador são apresentados na Tabela 3.4.

Todos os supervisores foram divididos em três grupos com base no grau de motivação avaliado, usando um composto de vários índices de motivação obtidos na pesquisa. As validades para um teste de capacidade de raciocínio não verbal foram então obtidas para cada um dos quatro tipos diferentes de classificações de supervisão desses homens.

Isso foi feito separadamente em cada nível de motivação. Como mostra a Tabela 3.4, o teste foi aparentemente um indicador bastante válido de quão alto um homem seria avaliado por seu supervisor se apenas homens com alta motivação fossem considerados. Se variarmos sistematicamente a motivação ao descermos para os grupos com níveis de motivação moderados ou baixos, vemos uma mudança sistemática correspondente na relação entre o teste e o critério. Quanto menor a motivação do funcionário, menor a validade do preditor, de fato, as validades tornam-se negativas para os grupos de baixa motivação.

Outros exemplos de moderadores podem ser encontrados nos estudos de Dunnette e Kirchner (1960) e Ghiselli e seus colaboradores (1956, 1960). O trabalho de Dunnette e Kirchner foi direcionado principalmente à identificação de moderadores relacionados ao trabalho que estão agrupando pessoas em trabalhos que são semelhantes em termos de suas responsabilidades para obter a máxima previsão dentro de cada grupo de trabalho.

O método de Ghiselli pode ser chamado de sistema moderador “livre de variáveis”, as pessoas são agrupadas simplesmente com base em quão bem seu sucesso pode ser previsto sem referência direta a qualquer variável externa. Fredericksen e Gilbert (1960) também fizeram pesquisas sobre moderadores para determinar o grau em que o efeito de um moderador provavelmente será consistente ao longo do tempo. Eles descobriram que um moderador identificado em um estudo de 1954 (Fredericksen e Melville, 1954) ainda estava operando em um follow-up de I960.

Teoria da Seleção Moderna versus Tradicional:

O conceito da variável moderadora talvez ilustre melhor a tendência do modem na ênfase da seleção e da colocação. Tradicionalmente, a seleção e validação têm sido problemas que foram considerados como sendo melhor resolvidos simplesmente estabelecendo um critério que parecia ser confiável e um preditor que poderia predizer melhor esse critério.

A ênfase estava quase completamente no estabelecimento de uma alta validade com pouco ou nenhum pensamento para explorar as muitas variáveis ​​adicionais que, quando variadas, poderiam adicionar ou subtrair da correlação obtida. O lema geral que muitas vezes parecia tipificar a metodologia de seleção era o slogan “Se funciona, use!”

Sem dúvida, essa política foi responsável por desenvolvimentos bastante diferentes na psicologia industrial. Primeiro, provavelmente contribuiu para o grau em que os psicólogos foram aceitos na indústria. A administração é geralmente orientada para resultados positivos, representados por uma seleção melhorada, e não se preocupa excessivamente com a forma como ela é realizada.

Infelizmente, no entanto, essa orientação também é provavelmente responsável pelo fato de que as validações na predição não aumentaram substancialmente (se houve) nos últimos 50 anos - um comentário bastante perturbador sobre os esforços de psicólogos envolvidos nesse tipo de trabalho.

Em uma revisão de 1955 de um grande número de estudos de validade, Ghiselli (1955) indicou que, de fato, é um evento incomum obter um coeficiente de validade de 0, 50 ou melhor. A Figura 3.16 apresenta as distribuições de freqüência apresentadas por Ghiselli dos coeficientes de validade de diferentes magnitudes para diferentes tipos de trabalhos. Note-se que apenas na distribuição das validades para os funcionários administrativos usando testes de inteligência como preditores e medidas de proficiência como critérios há um grande número de validades acima de 0, 50.

O interesse atual dos moderadores é representativo de uma abordagem mais ampla e sofisticada em relação à seleção. Pode-se traçar até quando Toops (1948) fez um apelo aos psicólogos para que considerem a possibilidade de que estratificando as pessoas (por exemplo, os trabalhadores) sistematicamente de acordo com variáveis ​​pessoais, a pessoa deve ser capaz de melhorar a previsão. Seu método de classificação, a que ele se referiu como o procedimento addend, é o precursor dos moderadores.

Modelo de Seleção de Dunnette:

Talvez a visão atual em relação à metodologia de seleção possa ser melhor representada pelo modelo de seleção proposto por Dunnette (1963). Esse modelo é mostrado no diagrama apresentado na Figura 3.17 e é projetado para apontar o labirinto de complexidades e inter-relações que existem na situação de seleção. O modelo pode ser visto como mais do que uma tentativa de apontar apenas a natureza dinâmica da seleção - também representa um argumento para que os psicólogos aproveitem essas dinâmicas e as usem da melhor maneira, a fim de melhorar a previsibilidade.

Provavelmente, é possível entender o ponto de vista representado pelo modelo em termos da descrição exata usada por Dunnette (1963, p. 318):

Observe que o modelo de previsão modificado leva em conta as interações complexas que podem ocorrer entre os preditores e várias combinações de preditor, diferentes grupos (ou tipos) de indivíduos, diferentes comportamentos no trabalho e as conseqüências desses comportamentos em relação aos objetivos da organização. . O modelo permite a possibilidade de os preditores serem diferencialmente úteis para prever os comportamentos de diferentes subconjuntos de indivíduos.

Além disso, mostra que comportamentos de trabalho semelhantes podem ser previsíveis por padrões bastante diferentes de interação entre agrupamentos de preditores e indivíduos ou até mesmo que o mesmo nível de desempenho em preditores pode levar a padrões substancialmente diferentes de comportamento profissional para indivíduos diferentes. Finalmente, o modelo reconhece a incômoda realidade de que comportamentos iguais ou semelhantes podem, após passar pelo filtro situacional, levar a conseqüências organizacionais bastante diferentes.

A tendência atual na seleção representada pela conscientização dos moderadores e pelo modelo de seleção de Dunnette deve resultar em progresso tanto no aumento da eficiência da seleção quanto no grau de compreensão da dinâmica da predição precisa.

Variáveis ​​Supressoras:

Nenhuma discussão sobre seleção seria completa sem alguma menção de variáveis ​​supressoras. Em um sentido, uma variável supressora é semelhante a uma variável moderadora, na medida em que é definida como “uma variável que pode ter um efeito sobre a magnitude de um dado relacionamento preditor-critério, embora tenha pouca ou nenhuma relação com a própria variável critério. "

A dinâmica de uma variável supressora na predição pode ser melhor compreendida revisando novamente o conceito de uma correlação parcial e sua medida relacionada, a correlação semi-parcial. Se houvesse dois preditores e um critério que fossem inter-correlacionados como mostrado aqui, então correlação parcial entre o critério e o preditor x, que é r 1c. 2, foi definida como a correlação entre x 1 e C depois que os efeitos de x 2 foram parciais de ambos, então

Suponha que só queremos remover os efeitos do X2 do critério antes de calcular a correlação. Tal correlação é chamada de correlação semi-parcial ou parcial. Por exemplo, podemos estar interessados ​​na correlação entre as pontuações dos testes de inteligência (nosso preditor x 1 ) e o nível de habilidade final no final de um programa de treinamento de datilografia (o critério) x 2 pode representar o nível de habilidade inicial de todos os funcionários em termos de sua velocidade de digitação antes de fazer o curso de treinamento. Assim, queremos remover os efeitos do nível de habilidade inicial sobre o desempenho final antes de calcular a validade do nosso teste de inteligência.

Nossa correlação semi-parcial agora se torna:

O mecanismo de uma variável supressora é idêntico ao mostrado acima, exceto (1) geralmente, a variável x2 tem apenas uma ligeira (se houver) relação com o critério e (2) um está interessado em remover seus efeitos do preditor x 1 .

A situação geral pode, portanto, ser diagramada como:

Não se pode prever com certeza absoluta se as correlações parciais ou semi-parciais serão maiores ou menores que a correlação simples existente entre as variáveis, uma vez que o tamanho do numerador e do denominador é afetado pelo processo de partialling. A única vez que isso não acontece é quando a variável que está sendo parcializada está relacionada apenas a uma das duas outras variáveis, como no caso do supressor. Em tal situação, somente o denominador é subsequentemente afetado (a variância é removida) e a correlação semi-parcial resultante é maior do que a simples correlação não parcial entre as variáveis.

Validação cruzada:

Uma característica da maioria dos sistemas de seleção de previsão múltipla é que, em seu desenvolvimento, normalmente tende-se a capitalizar a variação de probabilidade existente na amostra de funcionários que está sendo utilizada para fins de validação. Isto é particularmente verdadeiro com o modelo de regressão múltipla, mas aplica-se também ao procedimento de corte múltiplo. Como o modelo de regressão múltipla tem propriedades de mínimos quadrados, isto é, nós deliberadamente minimizamos os erros na previsão de nossa amostra em particular, é provável que se aplicarmos agora nossa equação a uma nova amostra (da mesma população) não encontraremos nossa previsão tão eficiente quanto antes.

Assim, nosso R 2 calculado é uma superestimativa do que a validade futura de nosso sistema de previsão é capaz de ser, já que usar nossa equação para fins de predição automaticamente implica aplicá-la a novas amostras de trabalhadores. Essa queda esperada em R 2 é conhecida nas estatísticas como o problema de encolhimento e pode ser melhor ilustrado examinando-se a Figura 3.18.

Na Figura 3.18, temos duas amostras de indivíduos. Cada um representa uma amostra aleatória extraída ou pertencente à mesma população. Por exemplo, o exemplo A pode representar todos os candidatos a emprego para o cargo X durante os meses ímpares, e o exemplo B pode representar todos os candidatos a emprego durante os meses pares de um determinado ano.

Seria altamente incomum, mesmo com um número muito grande de candidatos em cada amostra, para as duas amostras serem idênticas em termos de dispersão. Uma vez que se pode esperar que os seus gráficos de dispersão variem devido ao erro de amostragem, pode-se esperar que a correlação entre o preditor e o critério (validade) varie um pouco, assim como a equação de regressão calculada em cada amostra.

Suponha que tomássemos a equação de regressão calculada na amostra A e a utilizássemos para prever pontuações da amostra B. Obviamente não poderíamos fazer um trabalho tão bom minimizando o uso da linha A com a amostra B como poderíamos usar a linha de regressão B - afinal, a linha B, por definição, minimiza Σd 2 para essa amostra. Qualquer outra linha terá, portanto, um erro maior associado a ela. Assim, R2 deve ser reduzido correspondentemente.

Existem fórmulas disponíveis para estimar a quantidade de encolhimento que se pode esperar ao usar esta equação em uma nova amostra. Uma dessas fórmulas é

R 2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

Onde

R 2 = encolhida correlação múltipla ao quadrado

R 2 = correlação múltipla ao quadrado obtida da amostra de validação

n = número de pessoas na amostra de validação

k = número de preditores na equação de regressão

É melhor, no entanto, validar a equação ao obter uma segunda amostra e testá-la para ver se ela é bem previsível. Se parece haver uma queda muito grande, pode-se querer revisar a equação (talvez combinando as duas amostras em um grupo). Grande retração é mais comumente encontrada quando os tamanhos das amostras são pequenos e / ou o número de preditores é grande em relação ao tamanho da amostra.

Mosier (1951) discutiu vários tipos de validação cruzada que podem ser conduzidos dependendo do projeto do estudo e se está preocupado em generalizar somente para uma nova amostra ou se generalizações mais amplas são desejadas (por exemplo, , para sexos diferentes, critérios diferentes, etc.). O primeiro é chamado de um caso de generalização de validade; o último é um caso de extensão de validade. Naturalmente, um maior encolhimento seria esperado no último caso, e a fórmula 3.9 em% aplica-se a casos de generalização de validade.