Arquitetura da recompensa: por que às vezes o incentivo falha?

A recompensa é apenas um dos fatores que devem ser considerados ao buscar incentivar um comportamento na equipe

Há poucas semanas, realizamos uma jornada de RH, com o objetivo de trazer para os gestores e profissionais da área de pessoas uma nova visão sobre gestão de equipes e organizações. Falamos bastante sobre as contribuições das ciências do comportamento para viabilizar um trabalho mais baseado no incentivo do que nas restrições e punições e sobre como esta visão possibilita um ambiente laboral mais produtivo, agradável e saudável. Ao longo das conversas que fizemos, alguns gestores nos trouxeram uma questão muito recorrente nas organizações, a percepção de que quando tentam incentivar desempenhos desejáveis, em geral, não funciona. Uma boa parte dos gestores percebe como mais eficiente a cobrança, a pressão e o medo da punição. Esta percepção pode ser resumida em duas expressões corriqueiras e muito repetidas: “se elogiar, estraga” e “carro apertado é que canta”. Entretanto, precisamos entender até que ponto estas convicções correspondem à realidade e se decorrem de distorções na percepção ou de problemas inerentes ao que tenho chamado de arquitetura da recompensa.

A recompensa é apenas um de muitos fatores que vão influenciar no comportamento da equipe - Foto: Divulgação
A recompensa é apenas um de muitos fatores que vão influenciar no comportamento da equipe – Foto: Divulgação

Se elogiar, estraga

Uma percepção recorrente é a de que o incentivo faz com que as pessoas piorem seu desempenho, o que, do ponto de vista das ciências do comportamento, não faria sentido. Entretanto, muitos gestores relatam contundentemente esta percepção. Isso sempre me remete ao episódio relatado por Daniel Kahneman, um dos precursores da economia comportamental. Kahneman ministrou aulas na força aérea israelense, na qual defendia, com base nos seus experimentos e pesquisas, que recompensas por bom desempenho funcionavam melhor do que a punição aos erros, quando se pretende fomentar a alta performance. Os instrutores de voo, que estavam presentes na turma o rebateram dizendo que em várias ocasiões nas quais elogiaram os aviadores por execuções perfeitas, ao repetir a manobra tinham um desempenho pior. Reforçaram, ainda, que quando chamavam a atenção por causa de uma manobra malfeita a seguinte era melhor.

Kahneman, então, não se conteve e caiu na gargalhada e as pessoas que participavam do treinamento ficaram sem entender. Quando conseguiu se conter, ele explicou que depois de uma performance extremamente boa, haveria uma chance muito grande de que a seguinte fosse um pouco menor, uma vez que a primeira era fora do padrão, um ponto fora da curva. Assim também, uma performance muito ruim teria uma chance muito grande de ser sucedida de um desempenho um pouco melhor, pelos mesmos motivos. Para Kahneman, os instrutores estavam descrevendo simplesmente o que a estatística chama de regressão à média. Dessa forma, para avaliar efetivamente os efeitos da recompensa ou da punição seria preciso medir e analisar o desempenho ao longo do tempo, para saber se estão gerando o resultado esperado.

Uma boa parte da percepção de que elogiar pode ter efeito contrário sobre o desempenho vem desta distorção relatada pelo Kahneman, mas outras distorções são comuns, com a de observar apenas parte do que a pessoa fez e tomar esta pequena parte como representação do todo. Pos outro lado, nem todos os problemas relacionados à recompensa se referem à percepção, muitas vezes o que é relatado é sim decorrente do incentivo. Não pelo simples fato de ter incluído uma recompensa, mas por algum erro no que tenho chamado de “arquitetura da recompensa”. Esta arquitetura corresponde à forma como planejamos e disponibilizamos recompensas pelo desempenho, que pode variar substancialmente, gerando cenários com efeitos muito distintos e influenciados por inúmeras variáveis, como as que destacamos a seguir. Elas não encerram a discussão, mas englobam a maior parte dos erros que se comete nas organizações ao planejar recompensas.

Relação entre recompensa e comportamento

As ciências do comportamento mostram que uma recompensa só produz efeito sobre o comportamento se ela tiver uma relação com este. Recompensas que ocorrem independentemente do comportamento, não possuem um efeito incentivador deste. Um cliente que fazia mentoria gerencial comigo e era dono de uma loja certa vez me trouxe um caso onde o incentivo que ele introduzira na sua equipe não produziu efeito sobre o desempenho dos vendedores. Ele é proprietário de uma loja de roupas de pequeno porte e possui uma equipe de vendas. A equipe possuía um salário fixo um pouco maior do que a concorrência, mas não recebia nenhum tipo de remuneração variável. Para resolver este problema, ela passou a adotar um bônus de acordo com o seu caixa. Assim, no mês que conseguia pagar todas as contas e sobrava um valor determinado, ele separava parte deste valor e distribuía para sua equipe. Isso não produziu nenhum efeito sobre o desempenho médio dos vendedores, o que fez com que ele apenas gastasse um valor maior do que antes.

Revoltado com a falta de efeito do incentivo sobre o desempenho da equipe, ele retirou este bônus, o que fez com que as vendas da equipe caíssem. Com esta dinâmica, ele concluiu que o erro foi incluir o incentivo, que deixou as pessoas mal-acostumadas e preguiçosas. Entretanto, a recompensa não produziu efeitos por conta de um aspecto da arquitetura que tenho chamado de “relação entre comportamento e consequência”, que nas ciências do comportamento tem o nome de relação de contingência. O critério utilizado para disponibilizar a recompensa, possuía fraca ou nenhuma relação com o que as pessoas faziam no dia-a-dia. Caso ofertassem mais e ampliassem a venda, por exemplo, isso não garantiria o bônus, pois uma despesa sazonal, como o IPTU, poderia fazer com que o caixa fechasse com um valor baixo. Ao mesmo tempo, um mês de vendas baixas, poderia gerar bônus, por questões independentes do comportamento dos vendedores.

Se não houver uma relação direta entre o comportamento, ou o produto do comportamento, e as recompensas, elas não produzem efeitos sobre ele. Assim, ao se planejar as recompensas, e importante elencar os indicadores que representem de forma mais fiel o comportamento das pessoas ou, como alternativa, o resultado direto destes comportamentos. Neste caso específico, ele poderia ter usado simplesmente o valor vendido como critério para disponibilizar a recompensa.

O risco de usar o resultado como critério para recompensa é que nem sempre ele está inteiramente ou majoritariamente relacionado com o que a pessoa fez, muitas vezes é obra do acaso. Dessa forma, se o desempenho for na sua maior parte influenciado por fatores externos, usar o resultado como critério pode fazer com que a recompensa também tenha pouca relação com o que a pessoa faz, com o seu comportamento. Se isso ocorrer, terá pouca influência no desempenho. Assim, caso queira utilizar o resultado como critério para a recompensa, outro ponto a considerar é a interdependência entre comportamento e resultado.

Interdependência entre o comportamento e o resultado

Eu trabalhei durante alguns anos em um banco comercial. Nos últimos três anos, eu respondia por uma carteira de clientes de baixa renda, que ganhavam até dois salários mínimos, e tinha metas e produtos-alvo focados para este público. Certo dia, um cliente que possuía uma conta de poupança apenas, com poucos reais guardados, sentou-se na minha mesa e disse que possuía um valor alto em outro banco e que pretendia fazer uma previdência conosco. Eu lhe expliquei como o produto funcionava, lhe ajudei a escolher o melhor plano e ele trouxe aquele valor expressivo como previdência. Foi uma venda significativa. Claro que o gerente deveria me reconhecer por isso e assim o fez. Entretanto, dificilmente este desempenho se repetiria, porque, apesar de ter realizado meu papel de explicar os detalhes sobre o plano de previdência e, assim, influenciado a decisão do cliente, a captação daquele recurso ocorreu por algo que não dependia do meu comportamento. O alto desempenho se deu por um fator independente e aleatório. Ainda que eu ganhasse recompensas sociais ou financeiras por este, dificilmente se repetiria no curto prazo.

Tenho visto muitas empresas recompensando pessoas e equipes por desempenhos que em grande parte não depende delas ou de seus comportamentos, mas que são influenciados fortemente por fatores externos ou aleatórios. Algumas empresas de TI remuneram suas equipes por pontos de função, uma unidade de medida específica de desenvolvimento de softwares. No entanto, ao longo do desenvolvimento de um sistema, a fase do projeto influencia na produção destes pontos de função. Depois das primeiras fases, entra-se em uma curva de produtividade que eleva a quantidade de pontos de função, não porque as pessoas passaram a ter um desempenho melhor, mas devido à fase de desenvolvimento. Em seguida, quando o projeto vai se aproximando do fim, ele produz menos pontos de função. Isso não significa dizer que as pessoas diminuíram seu desempenho, apenas a fase de finalização e manutenção em si não gera tantos pontos de função quanto as anteriores, pela natureza de sua atividade.

Não que estes desempenhos não devam ser reconhecidos porque, nas duas situações, mesmo com o favorecimento por uma situação externa ou por algo aleatório, houve uma participação das pessoas na conclusão da atividade. Entretanto, se o gestor não compreender que o desempenho foi em sua maior parte influenciado por fatores externos e sem controle de quem executa atividade, pode ter a percepção de que a recompensa gerou o um desempenho menor seguinte. Esta distorção decorre do erro de atribuir uma relação de causa (causalidade) a eventos que apenas ocorrem em sequência e em momentos próximos (contiguidade).

Relatividade da recompensa

Nos primeiros anos em que trabalhei no banco, nossa agência recebeu uma meta grande para vender seguros de baixo valor. Para incentivar a venda, o gestor informava diariamente o desempenho de todos. Isso gerou um clima de competição que foi produtivo e fez uma boa parte das pessoas se engajarem na venda dos seguros. Na primeira semana, eu e uma colega ficamos empatados no primeiro lugar. Como prêmio, o gerente nos convidou a dar um minicurso sobre seguros e vendas para a equipe da agência. Eu fiquei empolgado, porque sempre gostei de exposição pública em geral, seja falando ou, em outras épocas, tocando piano. Eu me senti fortemente reconhecido e fui conversar com a minha colega, para planejarmos como seria feito. Quando a encontrei, estava com o semblante fechado, esfregava as mãos e balançava levemente a cabeça em sinal negativo. Ao lhe perguntar se havia acontecido algo, ela me respondeu dizendo que odiava falar em público, que não faria o curso, que pediria ao gerente para não participar, dentre outras falas similares.

O gerente insistiu e fizemos o curso. Eu fui para a casa com a alegria típica de uma criança que ganha um pirulito, ela, como quem perde o campeonato. O efeito nas semanas seguintes foi que mantive meu desempenho entre os primeiros e ela caiu para o desempenho mediano, provavelmente o suficiente para evitar broncas e, ao mesmo tempo, no limite para não receber outros “convites” como este. O fato é que o que funcionou para mim como recompensa, para ela funcionou como punição. Isso é o que chamamos de relatividade da recompensa. Nenhuma recompensa é em si uma recompensa, mas assume tal função por uma série de fatores. Eventos que ocorreram ao longo da vida ou mesmo fatores presentes no momento podem alterar esta função da recompensa, fazendo com que se torne mais forte, mais fraca, nula ou mesmo se transforme em punição.

Assim, caso queira construir uma arquitetura de recompensas eficiente, é preciso entender esta relatividade e considerá-la. Ao planejar recompensas para uma pessoa, vale investigar o que mais funciona para ela. Quando o objetivo é planejar recompensas para um grupo ou organização, esta arquitetura se torna mais complexa, pois para cada pessoas o que funciona como recompensa pode ser diferente. Há recompensas que são mais generalizadas, como o dinheiro, mas ainda assim não garante uma unanimidade ou não tem o mesmo peso para todas as pessoas. Uma solução que temos utilizado para esta complexidade é a de trabalhar com um cardápio de recompensas, no qual a pessoa escolhe dentre várias opções o que vai ganhar.

Latência da recompensa

Certa vez atendi uma indústria que estava com um elevado índice de acidentes de trabalho. Eles nos contrataram porque tinham utilizado todas as estratégias da engenharia de segurança para reduzir o número de acidentes, mas, apesar conseguirem diminuir as ocorrências, estes continuavam acontecendo e não havia mais recursos de infraestrutura ou de normas que produzissem efeitos. A suspeita deles era a de que estavam com as pessoas erradas. Quando fui explicar melhor nossa abordagem e sobre como é possível incentivar comportamentos seguros a partir de recompensas, o diretor logo me interrompeu dizendo que no ano anterior eles haviam atrelado parte da PLR (participação nos lucros e resultados) aos indicadores de segurança e que mesmo assim as pessoas não se engajaram. A conclusão é que havia algum problema na seleção, pois precisavam de pessoas que possuíssem a “segurança na veia”.

Eu não ri, como fez o Kahneman, mas achei graça no discurso, pois ele quase sempre caminha neste sentido, em atribuir os problemas de desempenho às pessoas e não à estrutura. Neste caso, havia um problema típico na arquitetura da recompensa, naquilo que chamamos de latência. Latência é a distância temporal entre o momento em que o comportamento acontece e a disponibilização da recompensa. Quanto mais próxima temporalmente a recompensa estiver da ação, mais chances ela tem de influenciar este comportamento. A participação nos lucros ocorria no mês de março do ano seguinte. Assim, é pouco provável que ela exercesse alguma influência sobre o comportamento de segurança dos empregados. Outras consequências mais imediatas, como o desconforto de usar o EPI ou a agilidade na execução, ao descumprir uma norma ou procedimento, se tornavam mais eficientes para incentivar comportamentos inseguros.

Muitas pessoas dizem que isso não faz sentido. Por que seria importante incentivar comportamentos seguros se, no caso de um acidente, o mais prejudicado é o trabalhador? Será que sofrer uma grave lesão ou mesmo morrer não são suficientemente inibidores? A questão aqui é mais do que uma latência (por mais que esteja presente) ou a relatividade citada no item 2. Neste caso temos também a influência da probabilidade.

Probabilidade da recompensa

Quando trabalhadores se expõem a riscos graves, mesmo tendo equipamentos, normas e procedimentos suficientes para protegê-lo, muitos fatores estão em jogo. Um deles é a probabilidade. Uma perda, por mais intensa que seja, pode ter baixo efeito inibidor de um comportamento se ela tiver uma baixa probabilidade de acontecer. Isso ocorre não apenas com o comportamento seguro, também se repete com hábitos alimentares, uso de substâncias, dentre outros.

As pessoas sabem que beber refrigerante faz mal, ainda assim, muitas pessoas continuam consumindo a bebida, porque a recompensa (sabor) tem uma latência curta, ou seja, acontece de forma imediata, e alta probabilidade, sempre acontece. Por outro lado, o possível adoecimento tem uma latência alta (só acontece em um futuro distante) e com baixa probabilidade, pois não é certo de que aquele copo de refrigerante vá gerar um adoecimento. Dessa forma, por mais grave que seja o adoecimento, ele tem um efeito inibidor mais fraco que a recompensa do sabor e frescor da bebida.

Ao programar recompensas, então, devemos nos atentar à probabilidade. Uma estrutura de recompensa muito comum de ser usada em vendas é a de bônus sobre meta. Por exemplo, a pessoa possui uma meta de 100 pares de sapato e só ganhará seu bônus se bater esta meta. Assim, se vender 50, 80 ou 99, não ganha nada. Este tipo de estrutura traz uma recompensa de baixa probabilidade, pois a minha venda hoje não garante nenhum ganho em si, ela depende de outros desempenhos para garantir o bônus. É preciso um desempenho alto para obter a recompensa, que a torna de baixa probabilidade. Se a meta for muito alta, pode ser vista como desanimadora. Se a meta for muito baixa, a recompensa pode funcionar para garantir a meta, mas não para superá-la. Esta é uma arquitetura que gera baixa influência no comportamento da equipe de vendas, podendo produzir o efeito que tenho chamado de “desempenho útil”. Desempenho útil é quando a equipe produz o mínimo suficiente para não ser punida, caso a meta seja muito alta, ou apenas o necessário para chegar na meta, quando esta é baixa, sem preocupação em superá-la.

Estrutura tarefa/recompensa

Outra queixa frequente de gestores de equipes de venda é a de que seus vendedores “deixam tudo para o fim do mês”. Dizem que seria ideal que os vendedores iniciassem suas vendas desde o início do mês com velocidade e a mantivesse até o fim, de forma mais estável. Isso facilitaria o planejamento de produção ou de logística, por exemplo. Todavia, por mais que façam reuniões incentivando a mudança, o padrão se mantém. Este padrão típico de vendas não tem relação com a “boa vontade” dos vendedores, mas da arquitetura de recompensas, especialmente no ponto que tenho chamado de “estrutura tarefa/recompensa”, que na psicologia comportamental tem o nome de “esquemas de reforçamento”.

Há várias formas de estruturar a relação entre a tarefa e a recompensa. Em uma marcenaria que fabrica cadeiras, por exemplo, poderia pagar os operadores por cadeira finalizada. Entretanto, poderia também pagar um valor específico a cada cinco ou dez cadeiras produzidas. Essa mudança na estrutura entre tarefa e recompensa influencia o padrão com o qual a pessoa irá produzir cadeiras. Na primeira situação ela tenderá a ter uma produção com um ritmo mais constante, com uma pequena pausa entre a finalização de uma cadeira e o início de outra. Na segunda, tenderá a iniciar a produção de forma mais lenta, nas primeiras cadeiras, e a acelerar quando esta se aproximar de dez. Estes padrões são observados em diversos experimentos em laboratório e trabalhos práticos.

Dessa forma, se eu pretendo trazer um equilíbrio nas vendas, para que não haja um acúmulo no fim do mês, trimestre ou semestre, não adianta fazer reunião ou tentar “conscientizar” o vendedor de que isso é importante para e empresa, é fundamental modificar a estrutura tarefa/recompensa. Uma possibilidade que utilizamos é a de fragmentar os fechamentos de resultado por semana, garantindo ciclos mais curtos de produtividade. Ainda que o padrão de maior velocidade se mantenha, a equipe teria quatro pequenos picos no mês e não um grande volume de vendas apenas no fim.


A percepção de que o incentivo é contraproducente está, então, relacionada a distorções na própria observação, como no caso relatado pelo Kahneman, e a um planejamento de recompensas pouco eficiente. O princípio básico da utilização da recompensa é o de que esta aumenta a probabilidade de a pessoa repetir o bom desempenho no futuro. É isso que as organizações buscam. Além dos efeitos no próprio desempenho, o caminho da gestão de desempenho por meio de incentivos produz outros efeitos desejáveis como um bom clima de trabalho, menores índices de adoecimento e, conjugada com outras estratégias, maior retenção e atratividade. No entanto, precisamos entender que este princípio básico é singelo, mas sua operacionalização não, uma vez que alguns elementos de análise são contra-intuitivos e devem ser baseados no que as ciências do comportamento produziram de evidências. Além disso, não basta apenas se basear em uma das propriedades, é fundamental considerar todos os princípios e efeitos que compõem esta arquitetura de recompensas. Sabemos que esta construção não é fácil e envolve muito estudo, observação e mensuração, mas, como diz o ditado: “carro apertado é que canta”.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.