Notebookcheck Logo

O senhor está treinando a IA de graça - e ela nem sequer agradece

O senhor está treinando a IA gratuitamente a cada solicitação. Robô humanoide genérico na foto. (Fonte da imagem: Vjulien Tromeur - Unsplash)
O senhor está treinando a IA gratuitamente a cada solicitação. Robô humanoide genérico na foto. (Fonte da imagem: Vjulien Tromeur - Unsplash)
O senhor está treinando a IA gratuitamente com cada solicitação, clique e CAPTCHA. Veja como o feedback humano está alimentando modelos de bilhões de dólares... sem nenhum agradecimento.
Opinião por Darryl Linington
Pontos de vista, pensamentos e opiniões expressas no texto pertencem exclusivamente ao autor.

Alguma vez o senhor já teve a sensação de que os seus bate-papos noturnos no ChatGPT estão fazendo mais pelo Vale do Silício do que a sua própria produtividade causada pela insônia? Isso é porque estão. Se estiver usando ferramentas de IA gratuitas, parabéns, o senhor foi convocado para uma força de trabalho global não remunerada e ninguém se deu ao trabalho de lhe dar uma caneca de cortesia.

Como isso realmente funciona (sim, o senhor faz parte disso)

Vamos abrir a cortina. A maioria dos chatbots de IA gratuitos, como o ChatGPT, Claude e Gemini, é executada em modelos que melhoram com algo chamado RLHF (Reinforcement Learning from Human Feedback). Parece complicado, mas aqui está a versão simples:

O senhor faz uma pergunta. A IA responde. O senhor avalia a resposta com um polegar para cima ou para baixo. Talvez o senhor prefira uma resposta a outra. Parabéns... o senhor acabou de treinar o modelo. Suas preferências são registradas e analisadas e, por fim, o modelo se ajusta para ser mais "útil"

Essas ferramentas não ficam na nuvem apenas por diversão. Elas aprendem com o senhor. Na verdade, o senhor não está apenas conversando; é um anotador de dados muito acessível (leia-se: não pago).

Sim, até mesmo os usuários pagos ajudam a treinar os bots

O senhor acha que escapou da fábrica de dados pagando pelo GPT-4? Pense novamente. A menos que o senhor tenha optado explicitamente por não participar nas configurações do ChatGPT, suas interações ainda estão sendo usadas para ajustar o comportamento da IA. É isso mesmo. O senhor está pagando US$ 20/mês para contribuir com o desenvolvimento do produto. Em escala. Sem royalties. Um ótimo truque, não é?

A OpenAI, por exemplo, usa conversas de usuários gratuitos e pagos para aprimorar seus modelos, a menos que o senhor desative o "histórico de bate-papo" O Gemini do Google? A mesma coisa. O Claude da Anthropic? Também coleta preferências para aprimorar seus modelos de alinhamento.

O RLHF não é apenas magia tecnológica... É uma esteira rolante humana

Por trás de cada acrônimo sofisticado como RLHF há um processo muito real e muito humano. Os prestadores de serviços são contratados para classificar as respostas, sinalizar as alucinações e classificar os avisos.

Empresas como a Sama (antes ligada à OpenAI), Surge AI e Scale AI fornecem essa mão de obra, geralmente por meio de prestadores de serviços mal remunerados que trabalham longas horas, muitos deles em países em desenvolvimento. Em 2023, relatórios confirmaram que os rotuladores da RLHF estavam ganhando de US$ 2 a US$ 15 por hora, dependendo da região e da função. Então, sim, pessoas reais estão clicando repetidamente em "esta resposta é melhor". E é esse ciclo de feedback que alimenta os bots.

Se o senhor está fornecendo o mesmo tipo de feedback por meio de polegares para cima, está basicamente fazendo uma versão reduzida do trabalho deles... de graça.

Como esse feedback é usado

É aqui que as coisas ficam interessantes. Seu feedback não treina diretamente o modelo principal. Ele alimenta os modelos de recompensa, sistemas menores que dizem à IA principal como se comportar. Portanto, quando o senhor diz: "Gosto mais desta resposta", está ajudando a construir a bússola interna que o modelo principal segue. Quando um número suficiente de pessoas faz isso, a IA começa a se sentir mais humana, mais educada, mais prestativa... ou mais parecida com um colunista com problemas de limites.

E quanto ao seu estilo de escrita?

A IA se lembra do tom. Quando o senhor interage com ela de forma consistente em um determinado estilo - sarcástico, acadêmico ou brutalmente contundente - o sistema aprende a responder da mesma forma. Ele não está roubando sua voz e vendendo-a para outras pessoas (ainda), mas seus padrões ajudam a formar parte da experiência de treinamento coletivo, especialmente se o bot perceber que outras pessoas gostam de sua frase ou tom.

Não se trata tanto de clonar o senhor, mas sim de replicar o que funciona. E o que funciona geralmente vem de alguém que nunca consentiu com a replicação do estilo.

O CAPTCHA não é mais apenas para bots

Ah, e aqueles quebra-cabeças CAPTCHA que o senhor resolve para provar que é humano? O senhor não está apenas clicando em semáforos e faixas de pedestres para acessar seu e-mail. O senhor está rotulando dados para modelos de aprendizado de máquina. O reCAPTCHA do Google, o hCaptcha e o Turnstile da Cloudflare alimentam os dados visuais em pipelines de treinamento, ajudando as IAs a ver o mundo com uma placa de rua borrada de cada vez.

Portanto, sim, até mesmo sua verificação de segurança faz parte da economia de feedback agora.

Bilhões em valor... Reconhecimento zero

Não se trata de uma conspiração marginal. O mercado de dados de treinamento está crescendo. De acordo com a MarketsandMarkets, o tamanho do mercado global de dados de treinamento está projetado para crescer de US$ 1,5 bilhão em 2023 para mais de US$ 4,6 bilhões em 2030. E, embora isso inclua dados sintéticos e conjuntos de dados com curadoria, o valor dos dados do mundo real rotulados por humanos, ou seja, o que o senhor fornece casualmente todos os dias, está aumentando.

No entanto, a maioria dos usuários ainda acha que a conversa com o chatbot desaparece no éter. Spoiler: não desaparece. A menos que o usuário tenha desativado explicitamente o registro (e mesmo assim... confie, mas verifique).

Pensamento final: O senhor não está paranoico... está apenas envolvido

Aqui está o ponto crucial. O senhor faz parte da construção daquilo que pode vir a substituir seu emprego, superar sua criatividade ou transformar seus tweets em amostras de produtos. Isso não significa que o senhor deva parar de usar IA, mas deve saber com o que está contribuindo. E talvez, apenas talvez, pedir um pouco de transparência em troca.

Afinal, se o seu trabalho gratuito for bom o suficiente para moldar a próxima geração de modelos de IA de bilhões de dólares, o mínimo que eles podem fazer é agradecer.

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2025 07 > O senhor está treinando a IA de graça - e ela nem sequer agradece
Darryl Linington, 2025-07-22 (Update: 2025-07-22)