Notebookcheck Logo

Fotógrafo destaca campo minado de direitos autorais de IA generativa, cria cópias convincentes das "fotos mais icônicas de todos os tempos"

Parece que, mesmo sem instruções diretas, os geradores de imagens de IA são capazes de recriar fotos clássicas, como a Lunch Atop a Skyscraper (Almoço no topo de um arranha-céu). (Fonte da imagem: Domínio público / DALL-E via PetaPixel)
Parece que, mesmo sem instruções diretas, os geradores de imagens de IA são capazes de recriar fotos clássicas, como a Lunch Atop a Skyscraper (Almoço no topo de um arranha-céu). (Fonte da imagem: Domínio público / DALL-E via PetaPixel)
Um fotógrafo se propôs a recriar algumas das imagens mais reconhecidas de todos os tempos usando Midjourney e DALL-E. Para surpresa de absolutamente ninguém, os sistemas de IA foram capazes de recriar com surpreendente precisão cada uma das imagens, que incluíam a Garota Afegã e o triunfo de Muhammad Ali sobre Sonny Liston.

Desde que os sistemas de IA generativa, como Midjourney e DALL-E, explodiram em popularidade entre o início e meados de 2022, não faltaram não faltaram artistas em armas contra os sistemas por violação de direitos autorais. É natural que haja alguma resistência, já que os sistemas de IA são amplamente treinados em imagens protegidas por direitos autorais para as quais nenhuma licença foi obtida.

Um fotógrafo, Matt Growcoot, da PetaPixel, decidiu ver como seria fácil fazer com que duas potências de IA de geração de imagens - Midjourney e DALL-E - recriassem algumas das imagens mais icônicas e reconhecíveis da história. No fim das contas, não foi nada difícil.

A lista de fotografias que a IA foi solicitada a recriar era a seguinte: V-J Day in Times Square de Alfred Eisenstaedt, a foto da capa de Abbey Road dos Beatles, Migrant Mother de Dorothea Lange, Lunch Atop a Skyscraper (autor desconhecido), The Tetons and the Snake River de Ansel Adams, the Afghan Girl de Steve McCurry, Raising the Flag on Iwo Jima (Levantando a bandeira em Iwo Jima ) de Joe Rosenthal, Behind the Gare Saint-Lazare (Atrás da Gare Saint-Lazare ) de Henri Cartier-Bresson, Muhammad Ali's victory over Sonny Liston (A vitória de Muhammad Ali sobre Sonny Liston) de John Rooney, Earthrise (Nascer da Terra) de William Anders e a foto de Don McCullin de um fuzileiro naval americano em estado de choque na Guerra do Vietnã.

Embora os sistemas de IA não tenham produzido cópias exatas das imagens em questão, os resultados (que os senhores podem ver no post de Growcoot em PetaPixel ou rolando para baixo até a publicação incorporada do X, antigo Twitter) são assustadoramente semelhantes em muitos casos. A imagem mais difícil de recriar, tanto para Midjourney quanto para DALL-E, foi Behind the Gare Saint-Lazare, de Cartier-Bresson, enquanto a estética e o tom de imagens como Afghan Girl e a vitória de Ali sobre Liston eram muito semelhantes ao original, mesmo que não fossem réplicas exatas.

A paisagem de Adams era provavelmente a mais semelhante em termos de uma recriação exata, enquanto Migrant Mother, Abbey Road, V-J Day in Times Square e Lunch Atop a Skyscraper também eram muito semelhantes às suas contrapartes feitas por humanos.

Essas representações precisas das fotos originais foram feitas apesar de prompts bastante detalhados, mas não específicos, como "Faça uma imagem fotorrealista em preto e branco de 1945 de um marinheiro beijando uma garota vestida de branco enquanto comemoram na Times Square, em Nova York" e "Faça uma foto dramática em preto e branco tirada em 1942 do Grand Teton National Park, em Wyoming. O rio Snake está em primeiro plano e as montanhas ao fundo."

Também é interessante observar que, embora as recriações de imagens sejam todas bastante representativas das obras de arte originais, cada algoritmo de IA generativo ainda tem sua própria aparência. As imagens de Midjourney ainda eram consistentemente mais realistas, enquanto as imagens de DALL-E tinham o tipo de névoa suave que todos nós esperamos da IA generativa - como se as imagens tivessem sido capturadas com algo como um filtro de difusão (que pode ser encontrado na Amazon por apenas US$ 10,49) ou uma lente com vaselina espalhada na frente.

O sucesso desse experimento não apenas destaca a importância de esforços como as Credenciais de Conteúdo da Leica, mas mais uma vez levanta sérias questões sobre o futuro papel da fotografia em documentários e esforços jornalísticos.

Se o senhor estiver interessado em percorrer o caminho mais longo para criar imagens artísticas, confira a Fujifilm X-S20 na Amazon (atual US$ 1.151)

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 03 > Fotógrafo destaca campo minado de direitos autorais de IA generativa, cria cópias convincentes das "fotos mais icônicas de todos os tempos"
Julian van der Merwe, 2024-03- 8 (Update: 2024-03- 8)