Notebookcheck Logo

A OpenAI mostra a capacidade do Voice Engine de clonar de forma convincente a voz de uma pessoa com uma amostra de voz de 15 segundos

A OpenAI demonstra os recursos do Voice Engine, que pode clonar a voz de uma pessoa com uma amostra de 15 segundos. (Imagem da IA Dall-E 3)
A OpenAI demonstra os recursos do Voice Engine, que pode clonar a voz de uma pessoa com uma amostra de 15 segundos. (Imagem da IA Dall-E 3)
A OpenAI apresentou uma prévia da capacidade de sua tecnologia Voice Engine de clonar de forma convincente a voz de uma pessoa com uma amostra de voz de 15 segundos. O mecanismo também pode transferir o sotaque de uma pessoa para outros idiomas falados ao traduzir a fala, falar um novo texto informalmente e restaurar a clareza da fala de pessoas com deficiências ou doenças vocais.

A OpenAI apresentou o estado atual de sua tecnologia Voice Engine, que pode clonar de forma convincente a voz de uma pessoa usando uma amostra de voz de 15 segundos como entrada. A tecnologia também pode transferir o sotaque de uma pessoa para outros idiomas falados durante a tradução da fala, mesmo que o idioma de destino use linguagem informal ou gíria. Para falantes com problemas de voz ou doenças que resultam em fala pouco clara, como laringite, o Voice Engine pode repetir o que foi dito com uma voz clara.

A tecnologia de IA avançou a ponto de reconhecer vogais, palavras e outras partes da fala e entender a essência das frases. A IA de clonagem de voz reconhece as características exclusivas da fala de uma pessoa, como sotaque, emoção, tempo e ênfase, e usa essas características para falar o texto como um clone convincente.

A OpenAI demonstrou em sua página do blog exemplos convincentes de:

  • Clonagem de voz
  • Tradução de fala com clonagem de sotaque de voz
  • Falar informalmente ou com gírias
  • Falar para os mudos
  • Ao sofrer de problemas de fala, falar com a voz original e clara de uma pessoa

A OpenAI não está liberando o Voice Engine para o público no momento devido a preocupações com o uso indevido, apesar de haver muitos outros serviços de clonagem de voz e adaptação de voz de IA no mercado. Essa tecnologia já foi usada durante o ciclo eleitoral dos EUA para criar chamadas telefônicas do 'fake President Biden', e em todo o mundo para fraudar dinheiro de empresas e pessoas. Infelizmente, uma vez aberta a caixa de Pandora, como a tecnologia de imagem de IA generativa usada para criar imagens falsas do Papanão há como voltar atrás.

Os leitores preocupados devem criar palavras seguras com membros da família e amigos próximos para verificar suas identidades, ler como reconhecer chamadas fraudulentas do https://consumer.ftc.gov/system/files?file=consumer_ftc_gov/pdf/1009a_how_to_avoid_a_scam_aug2022_508.pdfo senhor deve se preocupar com o fato de que o seu nome não pode ser usado para fins de segurança, desativar o uso de verificação de reconhecimento de voz com provedores financeiros e considerar o uso de um modificador de voz para se proteger contra a cópia de sua voz ao atender ligações desconhecidas.

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 03 > A OpenAI mostra a capacidade do Voice Engine de clonar de forma convincente a voz de uma pessoa com uma amostra de voz de 15 segundos
David Chien, 2024-03-30 (Update: 2024-03-30)