A empresa de desenvolvimento de IA revelou esta segunda-feira, numa publicação na rede social X, que está "a trabalhar para interromper" Sky, o nome de uma das cinco vozes que os utilizadores do ChatGPT podem escolher.
A OpenAI referiu que "ouviu perguntas" sobre como seleciona as opções de áudio realistas disponíveis para o seu principal 'chatbot' de IA, especialmente a Sky.
Esta 'start-up' também foi rápida em desmascarar as teorias da Internet sobre Johansson, numa publicação no blogue em que detalhou como as vozes do ChatGPT foram escolhidas.
"Acreditamos que as vozes de IA não devem imitar deliberadamente a voz distinta de uma celebridade - a voz de Sky não é uma imitação de Scarlett Johansson, mas pertence a uma atriz profissional diferente, que usa a sua própria voz natural", garantiu a empresa.
O nome das pessoas que dão voz à aplicação não podem ser divulgados por motivos de privacidade, alertou.
OpenAI tinha contactado Johansson, que recusou dar voz
Importa sublinhar, porém, que esta reação surge após Johansson lançar um comunicado onde anunciou que o CEO da OpenAI, Sam Altman, a contactou em setembro do ano passado para lhe pedir para dar voz ao sistema, dizendo-lhe que seria "reconfortante" para as pessoas que ainda desconfiam da tecnologia. A atriz, porém, recusou.
"Quando ouvi a demo lançada, fiquei chocada, zangada e incrédula. O senhor Altman foi à procura de uma voz que é assustadoramente parecida com a minha, de tal forma que os meus amigos próximos e família e meios de comunicação não conseguem distinguir", indicou Johansson, esclarecendo que a OpenAI concordou "relutantemente" em retirar a Sky depois dela ter contratado advogados para tratar do caso.
A OpenAI lançou pela primeira vez, em setembro, recursos de voz para ChatGPT, que incluíam cinco vozes diferentes, permitindo que os utilizadores conversassem alternadamente com o assistente de IA.
O 'modo voz' estava originalmente disponível apenas para assinantes pagos, mas em novembro, a OpenAI anunciou que o recurso se tornaria gratuito para todos os utilizadores da aplicação para telemóveis.
As interações do ChatGPT estão a tornar-se cada vez mais sofisticadas e, na semana passada, a OpenAI realçou que a última atualização do seu modelo generativo de IA pode imitar cadências humanas nas suas respostas verbais e pode até tentar detetar o humor das pessoas.
A OpenAI destacou que o modelo mais recente, batizado de GPT-4o, funciona mais rápido que as versões anteriores e pode raciocinar texto, áudio e vídeo em tempo real.
Embora a maioria dos utilizadores ainda não tenha tido acesso a estes novos recursos, as novidades suscitaram ainda mais comparações com o romance distópico de Spike Jonze, 'Her', que segue um homem introvertido (Joaquin Phoenix) que se apaixona por um sistema de IA (com voz de Scarlett Johansson), o que gera muitas complicações.
O CEO da OpenAI, Sam Altman, também pareceu aproveitar esta comparação, ao publicar simplesmente a palavra 'Her' ('Ela', em português) no X, no dia do lançamento do GPT-4o.
Leia Também: OpenAI ficou sem um dos seus cofundadores