Sam Altman diz que a voz é um indicativo do próximo grande avanço em IA.

A OpenAI está se preparando para uma muito aguardada atualização de primavera para GPT-4 e ChatGPT na segunda-feira, e diversos relatórios apontam para a voz como a próxima fronteira da empresa de IA de Sam Altman. Na semana passada, no podcast All-In, Altman indicou que sistemas de IA baseados em voz, assim como no filme “Her” de 2013, poderiam ser um indício do futuro dos dispositivos habilitados para IA.

“Eu acho que você teria que encontrar algum paradigma de interação realmente diferente que a tecnologia permite”, disse Altman, quando perguntado sobre qual dispositivo vem depois do iPhone. O apresentador Jason Calacanis observou que o ChatGPT já possui um recurso de texto para fala. “Vamos melhorar isso. E acho que a voz é um indício do que quer que seja a próxima coisa. Se você conseguir que a interação por voz seja realmente boa, acho que parece uma maneira diferente de usar um computador.”

No início da semana passada, The Information relatou que o lançamento planejado pela OpenAI na segunda-feira de manhã poderia revelar um sistema de inteligência artificial que dialoga com as pessoas usando som, além de texto. O ChatGPT atualmente consegue entender a fala humana e responder. No entanto, ele usa um sistema de IA separado para traduzir isso em texto. Este novo sistema junta essas funcionalidades, o que poderia reduzir os problemas de latência que atualmente afetam o modality.

Enquanto Altman refletia sobre o que sucede ao iPhone, ele teve o cuidado de não insultar a tecnologia da Apple como costuma fazer com os produtos de sua própria empresa. Pelo contrário, ele chamou o iPhone de “a maior peça de tecnologia que a humanidade já fez.” Embora certamente não seja o primeiro a dizer isso, Altman pode estar tentando apaziguar um novo parceiro comercial em vez de simplesmente massagear o já grande ego da Apple.

Bloomberg informou na semana passada que a Apple fechou um acordo com a OpenAI para usar a tecnologia da startup no iPhone, juntamente com outros recursos de IA que a Apple fornecerá. Isso ocorre após meses de negociações reportadas entre Apple, Google e OpenAI sobre uma potencial parceria de IA para alimentar a próxima geração de uma Siri alimentada por IA. No entanto, a Bloomberg reportou que as negociações da Google com a Apple estão em andamento.

Uma atualização relacionada à voz do ChatGPT certamente excitaria a Apple e seus usuários sobre uma possível integração com o iPhone. Como sempre, o comportamento criptico de Sam Altman está lançando a comunidade de IA em um turbilhão de rumores. Pela primeira vez em quase três meses, Altman curtiu um tuíte que dizia: “Atualmente assistindo ‘Her’ para me preparar para segunda-feira.”

Outros rumores sobre o lançamento do produto OpenAI incluem alguma integração dos chatbots gpt2 que Altman tem provocado há muito tempo. Outros esperam uma atualização que poderia melhorar a versão gratuita do ChatGPT, que atualmente está limitada ao GPT-3.5, cumprindo um objetivo que Altman já declarou no passado. E assim como quando Sam Altman foi demitido, toda a equipe da OpenAI está engajada em uma tempestade de tweets coordenada para mostrar seu apoio cúmplice à empresa. Desta vez, todos estão animados com a excitação uns dos outros.