Parece que os avanços relacionados a inteligência artificial estão longe de acabar. Depois da criação automática de textos, aOpenAI, criadora do robô ChatGPT, anunciou um modelo que cria vídeos realistas a partir de texto curtos. Batizado de Sora, ele foi liberado para análises de especialistas e ainda não está disponível ao público.

As primeiras demonstrações do Sora incluem tanto animações quanto imagens com estilo realista. Nenhum vídeo foi gravado por humanos, e sim gerado pela inteligência artificial a partir de pequenos textos. O texto é escrito com muitas descrições e a partir dele o vídeo é preparado.
A técnica utilizada pelo Sora é chamada de “difusão”, ou seja, cria imagens a partir de pontos aleatórios. No começo do processo, o vídeo tem uma aparência de ruído estático, o efeito de TVs antigas que estão sem sinal. E, aos poucos, o visual é transformado em algo que pode ser reconhecido por um ser humano.
O processo e as dificuldades
Segundo a empresa, além de criar vídeos do zero, seu novo modelo de inteligência artificial é capaz de criar continuações de vídeos existentes e gerar vídeos a partir de imagens estáticas.
Mas, nem tudo são flores e também existem fraquezas. Segundo a OpenAI, o Sora pode ter dificuldade para reproduzir a física de uma cena complexa e pode não entender lógicas de causa e efeito. O modelo também pode confundir detalhes espaciais de um ‘prompt’, por exemplo, misturando direita e esquerda, e pode ter dificuldades com descrições precisas de eventos que ocorrem ao longo do tempo, como seguir uma trajetória específica de câmera.
Segurança e acesso
A OpenAI promete tomar várias medidas de segurança antes de disponibilizar o Sora em seus produtos. Segundo a empresa, o texto apresentado para encomendar um vídeo será verificado para identificar comandos que levem à violação da política de uso da companhia, como aqueles que requeiram violência extrema, conteúdo sexual, semelhança com celebridades etc.

O que já existe
Já existem outras empresas que criam vídeos a partir de inteligência artificial, mas a maioria apenas gera cenas curtas ou apresenta alucinações e defeitos graves. A expectativa é que a nova ferramenta da OpenAI seja superior às concorrentes e suba o patamar dos vídeos feitos com inteligência artificial. O que se espera é que uma fração desses erros seja resolvida quando o público geral tiver acesso ao Sora.

E aí? Já pensou em como será o futuro e as novas possibilidades de uso da inteligência artificial? Um fato já sabemos, os avanços não param de acontecer e teremos que nos adaptar as novas realidades.
Por Marina Carvalheira — Writer na SMI