top of page
Foto do escritorJefferson madeira

Sora AI : A Evolução da Geração de Vídeos por Texto



Você já ouviu falar do Sora AI, a mais nova ferramenta da OpenAI capaz de criar vídeos incríveis a partir de simples comandos de texto?


A OpenAI, uma organização de pesquisa em inteligência artificial com sede nos Estados Unidos, desenvolveu o Sora, um modelo de geração de vídeo por texto. Ele tem a capacidade de criar vídeos com base em instruções descritivas, estender vídeos existentes para frente ou para trás no tempo e gerar vídeos a partir de imagens estáticas. No entanto, até fevereiro de 2024, o Sora ainda não foi lançado e não está disponível para o público em geral.


Antes do Sora, vários outros modelos de geração de vídeo por texto foram criados, incluindo o Make-A-Video da Meta, o Gen-2 da Runway e o Lumiere do Google, este último ainda em fase de pesquisa até fevereiro de 2024. A OpenAI, empresa por trás do Sora, havia lançado o DALL·E 3, o terceiro de seus modelos de texto para imagem DALL-E, em setembro de 2023.


A equipe que desenvolveu o Sora escolheu esse nome por sua significância na palavra japonesa para "céu", indicando seu "potencial criativo ilimitado". Em 15 de fevereiro de 2024, a OpenAI fez uma prévia do Sora ao lançar vários clipes de vídeos em alta definição que ele criou. A empresa então compartilhou um relatório técnico, destacando os métodos usados para treinar o modelo. O CEO da OpenAI, Sam Altman, também postou uma série de tweets, respondendo aos prompts dos usuários do Twitter com vídeos gerados pelo Sora. Abaixo, exemplos de vídeos criados totalmente pela SORA.





A OpenAI declarou que planeja disponibilizar o Sora ao público, mas isso não será em breve, sem especificar quando. A empresa forneceu acesso limitado a um pequeno "time vermelho", incluindo especialistas em desinformação e preconceito, para realizar testes no modelo. A empresa também compartilhou o Sora com um pequeno grupo de profissionais criativos, incluindo produtores de vídeo e artistas, para buscar feedback sobre sua utilidade em campos criativos.


Capacidades e Limitações

A tecnologia por trás do Sora é uma adaptação da tecnologia por trás do DALL-E 3. Segundo a OpenAI, o Sora é um transformador de difusão. Um vídeo é gerado no espaço latente, removendo "patches" 3D, e depois transformado para o espaço padrão por um descompressor de vídeo. A recaptura é usada para aumentar os dados de treinamento, usando um modelo de vídeo para texto para criar legendas detalhadas em vídeos.


Will Douglas Heaven, do MIT Technology Review, chamou os vídeos de demonstração de "impressionantes", mas observou que eles devem ter sido escolhidos a dedo e podem não representar a saída típica do Sora. O acadêmico americano Oren Etzioni expressou preocupações com a capacidade da tecnologia de criar desinformação online para campanhas políticas. Para a Wired, Steven Levy escreveu que o Sora tinha o potencial de se tornar "um desastre de desinformação" e opinou que os clipes de prévia eram "impressionantes", mas "não perfeitos" e que mostravam um "entendimento emergente da gramática cinematográfica" devido às mudanças de plano não solicitadas. Levy adicionou que "será um tempo muito longo, se é que algum dia, antes que o texto para vídeo ameace a produção cinematográfica real." Lisa Lacy, da CNET, chamou os vídeos de exemplo de "Impressionantemente realistas - exceto talvez quando um rosto humano aparece de perto ou quando criaturas marinhas estão nadando".


Essa inovação promete revolucionar a forma como interagimos com conteúdos visuais. No entanto, você pode estar se perguntando por que o Sora AI ainda não está disponível para o público em geral. Vamos explorar os motivos por trás dessa decisão.


Tim Brooks, cientista da OpenAI, destaca que a criação de modelos que compreendam vídeos e todas as suas complexidades é crucial para o avanço da inteligência artificial. No entanto, mesmo com o potencial impressionante do Sora AI, a empresa optou por não disponibilizá-lo imediatamente.


Uma das razões para essa cautela é a preocupação da OpenAI com o potencial uso indevido de vídeos falsos. Aditya Ramesh, cientista da OpenAI responsável pela criação do DALL-E, explica que a empresa está sendo cuidadosa com o lançamento do Sora AI devido a essas preocupações. Segundo ele, estão sendo realizados testes rigorosos por especialistas em áreas como desinformação e discurso de ódio antes de disponibilizar a ferramenta para o público em geral.


Além disso, Logan Kilpatrick, da equipe de Relações com Desenvolvedores da OpenAI, menciona que a empresa está buscando feedback de profissionais criativos, como artistas visuais, designers e cineastas. Esse feedback é essencial para garantir que o Sora AI atenda às necessidades do mercado e seja útil para os usuários.


Apesar do anúncio, o Sora AI ainda não está disponível publicamente. A OpenAI revelou que a IA está sendo avaliada por especialistas e que não há pressa em lançar oficialmente a ferramenta. Como mencionado por Aditya Ramesh, a empresa está focada em garantir que todas as bases estejam cobertas antes de disponibilizar o Sora AI para o público em geral.


Embora ainda não haja uma data oficial de lançamento, a OpenAI abrirá uma lista de espera para os interessados em testar a ferramenta a partir de 16 de fevereiro. Isso nos lembra o processo de lançamento do ChatGPT, que foi anunciado antes de estar disponível para o público em geral.


Em resumo, embora a espera pelo Sora AI possa ser frustrante, é importante reconhecer que a OpenAI está priorizando a segurança, ética e qualidade da ferramenta. Estamos diante de uma nova era na inteligência artificial, e o Sora AI promete ser grande parte desse avanço. Continue acompanhando para mais novidades sobre tecnologia!


Sobre a Tafner.

A TAFNER é uma parceira digital especializada em outsourcing de TI, oferecendo suporte personalizado desde redes até sistemas. Destaca-se como uma fábrica de softwares, desenvolvendo soluções personalizadas para impulsionar negócios com inovação, qualidade e agilidade. Além disso, possui um Sistema de Votação Online para órgãos públicos, eleições online, assembleias digitais, promovendo facilidade, transparência e segurança. A TAFNER busca proporcionar experiências que impulsionam o sucesso, convidando a construir juntos o futuro digital.



18 visualizações0 comentário

Comments


bottom of page