OpenAI lança DALL-E 3, um gerador de imagens baseado em texto

A OpenAI, empresa responsável pelo chatbot ChatGPT, anunciou na quarta-feira o lançamento do DALL-E 3, seu mais novo modelo de geração de imagens a partir de texto.

OpenAI lança DALL-E 3, um gerador de imagens baseado em texto

O modelo é capaz de compreender solicitações complexas e produzir imagens correspondentes com alta qualidade e fidelidade.

O DALL-E 3 é uma evolução dos modelos anteriores da OpenAI, como o DALL-E e o DALL-E 2, que já demonstravam a capacidade de gerar imagens a partir de texto, mas com limitações na precisão e na variedade. O novo modelo supera essas limitações e consegue capturar palavras e descrições específicas, sem exigir que os usuários tenham habilidades de engenharia para obter os resultados desejados.

Em um evento para repórteres, a OpenAI mostrou alguns exemplos impressionantes do que o DALL-E 3 pode fazer. Um deles foi uma imagem gerada a partir da instrução: “Um bobo da corte rosa dando um high five para um panda durante uma competição de ciclismo. As bicicletas são feitas de queijo e o chão é muito lamacento.

Eles estão dirigindo em uma floresta nebulosa. O panda está com raiva.” A imagem resultante surpreendeu pela sua fidelidade ao pedido, que havia sido vazado no Discord no início do verão.

Outro exemplo foi um cartoon compartilhado pelo CEO da OpenAI, Sam Altman, que mostrava um diálogo entre dois personagens em um cenário futurista. O texto do cartoon foi gerado pelo ChatGPT, enquanto as imagens foram geradas pelo DALL-E 3. O modelo demonstrou a capacidade notável de incorporar texto coerente em suas criações, além de detalhes visuais como cores, formas e expressões faciais.

A OpenAI planeja integrar o DALL-E 3 diretamente ao ChatGPT+, permitindo que o chatbot alterne entre os modelos conforme o conteúdo do prompt. Isso significa que os usuários poderão solicitar ao ChatGPT+ que gere imagens a partir de texto, ou que use texto extraído de diversas fontes para gerar imagens.

A OpenAI também anunciou que o DALL-E 3 estará disponível para todos os usuários do ChatGPT+ nas próximas semanas, sem reivindicar direitos autorais sobre os resultados gerados pelo modelo. No entanto, se um usuário planeja registrar direitos autorais sobre uma criação gerada pelo DALL-E 3, isso pode envolver considerações adicionais.

Post a Comment

Deixa o seu Comentário

Postagem Anterior Próxima Postagem