OpenAI lança DALL-E 3, um gerador de imagens baseado em texto

A OpenAI, empresa responsável pelo chatbot ChatGPT, anunciou na quarta-feira o lançamento do DALL-E 3, seu mais novo modelo de geração de imagens a partir de texto.

O modelo é capaz de compreender solicitações complexas e produzir imagens correspondentes com alta qualidade e fidelidade.

O DALL-E 3 é uma evolução dos modelos anteriores da OpenAI, como o DALL-E e o DALL-E 2, que já demonstravam a capacidade de gerar imagens a partir de texto, mas com limitações na precisão e na variedade. O novo modelo supera essas limitações e consegue capturar palavras e descrições específicas, sem exigir que os usuários tenham habilidades de engenharia para obter os resultados desejados.

Em um evento para repórteres, a OpenAI mostrou alguns exemplos impressionantes do que o DALL-E 3 pode fazer. Um deles foi uma imagem gerada a partir da instrução: “Um bobo da corte rosa dando um high five para um panda durante uma competição de ciclismo. As bicicletas são feitas de queijo e o chão é muito lamacento.

Eles estão dirigindo em uma floresta nebulosa. O panda está com raiva.” A imagem resultante surpreendeu pela sua fidelidade ao pedido, que havia sido vazado no Discord no início do verão.

here is dalle 3, which imo is quite amazing: https://t.co/UcPPehWxnQ

it will ramp to all chatgpt+ users over the next couple of weeks.

fantastic work by @model_mechanic (head of dall-e), @neobjb @gabeeeegoooh @jingli911 (the other lead dalle ICs), and the entire team. pic.twitter.com/8wtWffpXkQ
— Sam Altman (@sama) September 20, 2023

Outro exemplo foi um cartoon compartilhado pelo CEO da OpenAI, Sam Altman, que mostrava um diálogo entre dois personagens em um cenário futurista. O texto do cartoon foi gerado pelo ChatGPT, enquanto as imagens foram geradas pelo DALL-E 3. O modelo demonstrou a capacidade notável de incorporar texto coerente em suas criações, além de detalhes visuais como cores, formas e expressões faciais.

A OpenAI planeja integrar o DALL-E 3 diretamente ao ChatGPT+, permitindo que o chatbot alterne entre os modelos conforme o conteúdo do prompt. Isso significa que os usuários poderão solicitar ao ChatGPT+ que gere imagens a partir de texto, ou que use texto extraído de diversas fontes para gerar imagens.

A OpenAI também anunciou que o DALL-E 3 estará disponível para todos os usuários do ChatGPT+ nas próximas semanas, sem reivindicar direitos autorais sobre os resultados gerados pelo modelo. No entanto, se um usuário planeja registrar direitos autorais sobre uma criação gerada pelo DALL-E 3, isso pode envolver considerações adicionais.

OpenAI lança DALL-E 3, um gerador de imagens baseado em texto

Post a Comment

Enviar um comentário

Formulário de Contacto