ChatGPT, que pode desenhar e entender imagens, finalmente chegou...

DALL·E3 está chegando! Além de estar chegando, também será integrado ao ChatGPT.Em outras palavras, além das conversas comuns, da escrita de códigos e da resolução de problemas matemáticos,ChatGPT, que integra o mais recente DALL·E3, desta vez finalmente possui uma função de imagem.

ChatGPT+DALL·E, esta onda é uma aliança forte. Um é o rei sem coroa no modelo de linguagem grande, e o outro também é o líder no modelo gráfico vicentino. O efeito real será inevitavelmente 1+1>2.

Acredita-se que este anúncio oficial repentino tenha preenchido uma grande lacuna no ChatGPT multimodal que foi amplamente divulgado após o lançamento do GPT-4 no início deste ano.

No entanto, a OpenAI só anunciou esta novidade agora.O horário específico de lançamento é outubro. Para usuários das edições Plus e Enterprise, um DALL·E3 separado também será lançado neste outono.

Quão poderosa é essa coisa? Embora ainda não possamos começar, a julgar pelos exemplos divulgados pela OpenAI, ainda é bastante explosivo.

Entre eles, alguns internautas entusiasmados ligaram diretamente para Midjourney e alimentaram-no com as palavras de exemplo de DALL·E3 para que pudessem competir diretamente.

E o resultado só pode ser dito:O meio da jornada está em perigo.

O primeiro é um meme médico de abacate muito clássico. A dica é: um abacate está sentado na cadeira de um terapeuta, dizendo: "Sinto-me tão vazio por dentro". Há um buraco do tamanho de uma pequena cratera no meio do abacate. Terapeuta, colher, notas de rabisco.

Embora à primeira vista pareçam ser dois estilos diferentes. Mas se compararmos cuidadosamente as palavras imediatas, é óbvio queMidjourney ignora as notas do terapeuta, da colher e do graffiti. O texto na caixa de diálogo também é escrito aleatoriamente e não atende aos requisitos.

Eles foram então solicitados a gerar a imagem de um coração translúcido e a ter uma citação específica gravada embaixo do coração.

Dica: Esta é a ilustração de um coração humano feito de vidro translúcido, sobre um pedestal em um oceano tempestuoso. A luz do sol penetra nas nuvens e ilumina a alma, revelando o minúsculo universo interior. A citação “Descubra o universo dentro de você” está inscrita em negrito na base.

Não há dúvida de que DALL·E3 derrotou mais uma vez Midjourney desta vez.Além de não gravar os caracteres conforme necessário, Midjourney também não conseguiu mostrar detalhes como o oceano tempestuoso e o microcosmo interno.

Aqui está outra foto de uma cadeira esférica inspirada na lichia, com detalhes que pedem um exterior branco e acidentado e um interior macio que contrasta com o papel de parede tropical atrás dela.

Isso dá vida a todos os elementos da imagem gerada por eles.Mas Midjourney parece ter entendido mal a diferença entre papel de parede tropical e floresta tropical.

É claro que entender mal as palavras imediatas e tirá-las do contexto equivale às doenças crônicas do anterior modelo de diagrama vicentino.

Basta dar à luz um caranguejo como um caranguejo eremita...

Pedir para gerar uma faixa florestal antropomórfica 2D resultou em uma imagem 3D...

Quanto a estes problemas antigos, de acordo com a própria declaração da OpenAI e os exemplos dados, esta situação basicamente não existe no novo DALL·E3.

Além de resolver problemas antigos, DALL·E3 também atualizou a textura da versão original de segunda geração.

Por exemplo, deixe-os desenhar a cena de um jogador de basquete mergulhando, com o elemento sendo uma explosão no céu estrelado.

Originalmente, as imagens geradas pelo DALL·E2 já atendiam aos requisitos. Inesperadamente, o DALL·E3 atualizado ficou mais realista, com detalhes como linhas musculares e as cores do universo exibidas uma a uma. Foi realmente um golpe para a redução da dimensionalidade.

Esquerda: DALL·E2, direita: DALL·E3

Geral,Com o suporte do ChatGPT, a capacidade de compreensão do idioma do DALL·E3 é maximizada e é quase impossível vencer.

A versão atualizada do ChatGPT não apenas não perde pontos de informação importantes, mas mesmo se você digitar apenas algumas palavras-chave aqui e ali, ele pode completar automaticamente a descrição para você e então deixar o DALL·E3 gerar a imagem.

OpenAI compreendeu a essência do “deserto cultural” dos internautas contemporâneos (cabeça de cachorro).

É claro que a integração do DALL·E3 e do ChatGPT não é apenas tão simples quanto ser capaz de compreender melhor a fala humana, mas também produzirá algumas faíscas maravilhosas.

Por exemplo, a versão atualizada do ChatGPT também possui recursos de compreensão de contexto em desenho e pode até ser usada diretamente como ferramenta de produtividade.

Para ver exatamente o quão poderoso ele é, o site oficial da OpenAI disponibiliza um vídeo de demonstração. Para ser sincero, depois de assistir, Shichao ficou preocupado com o trabalho de ilustrador.

Primeiro, deixe o ChatGPT gerar um super ouriço de girassol. Isso lhe dará quatro fotos. Depois de escolher o que mais gosta, você pode prosseguir para a próxima etapa da conversa.

Em seguida, nomeie o ouriço como Larry e deixe o ChatGPT gerar mais algumas fotos dele.

A seguir, vamos aumentar a dificuldade e criar uma cena para mostrar a casa de Larry.

Este pode mostrar diretamente a força do DALL·E3+ChatGPT. Não apenas a aparência de Larry permanece a mesma (isso pode ter mudado para outras IAs), mas a caixa de correio na porta também tem o nome “LARRY” escrito nela.

Além disso, descrever as características de Larry, usar fotos para mostrar seu amor e até mesmo fazer os periféricos de Larry e desenhar alguns adesivos são fáceis para o ChatGPT.

Por fim, deixe-o organizar uma história para dormir e uma pose final. ChatGPT também está ao seu alcance. u1s1 Fiquei realmente chocado com esse diálogo sedoso...

Vendo isso, Shichao de repente teve uma nova inspiração. Depois, o artigo que escrevemos poderia ser jogado diretamente no ChatGPT e deixá-lo extrair as palavras-chave para fazer a capa.

Se você tiver algum requisito especial, pode informar o ChatGPT diretamente. Você também pode lançar fotos de referência para ele. Habilidades de pesca +1+1...

Mais perto de casa, os efeitos acima mencionados são demonstrados apenas unilateralmente pela OpenAI. Como ele realmente será usado não será conhecido até que esteja online em outubro. Estima-se que até então haverá uma onda de técnicas ocultas desenvolvidas por internautas. Apenas espere e veja.

Além disso, quando se trata de pintura de IA, ainda existe um tema comum que não pode ser evitado: questões de direitos autorais.

OpenAI ainda mantém sua posição anterior.Assim como a segunda versão, as imagens geradas com DALL·E3 podem ser utilizadas sem permissão e podem ser utilizadas comercialmente.

No entanto, tendo aprendido muito com o passado, a OpenAI é um pouco esperta desta vez, dizendo que os artistas podem optar por recusar que as suas obras sejam enviadas ao DALL·E, desde que preencham um formulário.

Embora isso signifique de certa forma “não recusar é concordar”, mas comparado a antes, pelo menos os artistas não são mais tão passivos...

DALL·E também tem contramedidas contra as pinturas anteriores de IA na Internet que invadiram a privacidade de figuras públicas e outras questões tendenciosas:No uso real, o ChatGPT rejeitará diretamente solicitações com o nome de uma figura pública no prompt.

Em outras palavras, provavelmente não veremos fotos divertidas como esta no ChatGPT...

E também formaram uma “equipe vermelha” para avaliar e reduzir os riscos que podem surgir do modelo nas diversas etapas.

Por fim, a OpenAI também afirmou em seu site oficial que está trabalhando em uma ferramenta para identificar desenhos de IA, que pode determinar quais imagens foram geradas pelo DALL·E3.

(Só espero que não seja como a ferramenta anterior de reconhecimento de texto por IA, porque era inútil e morreu no meio do caminho...

Em geral, ChatGPT com função gráfica Vincent é suficiente para despertar uma onda de entusiasmo no círculo de IA, e essa onda é a versão atualizada integrada do DALL·E3, que é difícil não ser emocionante. De qualquer forma, Shichao mal pode esperar para experimentar.

Mas algumas pessoas estão felizes e outras preocupadas. Esta onda de OpenAI mais uma vez deixou seus pares por um longo caminho. Após a atualização de outubro, estima-se que muitas startups de IA serão esmagadas sob as rodas do ChatGPT...