O modelo GPT Image 2 mais recente da OpenAI,Teve um desempenho surpreendente na avaliação oficial de Wenshengtu, ultrapassando com sucesso o Google Nano Banana2 e conquistando o primeiro lugar no mundo.Este modelo foi lançado oficialmente em 21 de abril. Após muitos meses de atualizações iterativas, a qualidade da imagem, a compreensão e os recursos de restauração de detalhes foram bastante aprimorados.

Os dados de avaliação do SuperCLUE mostram que,GPT Image 2 alcançou o topo em muitas dimensões essenciais, como geração de caracteres chineses, reprodução da realidade e qualidade de imagem, e seu desempenho é impressionante.
Sua capacidade de geração de caracteres chineses atinge 93,07 pontos, com precisão de texto completo. Quer se trate de letras de selo em porcelana azul e branca ou fontes douradas em material acrílico, elas podem ser perfeitamente integradas sem sensação de suspensão, resolvendo completamente o problema dos caracteres chineses distorcidos gerados por modelos estrangeiros.

Geração de caracteres chineses – ajuste de imagem e texto

Geração de caracteres chineses – ajuste de imagem e texto
Em termos de restauração de cenas, o modelo pode reproduzir com precisão cenas complexas, como padarias antigas e ferreiros do patrimônio cultural imaterial, com detalhes realistas e naturais. Ao mesmo tempo, ele tem uma boa compreensão de palavras longas e requisitos de raciocínio lógico, e pode gerar com precisão imagens profissionais, como diagramas esquemáticos científicos e designs de pôsteres, e tem um alto grau de conformidade com as instruções.

Reprodução de cena física
Comparado com o produto da geração anterior, o GPT Image 2 melhorou significativamente a consistência da imagem e do texto e a geração de caracteres chineses, superando o modelo da geração anterior em todos os aspectos. Comparado com produtos concorrentes como Google e Baidu, também alcançou liderança em múltiplas dimensões, especialmente no raciocínio criativo e na reprodução da realidade.
Atualmente, o modelo ainda precisa ser otimizado em aspectos como compreensão das relações espaciais e raciocínio do conhecimento, mas o modelo geral atingiu o nível mais alto da indústria, marcando uma nova etapa da tecnologia gráfica vicentina.

Comparação das pontuações das dimensões de primeiro nível dos modelos principais nacionais e estrangeiros