De acordo com o Weibo oficial da Bytedance Seed, a equipe da Bytedance Seed lançou oficialmente uma nova geração do modelo de criação de imagens Seedream 4.0. Segundo relatos, o Seedream 4.0 usa a mesma arquitetura para implementar recursos gráficos e de edição geral, integrando bom senso e capacidades de raciocínio. Comparado com os modelos da geração anterior Seedream 3.0 e SeedEdit 3.0, o Seedream 4.0 alcançou avanços significativos em efeitos multimodais, velocidade e usabilidade:


Expansão de jogabilidade multimodal: suporta com flexibilidade a entrada combinada de texto e imagens, permitindo modos criativos, como imagens baseadas em texto, imagens baseadas em imagens, edição de imagens, edição de múltiplas imagens e geração de imagens em grupo. A jogabilidade é criativa e diversificada.

Estética estilizada aprimorada: Suporta um alto grau de liberdade na migração de estilos artísticos, do barroco ao cyberpunk, os estilos estão em constante mudança e podem ser combinados para criar novos estilos com estética excepcional.

Compreensão lógica aprimorada: Combinado com o conhecimento mundial, melhora a compreensão de entradas multimodais. Consegue “desenhar” e “pensar” primeiro, mostrando capacidade de raciocínio e geração em tarefas que envolvem restrições físicas e de tempo, resolvendo quebra-cabeças e palavras cruzadas e continuando a escrever quadrinhos.

Geração adaptativa e 4K: A imagem com melhor proporção pode ser gerada de acordo com instruções ou imagens de referência e também suporta tamanhos definidos pelo usuário. A resolução máxima se estende de 2K a 4K Ultra HD.

Salto na velocidade de inferência: Através de um novo e eficiente design de arquitetura e extrema aceleração de destilação, a velocidade de inferência dos gráficos gerados pelo DiT é mais de 10 vezes maior que a do Seedream 3.0.

Segundo o Weibo oficial, o Seedream 4.0 não é apenas um modelo de geração de imagens, mas também um mecanismo criativo multimodal completo. Com base nos recursos mais recentes do Seedream 4.0, são propostos oito métodos básicos de jogo do modelo. Além da geração e edição geral de imagens, também é explorado o potencial do modelo na criação de derivadas, geração de inferências e aplicações profissionais.