A Naver anunciou oficialmente que removerá completamente o codificador visual chinês Alibaba Qwen 2.5 usado em seu modelo de IA e o substituirá completamente por um codificador visual desenvolvido por ele mesmo.A Naver Cloud concluiu o desenvolvimento de seu codificador visual autodesenvolvido no início do mês passado e iniciou o trabalho de internalização, com planos de aplicá-lo totalmente a todos os modelos multimodais no futuro.
Naver disse que o novo codificador foi bastante aprimorado com base na tecnologia original "VUClip" da Naver, e seu desempenho atingiu um nível comparável ao do modelo top do mundo Qwen.
O codificador visual é um módulo de IA multimodal que converte informações de imagem e vídeo em formatos de dados compreensíveis e é chamado de “nervo óptico” do modelo.
No início do ano, quando Naver participou do projeto de modelo básico de IA independente liderado pelo governo coreano, causou polêmica ao usar parcialmente o codificador visual do Alibaba Qwen 2.5 no modelo HyperCLOVA X SEED 32B Sync.
Em 15 de janeiro, o Ministério da Ciência, Tecnologia, Informação e Comunicações da Coreia do Sul anunciou os resultados da primeira ronda de avaliação. O Naver Cloud foi eliminado diretamente devido à originalidade do modelo e independência técnica insuficientes. O NC AI também foi eliminado junto com ele.
Na época, Naver argumentou que “o codificador visual pode ser substituído a qualquer momento e não é um componente central insubstituível”.
Quatro meses depois, o novo codificador da Naver foi lançado. Seu maior destaque é que foi desenhado tendo o coreano como centro desde a etapa de treinamento, conectando imagens e coreano diretamente sem passar por uma camada intermediária de tradução.
O responsável pela Naver Cloud enfatizou que ao processar dados visuais contendo geografia, cultura ou nomes próprios coreanos, o novo codificador pode evitar a distorção das informações durante o processo de tradução.
No entanto, o plano de substituição do codificador para o modelo HyperCLOVA X SEED 32B Sync que foi lançado como código aberto ainda não foi determinado.
