Em 27 de junho, a Tencent lançou publicamente um novo membro da família de modelos Hunyuan - o modelo Hunyuan-A13B, e anunciou que será totalmente de código aberto. De acordo com fontes oficiais, o modelo Hunyuan-A13B pode ser implantado em condições extremas com apenas uma placa GPU de médio a baixo custo.

No experimento de raciocínio matemático, o modelo completou comparações decimais com precisão e demonstrou capacidades de análise passo a passo. Demorou 3 segundos para pensar profundamente.
O modelo Hunyuan-A13B também trouxe inovações tecnológicas. No pré-treinamento, o modelo usou um corpus de palavras de rede de alta qualidade de 20 trilhões e melhorou o sistema teórico da Lei de Escala da arquitetura do MoE, fornecendo orientação de engenharia quantificável para o projeto da arquitetura do MoE.
Hunyuan também abriu o código-fonte de dois novos conjuntos de dados para preencher as lacunas nos padrões de avaliação relevantes do setor. Entre eles, o ArtifactsBench é usado principalmente para avaliação de código e constrói um novo benchmark contendo 1.825 tarefas; O C3-Bench projeta 1.024 dados de teste para avaliação do modelo de cena do Agente para descobrir deficiências nos recursos do modelo.

Atualmente, a API do modelo está online no site oficial da Tencent Cloud.