De acordo com as últimas notícias de um grande fabricante, a Meituan emitiu um aviso interno para restringir o uso de modelos grandes de pufes. O aviso mostra que todas as equipes de negócios precisam concluir o autoexame dos negócios existentes relacionados ao beanbag e planejar migrar para modelos como LongCat e DeepSeek. Se não puderem migrar do modelo grande do vulcão (doubao), deverão apresentar um motivo + explicação da necessidade e passar por um processo de aprovação separado.

Entende-se que esta não é a primeira vez que a Meituan restringe o limite para o uso de grandes modelos externos. Em abril deste ano, a Meituan fez ajustes no uso de grandes modelos internos e não recomenda mais que as empresas utilizem o modelo Qwen fornecido pelo Alibaba Cloud. Se a empresa ainda precisar usá-lo, os motivos detalhados do uso deverão ser submetidos e relatados ao nível X3 (nível chefe) para aprovação.

Informações públicas mostram que LongCat é um grande modelo de linguagem desenvolvido de forma independente pela Meituan. A pesquisa e o desenvolvimento foram lançados em 2023. Tem sido de código aberto e profundamente utilizado em vários cenários de negócios dentro da Meituan, incluindo o assistente de IA integrado do APP "Xiaotuan", assistente de operação comercial, etc.

Recentemente, a Meituan lançou uma nova geração do grande modelo LongCat-2.0 de trilhões de parâmetros, que será de código aberto. Como um modelo de trilhão de parâmetros que completa o treinamento e inferência de processo completo em um cluster de computação doméstico de 50.000 ka (parâmetros totais 1,6T, ativação média de cerca de 48B, faixa dinâmica 33B ~ 56B), a escala de dados de pré-treinamento LongCat-2.0 excede 30T tokens, cobrindo vários tipos de dados, como chinês, inglês, multilíngue e código, e suporta nativamente contexto ultralongo de 1M.