IA

LongCat 2.0: a IA da Meituan que bateu o GPT-5.5 sem usar chips Nvidia

Susan Hill

O LongCat 2.0 tem 1,6 trilhão de parâmetros, processa uma janela de contexto de um milhão de tokens e superou o GPT-5.5 da OpenAI no principal benchmark de engenharia de software real. Foi construído pela Meituan — empresa que a maioria das pessoas fora da China conhece, quando muito, como app de delivery.

O modelo obteve 59,5 no SWE-bench Pro contra 58,6 do GPT-5.5. A diferença parece pequena, mas o contexto é o que torna o resultado extraordinário: a Meituan treinou o LongCat 2.0 em mais de 50.000 aceleradores de IA de fabricação chinesa, sem nenhum hardware da Nvidia, que a China não consegue importar em quantidade desde 2022. O fabricante não foi confirmado, mas a comunidade técnica aponta para o Huawei Ascend 910B. Se for esse o caso, seria a primeira vez que um modelo treinado em chips da Huawei alcança desempenho de fronteira em benchmarks públicos verificáveis.

O LongCat 2.0 usa arquitetura Mixture-of-Experts: entre 33 e 56 bilhões de parâmetros são ativados por consulta, o que mantém a inferência rápida sem exigir hardware caro. A janela de contexto de um milhão de tokens permite ler uma base de código inteira em uma única sessão. No SWE-bench Multilingual obteve 77,3; no Terminal-Bench, que avalia a navegação em um ambiente Unix real, atingiu 70,8.

Antes do anúncio oficial, o modelo operou no OpenRouter com o nome “Owl Alpha” por cerca de dois meses. Desenvolvedores que o usaram notaram sua capacidade incomum em codificação sem saber sua origem. A Meituan confirmou após o lançamento que o Owl Alpha era o LongCat 2.0 em fase de avaliação.

A licença MIT não conta tudo. Apesar de ser uma das mais abertas disponíveis, os pesos do modelo ainda não foram liberados. Tanto o repositório no GitHub quanto o card no Hugging Face dizem “em breve”. Por enquanto, o acesso ao LongCat 2.0 é só via API hospedada — não dá para baixar, fazer fine-tuning ou rodar localmente.

A Meituan processa mais de 50 milhões de pedidos de comida por dia e desenvolveu silenciosamente um modelo interno chamado Zhichi antes de voltar atenção ao desenvolvimento externo. O LongCat 2.0 é seu primeiro modelo público e, pelo desempenho nos benchmarks, um dos sistemas de programação mais capazes disponíveis com licença aberta.

Quando os pesos chegarem, o LongCat 2.0 entrará em comparação direta com o Llama 4.1 da Meta e o DeepSeek-V4 Pro. A pergunta sobre quais chips domésticos viabilizaram isso terá implicações muito além da comunidade de IA.

Tags: , , , , ,

Discussão

Há 0 comentários.