duas pessoas com VR competem pelo desafio do alibaba do globo deepseek qwen 2.5

Qwen 2.5: A IA do Alibaba desafia o DeepSeek e muito mais

O Alibaba está fazendo um forte retorno ao espaço da IA: seu novo modelo Qwen 2.5-Max supera o DeepSeek em vários benchmarks no papel, assim como outros modelos da Open.ai e do Google. Será que isso será suficiente para tornar a Qwen realmente competitiva em nível global?
14 fevereiro 2025

O Alibaba acaba de lançar o Qwen 2.5, mesmo na sua versão Max. Estamos falando de um modelo de inteligência artificial que está em competição direta com o grande tecnologia Os ocidentais que conhecemos bem – como Open.ai e Google – mas acima de tudo com o seu compatriota DeepSeek, que ofereceu um modelo de código aberto competitivo e extraordinariamente mais barato.

Isso primeiro criou estragos na bolsa de valores e no mercado global de IA, depois atraiu a atenção dos reguladores de privacidade europeus e norte-americanos. Isso levou a acusações, proibições e restrições. Além de luzes, sombras e proibições, DeepSeek em alguns dias deixou um impacto indelével na forma como concebemos e desfrutamos da inteligência artificial.

No campo deste guerra tecnológica Surge o Alibaba – um gigante chinês que nem precisa de ser apresentado – declarando em termos simples que Seu AI Qwen 2.5-Max coloca o DeepSeek na linha e que causa dificuldades aos gigantes ocidentais.

Mas além da flexão muscular: É realmente assim? 

O Qwen 2.5-Max é realmente tão competitivo quanto o Alibaba afirma?

Primeiro O Qwen 2.5-Max é treinado em mais de 20 trilhões de tokens. Isto significa que o modelo foi alimentado com uma quantidade enorme de informação. Portanto, no papel, o Qwen 2.5-Max tem excelente conhecimento, coerência e capacidade de raciocínio.

No entanto, mais dados eles também implicam maiores custos computacionais e possíveis vieses, especialmente se o conjunto de dados não estiver bem organizado. Então a qualidade dos dados é mais importante que a quantidade: um fator que já corre o risco de esvaziar os pequenos músculos do pai de Qwen.

Mas o Alibaba sabe disso muito bem. Então o dele Qwen 2.5-Max usa uma arquitetura MoE, que ativa apenas as partes do modelo que são relevantes para cada tarefa. Isto implica eficiência computacional, que envolve:

  • menor consumo de recursos.
  • menor consumo de energia,
  • redução de custos operacionais,
  • redução do impacto ambiental,
  • velocidade de cálculo mais rápida,
  • mais econômico, porque o custo por token processado pode ser menor do que os modelos que usam todos os parâmetros em cada solicitação.

Benefícios que sem dúvida ajudam a compensar. Além disso o modelo foi ainda mais refinado através de técnicas de PFTS (refinamento supervisionado com dados rotulados por especialistas para melhorar a qualidade das respostas) e RLHF (treinamento por meio de feedback humano para tornar as respostas mais naturais e alinhadas às preferências do usuário). Intervenções que devem, portanto, garantir respostas mais precisas e alinhadas às preferências humanas.

Sobre isso e sobre a compreensão da linguagem, AI Qwen 2.5-Max provou ser superior ao DeepSeek em vários benchmarks e dá trabalho para outros grandes players ocidentais.

resultados de benchmark de gráficos coloridos qwen 2.5 max vs deepseek e outros ai
Créditos: Alibaba

Então sim: Qwen 2.5-Max é realmente competitivo, como diz o Alibaba…mas benchmarks e tokens não são tudo. A batalha entre possibilidades de código aberto, integrações de plataforma e eficiência computacional não é mais travada com foco apenas no desempenho puro.

Alibaba vs DeepSeek: O desafio de volta ao lar entre duas filosofias opostas

O DeepSeek, como o Qwen 2.5, é baseado na arquitetura MoE vista antes, mas A IA do Alibaba vence em número de tokens e vários benchmarks. Isso sugere que Qwen é mais poderoso. Mas Não podemos esquecer que o DeepSeek lançou uma IA de código aberto, portanto acessível a desenvolvedores e empresas. Tal estratégia teve um enorme impacto precisamente porque poderia aumentar exponencialmente o progresso e as utilizações da IA… mas e se fosse também acessível?

Não surpreendentemente O DeepSeek foi criticado, mas continua competitivo mesmo assim porque atua em um campo que poucos estão pisando e que pode ganhar cada vez mais a atenção e o reconhecimento das pessoas. Alibaba ele preferiu – a este respeito – permanecer em linha com a IA ocidental, mantendo um certo controlar por conta própria tecnologia, em seu usos e em seu distribuição, Apesar Qwen-VL, Qwen-Audio e Qwen 1.x e 2.x – Lite e Standard – estão disponíveis em código aberto.

Portanto, apenas as versões de menor desempenho do Qwen são de código aberto e suas licenças têm restrições de uso comercial, ao contrário do DeepSeek. Isto denota a oposição de duas filosofias: O DeepSeek escolheu uma estratégia mais voltada para a comunidade, visando democratizar o acesso a modelos avançados de linguagem; Em vez disso, o Alibaba protege sua vantagem competitiva e monetiza por meio de serviços de nuvem e APIs.

O Qwen 2.5-Max pode realmente desafiar os gigantes da IA?

A resposta curta é sim, mas a questão é um pouco mais complexa.

Qwen 2.5-Max tem excelentes capacidades que eles colocaram isso competindo com muitos outros modelos em escala global, mas não é tão avassalador. Além disso, não há dados de comparação além dos dados oficiais publicados pelo próprio Alibaba.

lista negra com resultados de benchmark qwen 2.5 max vs deepseek e llama
Créditos: Alibaba

Portanto, sua ascensão influencia, sem dúvida, o mercado de IA: um campo de batalha difícil – se não impossível – de dominar, e que, como vimos, é caracterizado por outros fatores além do poder. O Alibaba então oferece uma alternativa válida e potencialmente mais acessível comparado aos modelos do Open.ai e do Google, por exemplo, mesmo que continue menos acessível que seu compatriota DeepSeek.

Então você deve considerar que o Qwen 2.5-Max é mais barato que alguns modelos. Basta que você saiba que Qwen 2.5-máx. tem um custo de dólares 1,6 por milhão de tokens de entrada e dólares 6,4 por milhão de tokens de saída, contra US$ 5 e US$ 15 por milhão para o Gpt-4. Nesse aspecto, o Qwen 2.5-Max é 2 a 3 vezes mais barato.

Por fim, o Alibaba, para competir com sua IA, está buscando uma integração mais forte com seu próprio ecossistema de nuvem e e-commerce,, favorecendo o mercado asiático.

Portanto, sua capacidade real de se estabelecer como líder global dependerá da qualidade de suas aplicações no mundo real e de sua capacidade de expansão para fora da China..

Quer experimentar o Qwen 2.5-Max? Veja como fazer isso

Para provar Qwen 2.5-máx. Você tem duas opções principais:

  1. Bate-papo Qwen: acesse o modelo diretamente pela interface web do Qwen Chat. Visita bate-papo.qwenlm.ai, selecione “Qwen2.5-Max” no menu suspenso do modelo e comece a interagir com a IA em tempo real. Você pode pesquisar na web gratuitamente, fazer perguntas, traduzir, gerar imagens, vídeos... e se quiser, pode fazer login diretamente com sua conta do Google.

  2. API de nuvem do Alibaba: Para uma integração mais avançada, você pode usar a API Qwen 2.5-Max via Alibaba Cloud. Crie uma conta no Alibaba Cloud, ative o serviço Model Studio e gere uma chave de API. A API é compatível com o formato OpenAI, facilitando a implementação pelos desenvolvedores. Para detalhes de implementação, consulte o documentação oficial.

Eu, que estou escrevendo para você, obviamente me diverti um pouco com o bate-papo…

Compartilhe o artigo:

agência web kilobit Logotipo de Turim

Nós Kilobit somos uma rede de profissionais com experiência em programação, marketing digital, criação de produtos multimídia e redação de conteúdos-chave SEO.

Disponibilizamos nossas décadas de experiência em diversos setores para um atendimento personalizado 360°. Temos as ferramentas certas para colocar o seu negócio no mercado e decolar web.

Tel. 0110268815
info@kilobit.it
Via Luigi Cibrario, 40 10144 TURIM

Talvez eles pudessem interessado também

Confie no nosso especialistas

A nossa cotação é sempre gratuita.

Dai un'occhiata al nostro pasta

Siga-nos no nosso redes sociais

Tags: