Alibaba sfida DeepSeek: il nuovo AI Qwen 2.5-Max batte GPT-4o e sconvolge il mercato
L’azienda tecnologica cinese Alibaba (9988.HK) ha rilasciato mercoledì una nuova versione del suo modello di intelligenza artificiale Qwen 2.5, affermando…
L’azienda tecnologica cinese Alibaba (9988.HK) ha rilasciato mercoledì una nuova versione del suo modello di intelligenza artificiale Qwen 2.5, affermando che ha superato il molto acclamato DeepSeek-V3.
L’insolito tempismo del rilascio di Qwen 2.5-Max, avvenuto il primo giorno del Capodanno lunare, quando la maggior parte dei cinesi è in ferie e con le proprie famiglie, evidenzia la pressione esercitata dall’ascesa fulminea di DeepSeek nelle ultime tre settimane. Questa crescita ha messo sotto pressione non solo i rivali stranieri, ma anche la concorrenza nazionale.
“Qwen 2.5-Max supera … quasi in tutti gli ambiti GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, ha dichiarato l’unità cloud di Alibaba in un annuncio pubblicato sul suo account ufficiale WeChat, facendo riferimento ai modelli di intelligenza artificiale più avanzati di OpenAI e Meta.
Il rilascio dell’assistente AI di DeepSeek il 10 gennaio, basato sul modello DeepSeek-V3, insieme al lancio del modello R1 il 20 gennaio, ha scioccato la Silicon Valley e causato un calo delle azioni tecnologiche. I presunti bassi costi di sviluppo e utilizzo della startup cinese hanno spinto gli investitori a mettere in discussione i piani di spesa massicci delle principali aziende di IA negli Stati Uniti.
Tuttavia, il successo di DeepSeek ha anche scatenato una corsa tra i suoi concorrenti nazionali per migliorare i propri modelli di intelligenza artificiale.
Due giorni dopo il rilascio di DeepSeek-R1, ByteDance, proprietaria di TikTok, ha aggiornato il suo modello di IA di punta, affermando che superava l’o1 di OpenAI, supportato da Microsoft, nel test di benchmark AIME, che misura la capacità dei modelli di IA di comprendere e rispondere a istruzioni complesse.
Ciò ha rispecchiato l’affermazione di DeepSeek secondo cui il suo modello R1 rivaleggiava con o1 di OpenAI in diversi benchmark di prestazioni.