Quale futuro per DeepSeek? Mistral farà la stessa fine di Adept e Inflection?

Notizie dal futuro, la rubrica di Paola Pisano, professore associato di Economia e Gestione delle Imprese all’Università di Torino e già Ministro dell’innovazione tecnologica e della digitalizzazione. Un viaggio attorno al mondo su tecnologia, intelligenza artificiale ed ecosistemi hi-tech

Feb 5, 2025 - 05:52
 0
Quale futuro per DeepSeek? Mistral farà la stessa fine di Adept e Inflection?

Notizie attorno al mondo, con l’innovazione come denominatore comune. Sono quelle raccolte tutti i mercoledì sui profili social di Paola Pisano, tra questi LinkedIn e Instagram, nel tentativo di comprendere dove ci porterà la tecnologia e qual è il suo ruolo nella vita di istituzioni, aziende e semplici cittadini.

pisano notizie dal futuro

Leggi anche: Quali saranno i lavori del futuro? Lemon8 potrebbe essere vietato negli USA come TikTok?

Quale futuro per DeepSeek?

Oltre agli effetti economici sulle più grandi aziende tecnologiche americane, non è chiaro se DeepSeek porterà anche implicazioni per la sicurezza nazionale. I modelli avanzati, ma a basso costo della piattaforma, hanno messo in discussione il consenso secondo cui gli Stati Uniti avevano un netto vantaggio nella corsa all’AI rispetto alla Cina. Leavitt, portavoce della Casa Bianca, ha dichiarato che il presidente Trump considera questa situazione “un campanello d’allarme” per l’industria dell’AI statunitense, ma rimane fiducioso sul fatto che “riporteremo il dominio americano”. La strategia USA di restrizione tecnologica verso la Cina sta davvero funzionando? Il presidente Biden ha emesso una serie di ordini esecutivi per limitare l’accesso delle aziende cinesi ai chip più avanzati e agli strumenti necessari per produrli, proprio per preservare il vantaggio degli Stati Uniti nel settore dei semiconduttori e dell’AI. DeepSeek aveva già ottenuto alcuni dei chip più avanzati di Nvidia prima che queste restrizioni entrassero in vigore, ma afferma comunque di essere riuscita a sviluppare il suo modello con molte meno risorse e potenza di calcolo rispetto ai concorrenti americani.

ezgif 7315bfb6d8b1b

DeepSeek e il Reinforcement Learning

La grande innovazione di DeepSeek è l’automatizzazione della fase di Reinforcement Learning che ricompensa l’AI per la risposta corretta. I modelli di AI sono costruiti in due fasi: nella fase di Pre-training i modelli vengono addestrati su enormi set di dati per prevedere la parola successiva in una frase mentre nella fase di Post-training gli sviluppatori insegnano al modello a seguire istruzioni specifiche, come risolve problemi matematici o scrivere codice. Uno dei metodi più efficaci per migliorare le risposte di un’AI è il “Reinforcement Learning from Human Feedback” (RLHF), processo costoso, lento che richiede un gran numero di etichettatori di dati umani. Deepseek lo ha reso automatico con l’apprendimento per rinforzo (RL). E i modelli di AI stanno diventando sempre più autonomi e adattivi? DeepSeek ha utilizzato l’apprendimento per rinforzo (RL) per premiare il modello, assegnandogli un “pollice in su” ogni volta che genera una risposta corretta. L’azienda cinese ha scoperto che ripetendo questo processo più volte, il modello inizia spontaneamente a risolvere problemi senza supervisione umana. Questa stessa tecnica è stata utilizzata da Google DeepMind per sviluppare AlphaGo, l’AI che ha sconfitto i campioni umani nel gioco da tavolo Go, dando il via all’attuale boom delle tecniche di deep learning quasi un decennio fa.

Sarà l’America a copiare la Cina sull’AI?

DeepSeek dimostra che i modelli di intelligenza artificiale competitivi possono essere costruiti a un costo molto inferiore rispetto a quanto si pensava. Mentre OpenAI e Google investono miliardi di dollari per costruire modelli di linguaggio su larga scala, DeepSeek sta sviluppando modelli più piccoli che possono funzionare su smartphone o browser web, distillando le capacità di ragionamento dei modelli più grandi. Questi modelli ridotti hanno ottenuto ottimi punteggi nei benchmark di ragionamento, in alcuni casi superando modelli di punta come Claude di Anthropic. Sarà l’America a copiare dalla Cina? Mentre DeepSeek è stata la prima a utilizzare queste tecniche, altri laboratori di AI stanno già cercando di replicare il suo successo, tra cui Hugging Face. Anche aziende statunitensi stanno esplorando modi per ottimizzare i loro modelli. Google, ad esempio, ha lanciato Gemma, un modello più leggero basato su Gemini. Questa evoluzione potrebbe essere una grande opportunità per gli sviluppatori di app, offrendo un modo economico ed efficiente per costruire nuovi prodotti basati sull’IA.

gemini app

Mistral farà la stessa fine di Adept e Inflection?

Mistral AI ha realizzato il primo e unico modello di intelligenza artificiale europeo. Fin dalla sua fondazione, Mistral è stata strettamente legata alla questione della competitività tecnologica europea. Sebbene il continente ospiti promettenti startup AI — come Wayve (UK), DeepL e Black Forest Labs (Germania) e Poolside (Francia) — nessuna di queste sta lavorando su modelli linguistici di grandi dimensioni (LLM), la tecnologia alla base di ChatGPT. In passato, Aleph Alpha, che era considerata la grande speranza della Germania nel settore LLM, ha abbandonato il settore nel 2024, lasciando Mistral come l’unico player europeo significativo in questo mercato. Mistral farà la stessa fine di Adept e Inflection — startup AI promettenti che sono state acquisite dalle Big Tech per assorbirne i talenti? Mistral si trova ora in un limbo: ha raccolto troppi finanziamenti per scomparire nell’ombra, ma non abbastanza per competere con i giganti dell’AI come OpenAI, Google e DeepSeek. Mistral conta circa 150 dipendenti, rispetto alle migliaia di ingegneri impiegati dai suoi rivali statunitensi. Se Mistral dovesse fallire, allora le aziende e i consumatori europei non avrebbero altra scelta che dipendere esclusivamente dalle piattaforme americane o cinesi.