Gli annunci della startup tecnologica cinese DeepSeek, che ha detto di avere definito un sistema in grado di garantire alti livelli di utilizzabilità a un costo molto inferiore a quelli oggi in uso, ieri hanno avuto l'effetto di un terremoto sui mercati azionari, dando nuova linfa alla competizione economica e geopolitica tra Stati Uniti e Cina nello sviluppo della tecnologia di IA.
Cos'é DeepSeek, la startup cinese che sta sconvolgendo il settore dell'IA?
Ieri l'assistente AI di DeepSeek è diventata l'app gratuita più scaricata sullo store iPhone di Apple, spinta dalla curiosità per il concorrente ChatGPT. Ad alimentare il dibattito che la sola idea che la startup cinese abbia raggiunto le aziende americane all'avanguardia dell'AI generativa a una frazione del costo.
Se ciò fosse vero, metterebbe in discussione le ingenti somme di denaro che le aziende tecnologiche statunitensi affermano di voler spendere nei data center e nei chip per computer necessari per alimentare ulteriori progressi nell'intelligenza artificiale. Gli analisti ammettono che i risultati ottenuti dall'azienda cinese sono ottimi, ma non rientrano nella categoria dei ''miracoli'', non usando innovazioni sconosciute o segrete.
La startup DeepSeek è stata fondata nel 2023 a Hangzhou, in Cina, e ha rilasciato il suo primo modello di linguaggio AI di grandi dimensioni più tardi nello stesso anno. Il suo CEO Liang Wenfeng in precedenza aveva co-fondato uno dei principali hedge fund cinesi, High-Flyer, che si concentra sul trading quantitativo guidato dall'AI. Il fondo, entro il 2022, aveva accumulato un cluster di 10.000 chip di elaborazione grafica A100 ad alte prestazioni di Nvidia con sede in California, utilizzati per costruire ed eseguire sistemi AI, secondo un post di quell'estate sulla piattaforma di social media cinese WeChat. Gli Stati Uniti subito dopo hanno limitato le vendite di quei chip alla Cina.
DeepSeek ha affermato che i suoi modelli più recenti sono stati realizzati con i chip H800 di Nvidia dalle prestazioni inferiori, che non sono vietati in Cina, il che fa intendere che l'hardware più sofisticato potrebbe non essere necessario per la ricerca all'avanguardia sull'intelligenza artificiale.
L'azienda cinese il mese scorso ha rilasciato un nuovo modello di intelligenza artificiale sostenendo che fosse alla pari con modelli simili di aziende statunitensi come il produttore di ChatGPT OpenAI, ed era più conveniente nell'uso di costosi chip Nvidia per addestrare il sistema su grandi quantità di dati. Il chatbot è diventato più ampiamente accessibile quando è apparso sugli app store di Apple e Google all'inizio di quest'anno.
Ma a fare sensazione è stato un documento, pubblicato nel giorno dell'insediamento di Donald Trump, nel quale Deep Seek riferiva di un altro modello di intelligenza artificiale, l'R1, che mostrava capacità di "ragionamento" avanzate, come la capacità di ripensare il suo approccio a un problema matematico, ed era significativamente più economico di un modello simile venduto da OpenAI chiamato o1.
L'attenzione su DeepSeek minaccia anche di minare una strategia chiave della politica estera statunitense degli ultimi anni, volta a limitare la vendita di semiconduttori AI di progettazione americana alla Cina. Alcuni esperti di relazioni tra Stati Uniti e Cina non pensano che si tratti di un incidente.
La scorsa settimana, nel suo primo giorno in carica, Trump ha firmato un ordine in cui afferma che la sua amministrazione avrebbe "individuato ed eliminato le scappatoie negli attuali controlli sulle esportazioni", segnalando che è probabile che continuerà e irrigidirà l'approccio di Biden.
Le azioni di Nvidia sono scese ieri del 17%, ma ieri la società in una dichiarazione ha elogiato il lavoro di DeepSeek definendolo "un eccellente progresso dell'intelligenza artificiale" che ha sfruttato "modelli ampiamente disponibili e un calcolo pienamente conforme al controllo delle esportazioni".
Una cosa che distingue DeepSeek dai concorrenti come OpenAI è che i suoi modelli sono "open source", il che significa che i componenti chiave sono accessibili e modificabili da chiunque, anche se l'azienda non ha divulgato i dati utilizzati per l'addestramento.