Ultime notizie
Il caso DeepSeek e le implicazioni per il mondo dell’intelligenza artificiale
A cura di Anjali Bastianpillai, Senior Product Specialist di Pictet Asset Management
DeepSeek R1 è un innovativo modello di ragionamento sviluppato da un laboratorio cinese di Intelligenza Artificiale. Questo nuovo LLM open-source, secondo quanto dichiarato, utilizza un numero ridotto di GPU più datate, combinando l'apprendimento per rinforzo con altri processi, anziché fare affidamento su enormi set di dati comunemente utilizzati per generare un LLM. DeepSeek R1 si distingue per la sua qualità, paragonabile a modelli di Intelligenza Artificiale occidentali come ChatGPT di OpenAI, CoPilot di Microsoft, Claude di Anthropic, Gemini di Google e Grok di X.ai, pur costando solo tra il 3 e il 5% degli equivalenti statunitensi. Attualmente gratuito e open-source, DeepSeek R1 ha già raggiunto una notevole diffusione, diventando rapidamente popolare e conquistando la vetta dell'App Store di Apple nel fine settimana.
DeepSeek e il confronto con i modelli occidentali
I confronti con i modelli di Intelligenza Artificiale occidentali sono positivi, in aree come il ragionamento e l'accesso al web. Il modello GPT-4o standard di ChatGPT, per esempio, non prevede ancora il ragionamento; OpenAI permette infatti di ragionare solo nelle versioni più avanzate, ma a un costo di abbonamento di 200 dollari al mese. DeepSeek garantisce invece la stessa funzione gratuitamente. Inoltre, quest’ultimo supera il modello OpenAI in alcuni importanti benchmark matematici e scientifici.
Tuttavia, è molto indietro per quanto riguarda la conoscenza generale e la capacità di rispondere a semplici domande fattuali. Inoltre, non utilizza dati aggiornati e ha problemi di censura, il che probabilmente ne limiterà l'adozione nei mercati occidentali. Ma soprattutto, DeepSeek non sta spingendo la frontiera dei modelli di IA, ma sta solo rendendo più economici quelli esistenti. L'aspetto più rilevante per noi è che, poiché DeepSeek ha reso pubblici i suoi metodi di addestramento, queste tecniche possono essere apprese e applicate dall'intero settore, ottimizzando così l'efficienza di addestramento e inferenza dei modelli esistenti. È importante ricordare che i costi di inferenza per i modelli esistenti sono diminuiti di dieci volte all'anno a partire dal 2022. Pertanto, possiamo interpretare questa situazione come un'accelerazione di una tendenza già in atto. Nel complesso, l'economia dell'IA si sta evolvendo.
L'IA cinese utilizza una frazione degli investimenti e della potenza di calcolo richiesti dai modelli di IA occidentali, con un costo dichiarato di circa 2 Rmb (0,27€ ca.) per token di output. L'azienda sostiene di aver speso solo 5,6 milioni di dollari per addestrare il modello. A causa della scarsa trasparenza di alcuni processi in Cina, è difficile avere la certezza del livello effettivo di investimento dietro DeepSeek, rispetto alla cifra riportata di 5,6 milioni di dollari per l'addestramento. È infatti probabile che sia più alto, ma rimane inferiore all'investimento nei modelli di formazione occidentali, che al momento preoccupano il mercato.
Semiconduttori e robotica: impatti a breve e lungo termine
Anche se è presto per fornire un feedback completo, riteniamo che il caso DeepSeek possa avere un impatto a breve termine, mentre sul lungo periodo rimaniamo positivi su IA e computing (progettazione di semiconduttori all'avanguardia, software semi, produzione di semiconduttori e attrezzature). Vediamo tuttavia un impatto limitato sui settori automotive e industriale. L'IA e l'informatica (semiconduttori all'avanguardia) potrebbero influenzare la domanda di chip, anche se non direttamente guidata da DeepSeek. La possibilità di offrire un modello di IA gratuitamente, con un investimento ridotto, potrebbe spingere le aziende occidentali a rivedere i propri modelli per garantirne la sostenibilità finanziaria. Questo dovrebbe avere un impatto su alcune aziende di software enterprise che potrebbero non essere competitive a causa di un modello di abbonamento ad alto prezzo. Ciò potrebbe indurle a utilizzare in modo più efficiente le risorse di calcolo, il che avrebbe un impatto sugli investimenti in hardware legati all'IA nel breve termine, compresa la domanda di chip. Tuttavia, a lungo termine, la riduzione dei costi di inferenza dell'IA stimolerà probabilmente ancora di più l'adozione di software di IA, con conseguente aumento della domanda futura di chip all'avanguardia. La catena di fornitura dei semiconduttori potrebbe subire un impatto, ma ciò potrebbe tradursi in una razionalizzazione dell'offerta nella seconda metà del 2025, amplificata in caso di debolezza della domanda finale rispetto alle aspettative, in parte innescate dal lancio di DeepSeek R1. Tuttavia, le aspettative per il WFE (World Federation of Exchanges) sono già state ridotte negli ultimi sei mesi, dato che i mercati principali dei PC e degli smartphone mostrano debolezza. Questo potrebbe quindi limitare l'impatto complessivo sui produttori di apparecchiature per semiconduttori.
L'impatto delle restrizioni commerciali è limitato, poiché, rendendolo un modello open-source, gli sviluppatori cinesi hanno limitato le opzioni del governo statunitense nel contrastare DeepSeek e la sua capacità di diffusione. Sebbene non sia impossibile vietare del tutto DeepSeek negli Stati Uniti (come l’Amministrazione Trump sta cercando di fare con il ban di TikTok), sarebbe difficile frenare la proliferazione di un modello di Intelligenza Artificiale open-source simile a DeepSeek che utilizza meno risorse di calcolo, anche senza il coinvolgimento della Cina. Al contrario, è probabile che ci sia una pressione politica ancora maggiore intorno a iniziative come il Progetto Stargate da 500 miliardi di dollari per riconquistare un vantaggio tecnologico sostenibile negli Stati Uniti.
Nel complesso, osserviamo un impatto contenuto sui titoli dei semiconduttori nel settore automotive e industriale e prevediamo comunque una sovraperformance per quest'anno, grazie al previsto rimbalzo dei ricavi e degli utili nel 2026, quando il settore si riprenderà dalla correzione attuale delle scorte. Questa visione non è influenzata dalle notizie riguardanti DeepSeek e consideriamo l'attuale debolezza come un'opportunità di acquisto. A lungo termine, la tendenza verso modelli di IA più economici, più piccoli ma più capaci, come quello di DeepSeek, potrebbe accelerare l'adozione dell'IA Edge nelle automobili e in altri dispositivi IoT (compresi smartphone e PC), a vantaggio dei semiconduttori auto/industriali, in particolare dei produttori di MCU (microcontrollori) e di semiconduttori di potenza. Nel lungo periodo, riteniamo che gli investimenti nell'IA e nella capacità di calcolo, così come la spesa per le infrastrutture, continueranno attraverso il progetto Stargate, l'US Science and Chips Act, il Chips Act dell'UE e molti investimenti dal Giappone a Taiwan, che dovrebbero vedere un'accelerazione di molte delle tendenze di lungo termine già in atto.
Un nuovo competitor nell’arena digitale?
Anche se molte informazioni devono ancora essere verificate e non siamo sicuri di come il modello sia stato addestrato, abbiamo alcune opinioni iniziali. Riteniamo che la notizia di DeepSeek abbia un impatto complessivo limitato, in quanto rimaniamo positivi sugli hyperscaler (ad es. Microsoft), sulle società di piattaforma con dati proprietari (ad es. booking.com) e sulle società di software (ad es. Salesforce, Snowflake). I progressi dell'IA avvantaggiano chiaramente le platform company. Le grandi società come Meta, Alphabet, Amazon e Microsoft saranno in grado di sfruttare i modelli di IA in modo più efficace. Se DeepSeek è in grado di addestrare un modello a un costo dieci volte inferiore, ciò implica che il ROI per le piattaforme internet globali non potrà che aumentare. Il fatto che Meta abbia annunciato le sue intenzioni di investimento dopo questa notizia dimostra che gli hyperscaler rimangono ottimisti sui ritorni che vedono.
L'aumento dell'efficienza renderà più facile scalare i modelli di IA. I guadagni di efficienza porteranno a una riduzione dei costi, che a sua volta potrebbe far crescere la domanda. Questo fenomeno è noto come paradosso di Jevons e i miglioramenti di efficienza ottenuti da DeepSeek potrebbero portare a una maggiore adozione dei modelli di IA. GenAI ha un'elevata soddisfazione generale da parte dei clienti, ma i prezzi elevati di prodotti come l'IA di ServiceNow hanno rappresentato un ostacolo all'adozione. Se questo punto di prezzo si riduce rapidamente ora, lo consideriamo positivo per il consumo di software in futuro. È ancora troppo presto per trarre conclusioni definitive. Molte informazioni devono ancora essere verificate. I costi di formazione del modello e i dettagli dell'infrastruttura sottostante non sono stati ancora confermati ufficialmente. Tuttavia, Microsoft ha già oltre 1.800 modelli di Intelligenza Artificiale su Azure e DeepSeek potrebbe essere solo un altro modello a cui i clienti possono accedere.