Una delle prime iniziative della presidenza Trump è stata l’annuncio del progetto Stargate, un ambizioso piano di sviluppo dell’intelligenza artificiale, con un investimento di 500 miliardi di dollari in quattro anni. A sostenere il mega progetto ci sono anche tre Big Tech: OpenAI, SoftBank e Oracle, oltre al fondo degli Emirati Arabi MGX.
L’ambiziosa partnership prevede inoltre la realizzazione di infrastrutture di calcolo estremamente avanzate, tra cui dieci super data center, con la possibilità di costruirne altri dieci.
Impianti fondamentali per generare la massiccia energia necessaria al funzionamento della filiera tech, questi centri di elaborazione dati rappresentano la risposta concreta alla crescente domanda di infrastrutture tecnologiche per alimentare lo sviluppo dell’intelligenza artificiale e non solo, diventando ormai uno dei trend più solidi nell’intero settore delle infrastrutture.
Data Center Meta, Jefferson, Stati Uniti, Fonte: Meta
DeepSeek: l’intelligenza artificiale cinese che sfida le Big Tech
Ma in questo panorama futuristico, gli Stati Uniti non sono gli unici a fare massicci investimenti sull’intelligenza artificiale. A gennaio 2025, il settore dell’IA è stato scosso dall’ascesa di un concorrente inaspettato: DeepSeek, una startup cinese che ha rapidamente conquistato il primo posto sull’App Store iOS statunitense, superando persino ChatGPT e diventando l’app gratuita più scaricata.
Ma cos’è esattamente DeepSeek e perché sta ridefinendo il panorama dell’intelligenza artificiale?
L’ascesa di DeepSeek
Fondata dalla società di trading azionario cinese High-Flyer, DeepSeek ha l’obiettivo di sviluppare modelli di linguaggio open-source. Il suo primo modello di IA è stato lanciato a novembre 2023, ma è stato solo a gennaio 2025, con il debutto del rivoluzionario modello di ragionamento R1, che DeepSeek ha ottenuto un riconoscimento globale.
Cosa rende il modello di DeepSeek rivoluzionario? L’AI senza supercomputer
Il modello DeepSeek R1 ha sfidato le convenzioni dell’industria IA, puntando su un’efficienza straordinaria con un budget ridotto. Mentre le principali aziende di intelligenza artificiale utilizzano supercomputer con oltre 16.000 chip per addestrare i loro modelli, gli ingegneri di DeepSeek sono riusciti a farlo con soli 2.000 chip Nvidia, riducendo drasticamente costi e hardware necessari. Inoltre, la startup afferma di aver addestrato R1 con appena 6 milioni di dollari in potenza di calcolo, dieci volte meno rispetto all’ultimo modello IA di Meta.
OpenAI vs. DeepSeek: dal Reinforcement Learning all’Emergent Behaviour Networks
Il modello DeepSeek R1 rappresenta una sfida diretta a OpenAI, che dal lancio di ChatGPT nel 2022 ha dominato il settore. Le innovazioni chiave di DeepSeek R1 includono:
– Reinforcement Learning per il Ragionamento: ottimizzato per migliorare la capacità del modello di risolvere compiti complessi.
– Reward Engineering: un sistema avanzato di incentivi per guidare l’apprendimento dell’IA, aumentando precisione e adattabilità.
– Knowledge Distillation: tecniche di trasferimento della conoscenza per addestrare modelli con meno dati e a costi ridotti.
– Emergent Behavior Networks: DeepSeek ha osservato che schemi di ragionamento complessi possono emergere naturalmente attraverso il Reinforcement Learning, senza programmazione esplicita.