DeepSeek: Il nuovo gigante dell’intelligenza artificiale che sfida OpenAI e Google
E’ stato da pochi giorni lanciato DeepSeek da un’azienda cinese fondata nel 2023 da Liang Wenfeng, un imprenditore e manager. Con il lancio del suo modello DeepSeek-V3 e successivamente di DeepSeek-R1, DeepSeek si è posizionata come un serio concorrente di colossi come OpenAI e Google, offrendo prestazioni all’avanguardia a costi significativamente inferiori.
Liang Wenfeng, fondatore di DeepSeek, ha un background atipico nel mondo dell’AI. Dopo aver studiato visione artificiale all’Università di Zhejiang, ha lanciato nel 2015 High-Flyer, uno dei più grandi fondi della Cina, con un patrimonio gestito di 8 miliardi di dollari. La sua passione per la ricerca scientifica lo ha portato a fondare DeepSeek nel 2023, con l’obiettivo di sviluppare modelli di intelligenza artificiale all’avanguardia, spinto più dalla curiosità scientifica che da logiche di profitto immediato.
DeepSeek ha fatto il suo esordio con il modello DeepSeek-V3, un sistema basato su un’architettura MoE (Mixture of Experts) con 671 miliardi di parametri, ottimizzato per ridurre i costi di calcolo senza compromettere le prestazioni. A gennaio 2025, l’azienda ha lanciato DeepSeek-R1, un modello di ragionamento avanzato che utilizza tecniche di apprendimento per rinforzo (RL) per migliorare le capacità di risoluzione di problemi complessi, come quelli matematici e di programmazione311.
I punti di forza di DeepSeek sono:
- Efficienza e bassi costi: DeepSeek ha rivoluzionato il settore dimostrando che è possibile addestrare modelli avanzati con risorse limitate. Ad esempio, DeepSeek-R1 è stato sviluppato con solo 2.048 chip Nvidia H800 e un budget di 5,6 milioni di dollari, una frazione di quanto speso da OpenAI o Meta per modelli simili916.
- Prestazioni competitive: Nei benchmark, DeepSeek-R1 ha eguagliato o superato modelli come OpenAI o1 in compiti di ragionamento matematico e generazione di codice, raggiungendo punteggi impressionanti in test come AIME 2024 (79,8%) e MATH-500 (97,3%)511.
- Open source e accessibilità: A differenza di molti competitor, DeepSeek ha reso i suoi modelli open source, consentendo a sviluppatori e ricercatori di utilizzarli, modificarli e commercializzarli liberamente. Questo approccio ha favorito una rapida diffusione e adozione della tecnologia614.
DeepSeek si distingue dai giganti statunitensi per la sua efficienza economica e la filosofia open source. Mentre OpenAI e Google si basano su infrastrutture costose e modelli proprietari, DeepSeek ha ottimizzato l’uso delle risorse disponibili, adattandosi alle restrizioni imposte dagli Stati Uniti sull’esportazione di chip avanzati. Ad esempio, OpenAI spende centinaia di milioni di dollari per addestrare i suoi modelli, mentre DeepSeek ha raggiunto risultati simili con un budget di pochi milioni, o almeno questo è quello che afferma.
In termini di prestazioni, DeepSeek-R1 compete direttamente con OpenAI o1 e Claude 3.5 Sonnet, superandoli in alcuni ambiti come la generazione di codice e il ragionamento matematico. Tuttavia, DeepSeek ha ancora margini di miglioramento nella gestione di contesti molto lunghi e nell’ottimizzazione per scenari professionali specifici.
Link DeepSeek: https://deepseek.com