Blog sugli strumenti AI > Chinese AI Startup DeepSeek Gains Rapid Global Popularity
CONDIVIDI
Startup cinese di intelligenza artificiale DeepSeek ha rapidamente catturato l'attenzione mondiale dopo che il suo chatbot è salito al primo posto nelle classifiche dell'App Store di Apple e di Google Play. L'emergere di DeepSeek, grazie a metodologie di addestramento dell'intelligenza artificiale avanzate ma convenienti, ha spinto gli analisti di Wall Street e i veterani del settore a interrogarsi sull'attuale supremazia dell'America nel settore dell'intelligenza artificiale e sulle future implicazioni per la domanda di processori specifici per l'intelligenza artificiale.
Questa improvvisa popolarità fa sorgere spontanea la domanda su come questa società, prima oscura, sia salita alla ribalta in un settore affollato e su quali basi sia stata costruita. È interessante notare che DeepSeek è sostenuta finanziariamente da High Flyer Capital Management, un hedge fund cinese famoso per l'integrazione dell'intelligenza artificiale nelle sue strategie di investimento.
Creato nel 2015 da Liang Wenfeng, appassionato di AI, High Flyer è nato inizialmente come iniziativa di trading quantitativo. Wenfeng, che ha esplorato per la prima volta i metodi di trading algoritmico durante i suoi anni accademici alla Zhejiang University, ha ampliato High Flyer in un hedge fund completo nel 2019, sfruttando sofisticati algoritmi di IA per la ricerca finanziaria e gli investimenti.
Nel 2023, l'azienda si è distaccata dalle sue radici finanziarie, fondando DeepSeek come laboratorio di ricerca indipendente, completamente focalizzato sullo sviluppo di soluzioni innovative di intelligenza artificiale. Poco dopo la sua nascita, DeepSeek si è separata completamente, diventando un'entità autonoma che ha rapidamente costruito strutture di dati proprietarie per far progredire le proprie capacità e ambizioni di formazione.
Tuttavia, la sua crescita e le sue ambizioni internazionali non sono state prive di sfide significative, soprattutto a causa delle severe restrizioni all'esportazione degli Stati Uniti che influiscono sull'acquisto di hardware in Cina. In particolare, DeepSeek ha incontrato difficoltà nell'accedere a chip di alto livello come le potenti GPU H100 di Nvidia, costringendo l'azienda ad affidarsi a chip Nvidia H800 leggermente inferiori, specificamente sanzionati per l'esportazione alle aziende cinesi.
Internamente, DeepSeek ha dato priorità all'assunzione di giovani talenti, reclutando ricercatori di livello dottorale direttamente dalle prestigiose università cinesi note per l'eccellenza nell'IA. Inoltre, DeepSeek ha assunto personale con background disciplinari diversi per garantire che i prodotti dell'azienda mantengano una comprensione e una funzionalità più ampie in diverse aree di conoscenza, come evidenziato da un recente articolo di una famosa pubblicazione.
DeepSeek ha fatto scalpore con la sua prima serie di modelli, tra cui DeepSeek LLM, DeepSeek Chat e DeepSeek Coder, presentati inizialmente nel novembre 2023. Tuttavia, è stato il successivo rilascio dei modelli DeepSeek V2, alcuni mesi dopo, a scuotere significativamente il mondo tecnologico, con significativi progressi in termini di efficienza dei costi e di prestazioni rispetto alle offerte esistenti della concorrenza.
L'arrivo di DeepSeek V2 ha persino costretto i principali concorrenti cinesi, come ByteDance e Alibaba, a ridurre drasticamente i prezzi e alcuni servizi di modelli di IA sono diventati liberamente accessibili. Lo slancio dell'azienda si è ulteriormente accelerato con il rilascio del modello di punta di terza generazione, DeepSeek V3, nel dicembre 2024, posizionandosi come leader nella tecnologia AI accessibile e ad alte prestazioni.
DeepSeek sostiene che le valutazioni interne di benchmark indicano che il nuovo DeepSeek V3 supera in modo significativo sia i modelli accessibili pubblicamente, come Llama di Meta, sia le opzioni proprietarie, come GPT 4o di OpenAI. A ulteriore sostegno di questa notevole crescita, nel gennaio 2025 l'azienda ha lanciato DeepSeek R1, un modello di intelligenza artificiale specializzato nel ragionamento e progettato per produrre risposte altamente accurate e meticolosamente ponderate, paragonabili per qualità e accuratezza al famoso modello o1 di OpenAI.
Un punto di forza notevole del modello di ragionamento di DeepSeek, R1, è la sua innovativa capacità di autocontrollo, che gli consente di ridurre le imprecisioni comuni spesso riscontrate nei modelli tradizionali. Tuttavia, la sua maggiore precisione e accuratezza si contrappone a un tempo di generazione delle risposte un po' più lungo, che si estende per diversi secondi o addirittura minuti rispetto alle controparti standard, sebbene migliori notevolmente l'affidabilità in aree tecnicamente impegnative come la scienza, la fisica o le discipline matematiche.
Nonostante gli impressionanti progressi tecnologici, esiste un inconveniente intrinseco associato ai modelli DeepSeek a causa delle loro origini cinesi. I regolamenti governativi cinesi su Internet impongono valutazioni rigorose di DeepSeek per garantire che le risposte aderiscano rigorosamente ai valori politici ufficialmente sanciti, con il risultato che talvolta le risposte dei chatbot sono fortemente limitate su argomenti sensibili come l'autonomia di Taiwan o Piazza Tienanmen.
Le analisi del traffico di marzo dimostrano ulteriormente il profilo in ascesa di DeepSeek, che ha raggiunto oltre 16,5 milioni di visite al sito, nonostante il traffico sia leggermente diminuito mese dopo mese. Tuttavia, la stima dei suoi clienti rimane fortemente oscurata da ChatGPT del gigante del settore OpenAI, che nello stesso periodo ha superato i 500 milioni di sessioni attive settimanali.
Al momento, DeepSeek mantiene il riserbo su una precisa strategia di monetizzazione, mantenendo i prodotti a prezzi inferiori a quelli di mercato o addirittura rilasciandoli apertamente senza alcuna richiesta di investimenti in capitale di rischio, nonostante l'evidente entusiasmo degli investitori. I rappresentanti dell'azienda attribuiscono la loro competitività principalmente all'ottimizzazione dell'efficienza, anche se gli analisti esterni continuano a mettere in dubbio i dati di redditività finanziaria forniti.
Tuttavia, l'impegno degli sviluppatori evidenzia fortemente l'attrattiva di DeepSeek, con oltre 500 iterazioni derivate del modello R1 scaricate circa 2,5 milioni di volte su Hugging Face, una comunità e una piattaforma per la ricerca e lo sviluppo. Modelli di intelligenza artificiale ospitato. Un successo così eclatante ha suscitato reazioni di alto profilo, tra cui un sensibile calo del 18% nella valutazione delle azioni di Nvidia lo scorso gennaio e commenti aperti da parte di alti dirigenti di aziende come Nvidia, Microsoft e Meta in merito a considerazioni strategiche legate alla crescente rilevanza di DeepSeek.
Contemporaneamente, le preoccupazioni geopolitiche hanno assunto un ruolo di primo piano, spingendo numerose organizzazioni, tra cui i principali governi e istituzioni mondiali, a vietare del tutto le applicazioni DeepSeek sui dispositivi ufficiali. Gli Stati Uniti hanno esaminato pubblicamente DeepSeek, mentre lo Stato di New York e la Corea del Sud hanno annunciato divieti, citando potenziali problemi di sicurezza nazionale e indebita influenza internazionale.
Pertanto, nonostante la crescente importanza e i sostanziali progressi tecnologici, la traiettoria futura di DeepSeek è caratterizzata da incertezza per quanto riguarda la regolamentazione internazionale, le dinamiche di mercato e i potenziali contraccolpi della concorrenza geopolitica. Il modo in cui DeepSeek supererà questi ostacoli definirà in ultima analisi la sua redditività a lungo termine e il suo impatto globale sull'innovazione dell'IA.
CONDIVIDI
L'aspetto è migliore nell'app
Utilizziamo i cookie per migliorare la vostra esperienza sul nostro sito. Se continuate a utilizzare questo sito, presumiamo che ne siate soddisfatti.