DeepSeek: la startup cinese sfida i giganti dell'AI con un modello low cost
La startup cinese DeepSeek ha sviluppato un modello di intelligenza artificiale che supera le prestazioni di Meta e OpenAI, pur avendo costi di sviluppo inferiori
Mentre 'utilizzo di Gemini AI, ChatGPT e degli altri modelli di intelligenza artificiale generativa, continua a crescere, una piccola startup cinese sta facendo parlare di sé per aver sviluppato un modello che sembra superare in prestazioni i giganti del settore.
Si chiama DeepSeek V3, ed è un Large Language Model (LLM) con ben 671 miliardi di parametri, addestrato in soli due mesi con un investimento di appena 5,58 milioni di dollari. Stando alle prima indicazioni della testata cinese SCMP, ciò che sorprende di più è che DeepSeek è riuscita a ottenere questi risultati utilizzando risorse di calcolo significativamente inferiori rispetto ai modelli sviluppati da aziende come Meta e OpenAI.
Per capire l'importanza di questo risultato, è necessario spiegare cosa sono i parametri in un LLM. In parole semplici, più alto è il numero di parametri, maggiore è la capacità del modello di adattarsi a pattern di dati complessi e di fare previsioni accurate. DeepSeek V3, con i suoi 671 miliardi di parametri, si posiziona quindi tra i modelli più avanzati al mondo.
CLICCA QUI PER CONTINUARE A LEGGERE
Qual è la vostra reazione?