DeepSeek: la startup cinese sfida i giganti dell'AI con un modello low cost

La startup cinese DeepSeek ha sviluppato un modello di intelligenza artificiale che supera le prestazioni di Meta e OpenAI, pur avendo costi di sviluppo inferiori

DeepSeek: la startup cinese sfida i giganti dell'AI con un modello low cost

Mentre 'utilizzo di Gemini AI, ChatGPT e degli altri modelli di intelligenza artificiale generativa, continua a crescere, una piccola startup cinese sta facendo parlare di sé per aver sviluppato un modello che sembra superare in prestazioni i giganti del settore.

Si chiama DeepSeek V3, ed è un Large Language Model (LLM) con ben 671 miliardi di parametri, addestrato in soli due mesi con un investimento di appena 5,58 milioni di dollari. Stando alle prima indicazioni della testata cinese SCMP, ciò che sorprende di più è che DeepSeek è riuscita a ottenere questi risultati utilizzando risorse di calcolo significativamente inferiori rispetto ai modelli sviluppati da aziende come Meta e OpenAI.

Per capire l'importanza di questo risultato, è necessario spiegare cosa sono i parametri in un LLM. In parole semplici, più alto è il numero di parametri, maggiore è la capacità del modello di adattarsi a pattern di dati complessi e di fare previsioni accurate. DeepSeek V3, con i suoi 671 miliardi di parametri, si posiziona quindi tra i modelli più avanzati al mondo.


CLICCA QUI PER CONTINUARE A LEGGERE

Qual è la vostra reazione?

like

dislike

love

funny

angry

sad

wow