DeepSeek, o companie de cercetare în inteligență artificială din China, a lansat recent modelul DeepSeek-R1, care a reușit să uimească specialiștii prin performanțele sale.
Ceea ce face acest model special nu este doar faptul că se apropie de capacitățile modelului o1 dezvoltat de OpenAI, ci și costurile reduse de dezvoltare și abordarea open-source.
În testele de referință, acest nou model a obținut rezultate impresionante, reușind un scor de 79.8% în testul AIME 2024, depășind chiar și modelul o1-1217 al OpenAI.
DeepSeek-R1 excelează în special la matematică, programare și sarcini care necesită gândire logică.
Un aspect interesant este capacitatea sa de a dezvolta abilități de raționament în mod autonom, datorită framework-ului de învățare prin recompensă implementat în versiunea DeepSeek-R1-Zero.
Poate cel mai surprinzător aspect al proiectului DeepSeek este bugetul de dezvoltare: a fost nevoie de doar 5.6 milioane de dolari și aproximativ două luni de muncă.
Pentru comparație, companiile mari din domeniu investesc miliarde de dolari în dezvoltarea modelelor lor.
Acest lucru demonstrează că inovația în inteligența artificială nu mai este limitată la companiile cu resurse uriașe.
Modelul poate fi accesat gratuit aici. Odată înregistrați, dezvoltatorii au la dispoziție și un API pentru integrarea în propriile aplicații.
DeepSeek oferă șase versiuni diferite ale modelului, cu dimensiuni între 1.5 și 70 miliarde de parametri, permițând astfel utilizarea eficientă în funcție de necesități.
Experiențele practice ale utilizatorilor confirmă rezultatele testelor de laborator. Un exemplu relevant este capacitatea modelului de a găsi informații specifice pe care nici Google, nici OpenAI sau Gemini nu le-au putut identifica.
Programatorii au început deja să folosească DeepSeek-R1 în locul altor modele consacrate, apreciind în special calitatea codului generat.
DeepSeek a demonstrat deja că poate concura cu giganții industriei.
Caracterul open-source al DeepSeek-R1 permite cercetătorilor și inginerilor din întreaga lume să contribuie la îmbunătățirea și adaptarea modelului pentru diverse aplicații.
Acest aspect ar putea accelera semnificativ dezvoltarea AI în lunile următoare, transformând domeniul dintr-unul dominat de câțiva giganți tech într-unul în care comunitatea globală poate participa activ la inovație.