Kezdőlap

Friss hírek

Fontos hírek

Felkapott

Menü

AKTUÁLIS

AKTUÁLIS

A DeepSeek előrehozza új AI modelljének bemutatását

A DeepSeek előrehozza új AI modelljének bemutatását

A DeepSeek előrehozza új AI modelljének bemutatását
Fotó: Unsplash/Saradasish Pradhan

Úgy tűnik, meg akarják lovagolni a hirtelen jött népszerűséget.

A kínai DeepSeek startup felgyorsítja legújabb mesterséges intelligencia modelljének piacra dobását, miután januári fejlesztése jelentős hatást gyakorolt a globális részvénypiacokra. A vállalat korábbi sikere az alacsony költségű, mégis hatékony AI-technológia terén akár új irányt is szabhat az iparág fejlődésének.

A cikk a videó után folytatódik

A Reuters értesülései szerint az eredetileg májusra tervezett R2 modell bevezetését hozták előrébb: az új fejlesztés várhatóan kifinomultabb kódolási képességekkel rendelkezik majd, valamint az angol mellett más nyelveken is képes lesz komplex következtetések levonására.

A januárban bemutatott R1 modell már bizonyította versenyképességét: annak ellenére, hogy kevésbé erős Nvidia chipekkel épült, mégis felvette a versenyt az amerikai technológiai óriások milliárdos beruházásaival. A bejelentés hatására a globális piacokon több mint ezer milliárd dolláros értékvesztés következett be.

A lap kiemelte, a DeepSeek sikere részben Liang Wenfeng, a vállalat alapítójának vezetési stratégiáján alapul: a korábban kvantitatív fedezeti alapot irányító milliárdos eltér a kínai technológiai szektor hagyományos hierarchikus modelljétől, s inkább innovációközpontú kutatólaboratóriumként működteti cégét, ahol fiatal szakemberek és gyakornokok is kiemelt szerepet kapnak.

A vállalat költséghatékony megközelítésének kulcsa a Mixture-of-Experts (MoE) és multihead latent attention (MLA) technológiák alkalmazása, melyek igen jelentősen csökkentik a számítási költségeket. Elemzők szerint a DeepSeek modellek 20-40-szer kedvezőbb ár-érték arányt kínálnak, mint az OpenAI hasonló rendszerei.