A ChatGPT alkotója is meghajolt a kínai rivális teljesítménye előtt
Sam Altman is elismerően nyilatkozott a DeepSeek teljesítményéről.
Az OpenAI vezérigazgatója, Sam Altman pozitívan értékelte a kínai DeepSeek startup R1 modelljének teljesítményét, ami a ChatGPT jelentős versenytársává nőtte ki magát. A DeepSeek mindössze 6 millió dollárból fejlesztette ki R1 modelljét, míg az OpenAI GPT-4 modelljének betanítása körülbelül 100 millió dollárba került.
A jelentős költségkülönbség azonban még hasznára is válhat az iparágnak, ugyanis új perspektívát nyithat a mesterséges intelligencia fejlesztésének területén.
Az R1 modell több tesztben is kiemelkedően teljesített. A MATH-500 és az AIME 2024 tesztekben nemcsak felzárkózott az OpenAI szintjére, de néhol meg is haladta azt. Az AIME teszten például 79,8 százalékos pontosságot ért el, szemben az OpenAI 79,2 százalékos eredményével.
„A DeepSeek R1 modellje lenyűgöző, főleg ha figyelembe vesszük az árát” – írta Altman az X-en, majd ígéretet tett rá, hogy hamarosan ők is elérhető teszik a jelenleginél sokkal jobb képességekkel rendelkező modelleket.
A kínai vállalat más megközelítést választott a fejlesztéshez, ugyanis ahelyett, hogy drága hardverekre támaszkodna, az algoritmusok optimalizálására és hatékonyabb betanítási technikákra összpontosított, emellett az R1 modellt nyílt forráskódúvá tették MIT licenc alatt, ami lehetővé teszi a fejlesztők számára a szabad felhasználást és módosítást.