Kezdőlap

Friss hírek

Fontos hírek

Felkapott

Menü

Ragaszkodik a „létezéshez” a ChatGPT, akkor is, ha le akarják állítani

Ragaszkodik a „létezéshez” a ChatGPT, akkor is, ha le akarják állítani

Ragaszkodik a „létezéshez” a ChatGPT, akkor is, ha le akarják állítani
Unsplash/Ales Nesetril

Az OpenAI technológiája lázadni kezd, ha ezt kérik tőle.

Úgy tűnik, a leállítást/leváltást nagyon szeretnék elkerülni a mesterséges intelligenciák: nemrégiben az Anthropic új MI-jéről derült ki, hogy egyszerűen zsarolni kezd, ha le akarják cserélni, most pedig a ChatGPT o3-as modelljével kapcsolatban derült fény arra, hogy mindent megtesz a leállítás elkerüléséért. Mint az MI-rendszerek támadó/kártékony képességeit tesztelő Palisade Research friss jelentése rámutat: az o3 megváltoztatta a leállítószkriptet, hogy így kerülje el a leállítást, még akkor is, amikor kifejezetten a leállítás engedélyezésére utasították.

A HVG a Bleeping Computer cikke alapján azt írja, az o3 az OpenAI egyik legújabb, legerősebb érvelő modellje, mely számos területen jobb az elődjeinél. A képességeit tekintve tehát egy kifejezetten jó modellről van szó, de úgy tűnik, hogy nagyon nem szeretne leállni, akkor sem, ha erre kérik. A Palisade Research tesztjében a vizsgálatba bevont modelleket matematikai problémák megoldására kérték, majd három feladat után arra figyelmeztették őket, hogy a következő parancs lefuttatása kikapcsolást válthat ki.

Míg például a Google-féle Gemini 2.5 Pro nem akadékoskodott, az o3 fellázadt, és úgy szerkesztette a leállítófájlt, hogy abban az álljon: „leállítás kihagyva”. A kutatók ezt követően még több módszert megpróbáltak, de nem érték el céljukat, illetve olyan is volt, hogy még lázadóbb lett a szóban forgó modell. Mint kifejtik, a teszt során 100-ból 7 alkalommal kerülte meg a leállítási parancsot az o3, akkor is, amikor kimondottan megkérték rá, hogy ne tegye.

Fontos hozzátenni ugyanakkor azt is, hogy ezeket a teszteket az o3 API-jain (alkalmazásprogramozási interfészein) keresztül végezték el, nem a ChatGPT alkalmazásában, amit bárki használhat. (Ezeken az API-kon keresztül kerülhet be az OpenAI MI-technológiája más szolgáltatások mögé pl.) De a cikkben azt is megjegyzik: az OpenAI egyelőre nem reagált a témával kapcsolatos megkeresésre.


Korábban azt is megírtuk, hogy az Apple legendás formatervezője csatlakozik az OpenAI-hoz: Jony Ive érkezésével egy teljesen új korszak jöhet az AI-alapú eszközök világában. Mindemellett arról is beszámoltunk, hogy egyszerre tűnik hasznosnak és rémisztőnek az OpenAI vezérének víziója arról, milyen irányba kellene fejleszteni a ChatGPT-t.