Felejteni tanítanák az MI-t, hogy később ne legyen nagy baj
Az unlearning technológia a szakértők szerint fontos mérföldkő.
Az unlearning, avagy fordított tanulás lényege, hogy a mesterségesintelligencia-modellekből eltávolítsa a nemkívánatos adatokat anélkül, hogy újra kellene kezdeni a teljes tanítási folyamatot. Ennek a fejlesztésnek fontos szerepe lehet abban, hogy a jövőben az MI-modellek egyszerre hatékonyabban és etikusabban működhessenek olyan környezetekben, ahol az érzékeny adatok törlése kötelező előírás vagy elvárás – vélekednek az IBM-nél. A vállalat kutatói szerint az unlearning jelentős előrelépés lehet az MI-modellek tökéletesítésében és biztonságosabbá tételében.
Mindez pedig nélkülözhetetlen ahhoz, hogy a vállalati és intézményi döntéshozók mesterséges intelligenciába vetett bizalma erősödjön. A fordított tanulás amellett, hogy segít kiszűrni a téves következtetésekre vezető inputokat, megoldást kínál a nagy nyelvi modellek válaszaiban megjelenő toxikus, vagy etikai aggályokat felvető információk kiszűrésére és eltávolítására is – magyarázzák. Példaként megemlítették azt, ha az alapadatok faji vagy nemi alapú, vagy éppen a szocioökonómiai státuszhoz kapcsolódó torzításokat tartalmaznak, hiszen ezeket a modellek is átvehetik.
Az így születő következtetések és legenerált outputok pedig hátrányosan érinthetnek például olyan álláshirdetésre jelentkezőket, akiknek az önéletrajzát egy AI válogatja szét, vagy hiteligénylőket, akik első körös elbírálását mesterséges intelligencia végzi. Az ilyen esetek korrekcióját teszi lehetővé az unlearning: ha egy MI-modell „megtanult” egy torzított adatsor alapján egy toxikus eljárást, az unlearning folyamat eredményeképpen ezt nemcsak elnyomni lesz képes, hanem el is felejti minden formáját – részletezi a HVG az IBM-re hivatkozva.
Ez lehet a kitörési pont
Az unlearning ugyanakkor a döntéshozók a mesterséges intelligenciával kapcsolatos egyik leggyakoribb és legfontosabb fenntartásának kezelésére is alkalmas lehet, ez pedig az MI birtokába kerülő érzékeny, vagy személyes adatok sorsa – tudatta a vállalat. A cikkben megjegyzik: nem véletlen, hogy a technológia iránti igény először az adatvédelmi törvények, például az EU-s GDPR rendelkezések miatt jelent meg, amelyek az adattulajdonos kérése esetén előírják a cégeknek és az intézményeknek a személyes adatok törlését.
Ám a hagyományos adatvédelmi eljárások nem mindig elegendők az olyan modelleknél, amelyek több milliárd szóra és sok-sok terabájtnyi adatra épülnek, ezek esetében már fordított tanulásra van szükség. Az IBM szerint új fejlesztései azért lehetnek hatékonyak a mesterséges intelligenciát alkalmazó vállalatok és intézmények számára, mert azt is lehetővé teszik, hogy a modellek mindig csak a torzításokat okozó, vagy személyes jellegük miatt érzékeny adatokat felejtsék el, miközben megőrzik az adathalmazban található többi információt, ezzel javítva a modellek hatékonyságát.
A technológiai vállalat jelenleg saját, Granite névre hallgató modellcsaládján is teszteli az unlearning technológiát, s azon a véleményen vannak, miszerint az unlearning kitörési pontot jelenthet az MI-alkalmazások iránti bizalom erősítésében – fűzik hozzá. Korábban egyébként arról is beszámoltunk, hogy Japán a mesterséges intelligenciával üzenne hadat az animekalózok ellen, akik hatalmas károkat okoznak (évente milliárdos veszteséget a japán manga- és animeiparnak). Ezért tervezik most azt, hogy hatalmas beruházással vágnak vissza.
A hírek szerint a Kulturális Ügyek Ügynöksége 300 millió jen támogatást igényelt egy olyan program kidolgozására, amely a mesterséges intelligencia segítségével képes felismerni és blokkolni az illegális tartalmakat. Az új rendszer weboldalakat pásztáz majd, és kép- valamint szövegfelismerő szoftver segítségével azonosítja a jogvédett tartalmakat. Az ügynökség hangsúlyozta, hogy az emberi moderátorok már képtelenek megbirkózni az illegális tartalmak áradataival, így a technológiai bevonása elengedhetetlenné vált.