Dühös a Google, amiért az Open AI YouTube-videókkal tanította MI-modelljét
Nagy technológiai cégek állítólag engedély nélkül használtak fel szerzői jogvédelem alatt álló tartalmakat mesterséges intelligencia rendszereik képzése céljából.
A The New York Times nyomozása kapcsán derült fény arra, hogy az OpenAI több mint egymillió órányi YouTube-videót használt fel a Whisper nevű, beszédből szöveget készítő AI-modelljének betanításához. Mindezt a szerzői jogok figyelmen kívül, hagyásával tette, amit a Google szóvivője is megerősített:
„A robots.txt fájljaink és a felhasználási feltételeink is tiltják a YouTube-tartalmak másolását vagy jogosulatlan letöltését”. A jelentés azt állítja, hogy az OpenAI vezetői, köztük Greg Brockman elnök is tisztában voltak a jogi „szürke zónával”, mégis folytatták a YouTube-adatok felhasználását, majd „tisztességes felhasználásra” hivatkoztak, mondván, hogy a platform teljes katalógusához képest csak kis mennyiségű videóról van szó.
Rövid időn belül ez már a második nézeteltérés a két cég között, legutóbb ugyanis azzal vádolta a Google az Open AI-t, hogy YouTube-videókat használtak a Sora nevű mesterséges intelligencia-rendszerének tanításához.
Szakértők arra figyelmeztetnek, hogy az AI-vállalatok kielégíthetetlen adatigénye 2028-ra meghaladhatja a rendelkezésre álló nyilvános és licenszelt adatok mennyiségét, ami olyan alternatív megoldásokat eredményezhet, mint a szintetikus adatok előállítása vagy hatékonyabb képzési modellek megalkotása.