A Google új képgenerátora a művészeknek adhat ihletet
Vizuális ötleteket alkothatnak vele, nem a kész tartalom előállítása a cél.
A Google legújabb mesterséges intelligencia fejlesztése, a Whisk egy képalapú generátor, aminek célja, hogy kreatív eszközként hozzon létre vizuális ötleteket, amik alapján elindulhat az alkotás folyamata.
Az alapfelület egyszerű: a felhasználó három előre definiált stílus közül választhat, de egy haladóbb szerkesztői mód is elérhető, amelyben a felhasználók szöveges leírást vagy képet is használhatnak különféle kategóriákban.
A Whisk működése a Gemini nyelvi modellre épül, amely egy részletes leírást készít a feltöltött képről. Ezután a leírást az Imagen 3 képalkotó rendszer dolgozza fel, így a végeredmény egy olyan kép, amely Gemini szöveges interpretációjára épül, nem magára a forrásképre.
Jelenleg a Whisk kizárólag az Egyesült Államokban érhető el, és a Google Labs oldalán próbálható ki. Bár az eszköz korlátai nyilvánvalók, a Google ebben az esetben nem a kész tartalom előállítására, hanem a vizuális ötletelés és kreatív felfedezés támogatására helyezi a hangsúlyt.
Ez ígéretes eszközzé teheti mind a művészek, mind a tervezők számára, akik gyors koncepciókat szeretnének létrehozni – számolt be róla az Engadget.