Po viac ako 500 rokoch strnulosti dáma na najznámejšom portréte Leonarda da Vinciho náhle vytreští oči a prehovorí. Presnejšie zarapuje, a to konkrétne komický výstup hollywoodskej hviezdy Anne Hathaway. Všetko vďaka zatiaľ neverejnému modelu AI.
Ide o schválne provokatívnu demonštráciu nového modelu umelej inteligencie, s ktorým minulý týždeň prišla spoločnosť Microsoft. Model sa nazýva VASA-1 a vie realisticky animovať fotografie ľudí, prípadne aj obrazy, ako je ukázané práve na diele geniálneho Leonarda da Vinciho.
Táto technológia nie je úplne prekvapivá – je ďalším a viac-menej očakávaným krokom v raketovej evolúcii AI. Ani otázky, ktoré tento krok vzbudzuje, nie sú dvakrát originálne, no s VASA-1 získali na intenzite. Klásť ich je zrejme legitímne a zrejme čoraz dôležitejšie.
Pozerať sa na rapujúcu Monu Lisu je určite zábava a práve v jej prípade ťažko niekto naletí, že ide o skutočnosť. Dá sa však ľahko predstaviť, čo je možné robiť s „rozhovorenými fotografiami“, v ktorých je synchronizovaný pohyb pier s rečou a prirodzenými pohybmi tváre či hlavy ľahko uveriteľný.
Microsoft uviedol, že technológia by mala slúžiť na účely lepšieho vzdelávania, takisto môže pomáhať ľuďom s komunikačnými problémami. Obava zo zneužitia a šírenia podvodných deepfake videí je však na mieste.
„Vývoj umelej inteligencie je dnes takmer neuveriteľný,“ hovorí Petr Štros zo spoločnosti Qinshift.
„Keď sa pozeráte na nové produkty, napríklad na automatickú transpozíciu hlasu do rôznych jazykov vrátane zložitej a menšinovej češtiny, skoro vám to vyrazí dych.“
V súvislosti s umelou inteligenciou však zostáva optimistom. „Vždy je otázkou, čo ju naučíme, s čím je previazané čisto naše rozhodnutie, čo od nej chceme a čo nie,“ tvrdí Štros.
Aj od ohňa ľudia chcú, aby ich hrial, no napriek tomu nemôžu vylúčiť nebezpečenstvo požiaru. S umelou inteligenciou je to v podstate rovnaké a riziko zneužitia je každému zrejmé. Vrátane vývojárov a vývojárok z Microsoftu, VASA-1 zatiaľ neplánujú uvoľniť pre verejnosť.
„Kým si nebudeme istí, že technológia bude používaná zodpovedne a v súlade s prísnymi predpismi, nepustíme VASA-1 medzi bežných užívateľov,“ uvádza firma vo svojom vyhlásení.
Spoločnosť tak s VASA-1 volí rovnaký postup ako konkurenčný generátor realistických videí Sora od OpenAI. Ten predstavili vo februári a v tejto chvíli ho sprístupnili na testovanie iba profesionálnej sfére.
Ak by bol napriek všetkým reštrikciám a opatreniam stvorený podvodný materiál, môže laik vôbec nejako rozpoznať, že ide o falošné video, kde rečník prednáša vety, ktoré nikdy nevyslovil?
Teraz údajne ešte áno – podrobnejšie skúmanie videí odhalí neprirodzené žmurkanie a prehnané pohyby obočia. Microsoft však verí, že tieto „chyby na kráse“ jeho model prekoná a tým zatieni aj konkurenciu.
„Teraz sme skúšali jeden produkt a človek v jeho hlase počul drobné echo. Aby ho však človek počul a vďaka tomu odhalil nepravosť, musí sa problematikou zaoberať. Inak by mu ani nenapadlo, že je to niečo divné,“ opisuje Petr Štros.
Odborník pridáva aj postreh o prílišnej, a teda strojovej dokonalosti umelej inteligencie: „Keď vám AI vygeneruje napríklad podobu hrušky či paradajky, budú mať tieto plodiny taký ideálny tvar aj štruktúru, že je to proti prírode.“ Ťažko pochybovať o tom, že aj „chyby “ sa umelá inteligencia čoskoro naučí robiť úmyselne.
Článok vyšiel na Forbes.cz. Autorom je Filip Saiver.