Neuverím, pokým to neuvidím na vlastné oči – koľkokrát sme už podobnú vetu počuli? Nuž, je čas prehodnotiť ju. Vidieť niečo na vlastné oči môže mať v ére rozvinutých technológií niekedy menšiu hodnotu ako začuť niečo z vedľajšieho sedadla vo vlaku.
Pojem deepfake je slovná hračka. Spája výrazy fake – podvrh a deep learning – hlboké učenie, čo je termín vyjadrujúci proces, akým umelá inteligencia dokáže spracovať určité dáta a na základe toho potom autonómne vytvárať nové dáta. Keď si umelá inteligencia osvojí črty tváre, mimiku, pohyby a hlas a na ich základe vytvorí falošný videozáznam, na ktorom niekto robí či hovorí veci, ktoré v skutočnosti nikdy nerobil, dostanete deepfake.
Kritická masa
Dvojníkov využívali mocní ako poistku pri hrozbe atentátu, využívali sa pri špionáži aj pri rôznych false flag operáciách, čiže pri falošných útokoch, ktoré mali ukázať prstom na nepravého vinníka. Nešlo o to presvedčiť všetkých, stačilo presvedčiť tých, čo to videli na vlastné oči a mohli potom presviedčať ďalších. V súčasnosti je možné spojením počítačov a sietí vytvárať takmer dokonalé podvrhy, ktoré obletia svet skôr, než dokážu ich obete zareagovať. Od falošných pornografických snímok až po prejavy politikov, ktoré v skutočnosti nikdy nezazneli. Ani teraz nejde o to presvedčiť úplne všetkých. Stačí presvedčiť kritickú masu.
Technológia však nemusí mať len zlovestný motív: spolupáchateľom je aj zábavný priemysel. Od pokusov filmárov nasadiť tváre hercov na telá náhradníkov dvojexpozíciami a maskami až po Jurský park Stevena Spielberga z roku 1993, kde bola tvár herečky v jednej scéne implantovaná na kaskadérku pomocou CGI, teda počítačovo generovaného obrazu.
V snímke The Irishman z roku 2019 filmári použili vylepšenú technológiu CGI na umelé omladenie postáv, ktoré znázorňovali herecké hviezdy Robert de Niro, Al Pacino a Joe Pesci. Postup vyvolal uznanie, lenže o rok na to sa na účte YouTube iFake objavili sekvencie z filmu upravené pomocou novej technológie deepfake – a bolo očividné, že herci v tejto verzii prekračovali hranice fyzického veku oveľa vierohodnejšie ako vo filme za 150 miliónov dolárov. Predviedlo nám bezplatne vyrobené video na YouTube budúcnosť filmových trikov? Ťažko povedať – nikto si zatiaľ totiž netrúfol použiť deepfake na tvorbu snímky, ktorá trvá tri a pol hodiny…
Hlboké učenie
Deepfake je mediálny súbor – obrázok, video alebo reč, zvyčajne predstavujúci človeka – ktorý bol upravený pomocou hlbokých neurónových sietí (DNN) s cieľom zmeniť identitu osoby. Zmena má najčastejšie podobu výmeny tváre, keď sa identita zdrojového subjektu prenesie na cieľový subjekt. Výraz tváre a pohyby hlavy cieľovej osoby zostávajú rovnaké, ale vzhľad na videu je vzhľadom zdrojovej osoby.
Strojové učenie zaobstarávajú algoritmy, ktoré umožňujú počítačovému systému učiť sa. V najjednoduchšej podobe môže prebiehať tak, že učiteľ predkladá programu súbor objektov s rôznymi atribútmi a oznamuje mu, ktoré sú dôležité. Za správne možno označiť napríklad iba tie, ktoré sú modré. Algoritmus počítač naučí, že pri otázke, či je niečo modré, nezáleží na veľkosti, tvare a polohe predmetu, ale len na jeho farbe. Cieľom je naučiť počítač rozoznávať, či je niečo modré.
Hlboké učenie pomocou sietí zložených z umelých neurónov sa vyznačuje tým, že celý proces obsahuje viacero vrstiev, pričom výstup z jednej slúži ako vstup pre nasledujúcu (v rámci tzv. konvolučných neurónových sietí jeden neurón komunikuje so všetkými ostatnými). Takýmto spôsobom možno ísť pri učení sa umelej inteligencie naozaj do netušených hĺbok, a práve takýto spôsob sa využíva aj pri spracovaní obrazu a reči.
R