Pixelizácia sa vo vizuálnych médiách dlho používala ako „figový list“ na zakrytie citlivých častí obrázkov. Prelomiť opatrenia na ochranu súkromia na internete je však čoraz jednoduchšie. Ide najmä o štandardné maskovacie techniky, ako je rozostrenie tváre, citlivých údajov či evidenčných čísel áut.
Podľa vedcov z Texaskej univerzity v Austine a Cornellovej univerzity v ére strojového učenia prináša táto prax dosť rozpačité výsledky. Trojčlenný tím dokázal pomocou jednoduchého nástroja na hlboké učenie (deep learning) identifikovať rozostrené tváre a čísla s alarmujúcou presnosťou. Vedci pri snahe o identifikovanie rozmazaných tvárí vo videách na YouTube použili verejne dostupné snímky, ktoré rozmazali za použitia cenzurujúceho nástroja na YouTube. Potom „nakŕmili“ neurónovú sieť oboma súbormi obrázkov, takže si mohla vytvoriť korelácie medzi rozmazanými a nerozostrenými tvárami. Zatiaľ čo pri štandardnom dátovom sete má človek pravdepodobnosť úspešnej identifikácie na úrovni 0,19 %, nový algoritmus mal presnosť 71 %. A ak mal k dispozícii 5 pokusov, úspešnosť sa zvýšila na 83 %.
Algoritmus nerekonštruuje pôvodný obrázok, ale rozpoznáva to, čo je na rozostrenej fotografii, na základe informácií, ktoré už dostal. Dokáže priradiť rozmazanú tvár k tej pôvodnej. Bez snímok originálnych tvárí by teda nefungoval. Dnes však už nie je problém zaobstarať si súbory tvárí na porovnávanie na Facebooku, Instagrame či v adresári zamestnancov na webových stránkach a pod.
Okrem cenzurujúceho nástroja na YouTube sa výskumníkom podarilo obísť aj dve ďalšie maskovacie techniky – pixelizáciu (tzv. štvorčekovanie) a nástroj nazvaný P3 (Privacy Preserving Photo Sharing), ktorý šifruje identifikačné údaje na fotografiách JPEG, takže ľudia nemôžu vidieť celkový obraz. Pri tomto treťom nástroji však bola úspešnosť identifikácie len 17 %.
Podobne ako tváre možno rozpoznávať aj čísla či písmená. Čím viac slov, tvárí alebo objektov teda neurónové siete „vidia“, tým lepšia je identifikácia. Vedci preto varujú komunity, ktoré majú na starosti ochranu súkromia a bezpečnosti, že pokrok v oblasti strojového učenia sa môže využiť ako nástroj na identifikáciu. A lepšie ako rozmazať či rozpixelovať tvár je prekryť ju iným náhodným obrázkom či farebným obdĺžnikom.
V spolupráci s PC Revue, www.pcrevue.sk