Nie je to tak dávno, keď sme viackrát denne či už pri prihlasovaní sa do internetových služieb, alebo písaní komentárov a odosielaní dotazníkov museli riešiť na prvý pohľad nevšedné úlohy. Prepísať pokrkvaný text, poklikať na všetky obrázky bicyklov alebo určiť všetky oblasti fotografie, ktoré obsahujú semafor.
Tieto úlohy slúžia na overenie, či všetky úkony na webe vykonal naozaj človek a nie nejaký automatizovaný program, ktorý by mohol mať nežiaduce ciele, napríklad v podobe zahltenia stránky reklamou, preťaženia serverov, hromadného nákupu vstupeniek na podujatie či inej diskreditácie webu. Názov úloh je CAPTCHA, skratka z ang. completely automated public Turing test to tell computers and humans apart, v preklade plne automatický verejný Turingov test na odlíšenie človeka od stroja.
Opíšte text z obrázka
Metóda oklamania počítača iným počítačom sa používa dlhé roky a prešla rôznymi úrovňami zložitosti. Na webstránkach medzi kontaktmi boli v minulosti často emailové adresy uvádzané so zameneným znakom zavináča. Namiesto @ boli zaužívané (at), (zavináč), /a/ práve z dôvodov automatických robotov. Tie na stránkach hľadali znak zavináča, podľa ktorého vedeli, že okolité textové znaky sú emailová adresa. Databáza kontaktov pre spam tak bola naplnená miliónmi adries v priebehu niekoľkých hodín. Aj iné bežné znaky sa takto nahrádzajú menej bežnými, keď je potrebné určité slovo skryť pred robotmi tak, aby ostalo ľahko čitateľné pre človeka.
Moderné úlohy CAPTCHA sa objavili v 90. rokoch, keď sa vývojári AltaVista, v tom období najpopulárnejšieho internetového vyhľadávača, usilovali nájsť spôsob ochrany pred škodlivými robotmi. Opticky rozpoznať napísaný text na obrázku počítače už vtedy zvládali, musel však byť jasne čitateľný. Preto úlohy CAPTCHA text rôzne skrútili, prečiarkli, obrátili. Pre bežného ľudského používateľa ľahko zvládnuteľná úloha, pre robota v tom čase nie. Správne riešenie úlohy muselo byť, samozrejme, niekde zapísané a chránené, aby sa k nemu robot nedostal. Preto sa úlohy často generovali až priamo na lokálnom počítači u používateľa.
Nie som robot
Rozpoznávanie obrazu počítačmi bolo tiež na slabej úrovni, preto sa používali aj úlohy s klikaním na istý typ obrázkov alebo ich častí. Tieto úlohy a ich riešenia od používateľov začala spoločnosť Google využívať aj inak, a to veľmi prezieravo. Ako úlohy zadávala časti fotografií zo služby Google Street View, ktoré obsahovali texty, čísla domov, tváre ľudí, autá, semafory, bicykle. Správne riešenie bolo to, ktoré sa zhodovalo s väčšinou riešení toho istého obrázka od ostatných používateľov. Spoločnosť takto dokázala využiť ľudskú inteligenciu na zmapovanie celého sveta a napríklad presné zaznačenia polohy domov. Navyše výsledky používali na trénovanie umelej inteligencie. Okolo roku 2014 užívatelia riešili asi 200 miliónov úloh CAPTCHA denne. Aj vďaka nim teraz dokážu napríklad lepšie šoférovať samojazdiace autá.
Možno sa pýtate, ako je možné, že v súčasnosti sa stretávate väčšinou iba s jednoduchým zaškrtnutím políčka s otázkou, či nie ste robot. To by predsa zvládol každý automat. No skrýva sa za tým oveľa viac. Tento test overí kompletnú aktivitu zaznamenanú na webe za posledné minúty vrátane overenia IP adresy. Robot by objednávku vyklikal za pár stotín sekundy, pričom človek rozmýšľa, vyberá si, mýli sa. Test overuje aj samotné pohyby myšou. Kým robot hýbe kurzorom v presných priamkach, človek sa rôzne chveje, zaváha, mení rýchlosť.
Dlhodobé návyky hýbania myšou sú dokonca pre každého človeka také individuálne, že je možné z nich vytiahnuť neuveriteľné množstvo parametrov, čo sa týka rýchlosti, trás po obrazovke, klikania či omylov. Tieto údaje skrývajú viac premenných ako samotné odtlačky prstov. Veľmi jasne sa tak dá určiť konkrétny človek, ktorý aktuálne pracuje s počítačom. Preto keď nejaká stránka zablokuje používateľa pre nevhodné správanie, často mu nepomôže ani založenie nového účtu s iným menom a emailom.
Text a ilustrácie Stanislav Griguš
Fakulta matematiky, fyziky a informatiky
Univerzita Komenského v Bratislave
Videá autora nájdete na YouTube kanáli To ako prečo?.