O tom, prečo je internet, najmä v spojení s umelou inteligenciou, dobrý sluha a zlý pán, sme sa rozprávali s Mariánom Šimkom z Kempelenovho inštitútu inteligentných technológií.
Čo priniesol vynález internetu?
Rozvoj internetu ako celosvetovej počítačovej siete a neskorší vznik webu na šírenie informácií sú vynálezy podobnej dôležitosti, ako bol vynález kníhtlače. Obe tieto technológie zásadným spôsobom prispeli k tomu, že poznatky a informácie máme poruke. Nemusíme zháňať knihy, dlho čakať na ich dostupnosť v knižnici či prácne v nich hľadať informácie. V súčasnosti nám stačí siahnuť do vrecka a vyťukať jednoduchý dopyt. Odbúrala sa tak obrovská bariéra v prístupe k informáciám. Okrem toho nám tieto technológie umožnili spájať sa – s priateľmi, rodinou, ale aj cudzincami. Naše sociálne siete sa stali virtuálnymi.
V posledných rokoch sa k technológiám, ktoré zásadne menia naše životy, zaradila aj umelá inteligencia. Prečo až teraz?
Je to najmä vďaka neustále rastúcej výkonnosti (výpočtovej sile) počítačov, teda ich hardvérovej stránky. Množstvo operácií, ktoré teraz dokážeme na počítači vykonávať, sa posunulo na hranicu, keď už môžeme efektívne vytvárať tzv. modely neurónových sietí predstavujúce kľúčovú zložku súčasnej umelej inteligencie (AI).
AI ešte nie je taká, akú ju vídame vo filmoch. Nemá ľudskú podobu ani vedomie a ešte nejaký čas ho mať nebude. Jej aplikácie nás však takmer dennodenne udivujú v tom, aké pokroky dokáže robiť a aké zložité problémy nám pomáha riešiť. Obzvlášť v spojení s internetom nám toho môže veľa dať, no zároveň so sebou prináša aj nebezpečenstvá. Je dôležité, aby sme nové technológie využívali s rozumom a boli si vedomí rizík, ktoré sú s nimi spojené.
Marián Šimko je expert na spracovanie prirodzeného jazyka a umelú inteligenciu. V Kempelenovom inštitúte inteligentných technológií vedie výskumný tím zaoberajúci sa spracovaním prirodzeného jazyka (NLP) a pôsobí ako zástupca riaditeľky. Aktuálne sa zaoberá výskumom a vývojom riešení spracovania prirodzeného jazyka so zameraním na veľké jazykové modely a jazyky s tzv. málo dostupnými dátami, medzi ktoré možno zaradiť aj slovenčinu, s dôrazom na reálne aplikácie v praxi.
Ako v súčasnosti charakterizujeme umelú inteligenciu?
Umelá inteligencia sú počítačové programy, ktoré vznikli tzv. trénovaním (učením). Vedia riešiť ťažké úlohy, teda spracovávať vstupy, na ktoré neboli špeciálne natrénované a ktoré predtým nevideli. Trénovanie je proces, v ktorom vytvárame počítačový program, alebo presnejšie model. No nerobíme to klasickým programovaním, teda písaním programového kódu, čo bol doteraz dominantný spôsob tvorby počítačových programov. Model je základná súčiastka umelej inteligencie. V podstate je to niečo, čo dokážeme natrénovať (naučiť). Veľmi výkonným modelom je umelá neurónová sieť inšpirovaná naším mozgom. Ten pozostáva z miliárd neurónov a biliónov prepojení medzi nimi. Túto štruktúru kopíruje aj umelá neurónová sieť s tým rozdielom, že umelé neuróny nie sú živé bunky, ale jednoduché matematické funkcie.
Umelá neurónová sieť je obrovská sieť čísel schopná zapamätať si veľmi veľa informácií a riešiť všeobecné úlohy, napríklad odpovedať na otázku Je na zobrazenom obrázku pes? alebo viesť konverzáciu s používateľom na takmer ľubovoľnú tému.
Ako funguje AI?
Životný cyklus umelej inteligencie pozostáva z dvoch základných častí – už spomínaného trénovania a prevádzky.
Trénovanie modelu AI môže prebiehať rôznymi spôsobmi. Jedným z nich je, že modelu dávame na vstup rôzne príklady úlohy, ktorej riešenie ho chceme naučiť. Zoberme si príklad: Model chceme naučiť rozpoznávať, či na obrázku je alebo nie je pes. V procese trénovania mu preto ukážeme stovky až tisíce obrázkov, na ktorých pes je. Zároveň mu ukážeme ďalšie tisíce obrázkov, kde sa nachádza nejaký iný tvor alebo objekt. Čím viac príkladov – pozitívnych aj negatívnych – máme, tým lepší model dokážeme natrénovať. Ten si v procese trénovania upravuje svoju vnútornú štruktúru – miliardy čísel, aby dokázal správne odpovedať. Presný mechanizmus učenia je daný typom (architektúrou) neurónovej siete, ktorá je na tú-ktorú úlohu určená.
Prevádzka umelej inteligencie je používanie natrénovaného modelu. V našom príklade ukážeme modelu nový obrázok, ktorý predtým ešte nevidel, a ten na základe svojej vnútornej číselnej štruktúry odvodí, či ide, alebo nejde o psa.
Na čo sa používa takto natrénovaná AI?
Umelá inteligencia pracujúca s obrázkami je veľmi užitočná v medicíne, napríklad pri detekcii ochorení na lekárskych snímkach, alebo v doprave pri detekcii objektov pre autonómne vozidlá.
Iným prípadom použitia AI je práca s textom. Vezmime si filter nevyžiadanej pošty (spam filter) v emailovej aplikácii, ktorý usilovne deteguje, či prijatá pošta pochádza od hodnoverného zdroja alebo ide o nechcený, či dokonca škodlivý obsah. Ešte lepším príkladom umelej inteligencie pracujúcej s textom sú inteligentné četboty ako v súčasnosti veľmi známy ChatGPT. Ich základom sú tzv. veľké jazykové modely.
Čo sú veľké jazykové modely?
Podobne ako pri modeloch na spracovanie obrázkov ide o modely umelých neurónových sietí. Zaujímavý je proces ich trénovania. Príklady, ktoré takémuto modelu ukazujeme, sú len vety, ich počet rátame v miliardách. Opäť platí: čím viac, tým lepšie. Modelu ich však ukazujeme postupne tak, že niektoré slová z viet schováme a trénujeme ho na to, aby vynechané slová uhádol. Model si pomocou miliárd čísel, ktoré obsahuje, zakóduje postupnosti slov tak, že ich vie generovať v zmysluplnom poradí. Z toho dôvodu potom v prevádzke do vety: Cez Bratislavu tečie… nedoplní slovo medveď alebo vysvedčenie, ale slová ako rieka alebo Dunaj. To preto, lebo tie sa oveľa viac podobajú na to, čo videl v príkladoch, z ktorých sa učil.
Fungovanie umelej inteligencie je založené na štatistike. Jej modely neponúkajú na svojom výstupe vždy zaručene správnu možnosť, ale tú najpravdepodobnejšiu.
Jeden už trochu starší, ale zato rýdzo slovenský veľký jazykový model si môžete vyskúšať na stránke slovakbert.kinit.sk.
Za rozhovor ďakuje redakcia Quarku
Rozhovor vznikol na základe článku pre Detskú Univerzitu Komenského 2023.