Silou či šikovnosťou

Ukazuje sa, že preteky v zbrojení, ktoré sa v oblasti informačných technológií rozbehli približne pred desiatimi rokmi, sa blížia ku križovatke. Kvalitné dáta, ktoré sú pre tréning a zostavovanie čoraz objemnejších jazykových modelov generatívnej umelej inteligencie (AI) rozhodujúce, nie sú nevyčerpateľným zdrojom.

Preteky o ovládnutie globálneho trhu s produktmi generatívnej AI sa riadia pravidlom, že väčšie je zvyčajne aj lepšie. Viac parametrov použitých pri vývoji a fungovaní jazykových modelov vytvára systémy AI, ktoré sú nielen výkonnejšie, ale aj efektívnejšie, rýchlejšie a vo všeobecnosti vytvárajú menej chýb ako menšie systémy. Zvyčajne však nie je vždy.

Súťaž vo veľkosti

Technologické spoločnosti, ktoré sa najviac prezentujú v médiách, trend neustáleho zväčšovania často posilňujú, uviedla Aili McConnonová z IBM na stránkach spoločnosti v júli tohto roku. Systém, ktorý sme práve sprevádzkovali, je v mierke veľký ako veľryba. A ukázalo sa, že so superpočítačom s veľkosťou veľryby dokážete vytvoriť veľké množstvo AI, vyhlásil napríklad nedávno technický riaditeľ firmy Microsoft Kevin Scott o superpočítači, ktorý poháňa vývoj najnovšej verzie generatívneho AI chatbota spoločnosti OpenAI ChatGPT-5. Trhová kapitalizácia spoločnosti Nvidia medzitým v júni 2024 dosiahla hranicu troch biliónov dolárov: výrobca procesorov rástol závratným tempom práve preto, lebo jeho čipy poháňajú čoraz väčšie jazykové modely, superpočítače a dátové centrá, ktoré rastú po celom svete.
Po vydaní ChatGPT technologické spoločnosti, ktorých ohodnotenie výrazne profitovalo z rozmachu umelej inteligencie, presviedčali verejnosť, že škálovanie súčasných modelov prostredníctvom pridávania väčšieho množstva údajov a výpočtového výkonu bude neustále viesť k zlepšovaniu modelov umelej inteligencie. Pre spoločnosti vyvíjajúce veľké jazykové modely je rozsah vo väčšine prípadov naozaj výhodou. Keď sa však používatelia snažia oddeliť reklamný humbug od toho, kde môže AI pridať skutočnú hodnotu, zisťujú, že čoraz väčšie jazykové modely nemusia viesť vždy k lepším riešeniam napríklad pre podniky.

Dáta nie sú nekonečné

Všetko závisí od pohľadu. V budúcnosti nebudeme potrebovať modely, ktoré sú 100-násobkom toho, čo máme dnes, aby sme získali väčšinu hodnoty, hovorí Kate Souleová, riaditeľka IBM pre výskum generatívnej AI. Mnoho spoločností, ktorým sa už investície do AI vracajú, ich používa na úlohy, ako sú klasifikácia a sumarizácia, pri ktorých ani nevyužívajú plnú kapacitu súčasných jazykových modelov. Zároveň laboratóriá AI narážajú na neuspokojivé výsledky v pretekoch o vydanie veľkého modelu, ktorý by prevýšil doteraz najvýkonnejší model GPT-4 od OpenAI (GPT-5 je plánovaný na uvedenie do konca tohto roku alebo v prvých mesiacoch 2025). Hoci spoločnosť OpenAI nezverejnila presnú veľkosť GPT-4, predpokladá sa, že by mohol mať od stoviek miliárd až po viac ako bilión parametrov.
Náklady na údaje neustále rastú, pretože veľmi kvalitné podklady používané na trénovanie modelov AI sú čoraz vzácnejšie. Analýza výskumnej organizácie Epoch AI zistila, že modely AI by mohli vyčerpať všetky súčasné takéto kvalitné jazykové údaje dostupné na internete už v roku 2026. Hoci obsah internetu rastie závratnou rýchlosťou – každý deň podľa výskumnej organizácie Statista pribudne na sieti viac ako 400 miliónov terabajtov (terabajt: 10¹² bajtov) – dáta nie sú nevyčerpateľným zdrojom, ak majú byť originálne a kvalitné.

Pokračovanie článku si môžete prečítať v časopise Quark 12/2024. Ak chcete mať prístup k exkluzívnemu obsahu pre predplatiteľov, prihláste sa. Ak ešte nie ste naším predplatiteľom, objednajte si predplatné podľa vášho výberu tu.

R
Článok vznikol v spolupráci s magazínom NEXTECH.

Cookie	Dĺžka trvania	Popis
__wpdm_client	relácia	Technický súbor cookie, ktorý synchronizuje webovú stránku a CMS. Používa sa na aktualizáciu webovej stránky.
cookielawinfo-checkbox-advertisement	1 rok	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Reklama“.
cookielawinfo-checkbox-analytics	11 mesiacov	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Analytické“.
cookielawinfo-checkbox-necessary	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookie v kategórii „Nevyhnutné“.
CookieLawInfoConsent	1 rok	Tento súbor cookie zaznamená predvolený stav tlačidla zodpovedajúcej kategórie. Funguje iba v koordinácii s primárnym súborom cookie.
PHPSESSID	relácia	Tento súbor cookie je natívny pre aplikácie PHP. Súbor cookie sa používa na ukladanie a identifikáciu jedinečného ID relácie používateľa na účely riadenia relácie používateľa na webovej lokalite. Súbor cookie je súbor cookie relácie a vymaže sa, keď sa zatvoria všetky okná prehliadača.
viewed_cookie_policy	11 months	Tento súbor cookie využíva doplnok GDPR Cookie Consent na zaznamenanie súhlasu používateľa pre súbory cookies. Neukladá žiadne osobné dáta.

Cookie	Dĺžka trvania	Popis
_ga	2 roky	Súbor cookie _ga nainštalovaný službou Google Analytics počíta údaje o návštevníkoch, reláciách a kampaniach a tiež sleduje používanie stránky pre analytický prehľad stránky. Súbor cookie ukladá informácie anonymne a priraďuje náhodne vygenerované číslo na rozpoznanie jedinečných návštevníkov.
_gat	1 minúta	Používa ho Google Analytics na zníženie počtu žiadostí.
_gid	1 deň	Súbor cookie _gid nainštalovaný službou Google Analytics ukladá informácie o tom, ako návštevníci používajú webovú stránku, a zároveň vytvára analytickú správu o výkonnosti webovej lokality. Niektoré zo zhromažďovaných údajov zahŕňajú počet návštevníkov, ich zdroj a stránky, ktoré anonymne navštevujú.
CONSENT	2 roky	YouTube nastavuje tento súbor cookie prostredníctvom vložených videí youtube a zaznamenáva anonymné štatistické údaje.

Cookie	Dĺžka trvania	Popis
fr	3 mesiace	Facebook nastavuje tento súbor cookie tak, aby používateľom zobrazoval relevantné reklamy sledovaním správania používateľov na webe, na stránkach, ktoré majú Facebook pixel alebo sociálny doplnok Facebook.
sb	2 roky	Tento súbor cookie používa Facebook na kontrolu svojich funkcií, zhromažďovanie jazykových nastavení a zdieľanie stránok.
VISITOR_INFO1_LIVE	5 mesiacov a 27 dní	Súbor cookie nastavený službou YouTube na meranie šírky pásma, ktorý určuje, či používateľ získa nové alebo staré rozhranie prehrávača.
YSC	relácia	Súbor cookie YSC nastavuje Youtube a používa sa na sledovanie zhliadnutí vložených videí cez stránku Youtube.
yt-remote-connected-devices		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.
yt-remote-device-id		Toto cookie ukladá predvoľby prehrávača videa používateľa pomocou vloženého videa YouTube.

Možnosti

Značky

Možnosti

Značky

Mohlo by vás tiež zaujímať...

Rok kvantovej vedy a technológií

Sklený mozog

Nebezpečná, ale užitočná

Používanie cookies