Dôležité sú aj investície, aj kvalifikovaní ľudia, ale i samotné prelomové objavy. Práve na začiatku veľkých technologických revolúcií sa veľké objavy často spočiatku ani za objavy nepovažovali. Platilo to aj v jednej z klasických oblastí umelej inteligencie, počítačovom videní. Dlhé roky sme sa snažili riešiť to, čo vie malé dieťa, teda rozpoznávať veci okolo seba. Výskumníkov odjakživa zaujímalo, ako ten proces automatizovať.
Samotný koncept umelých neurónových sietí má viac ako osemdesiat rokov, ale ešte v deväťdesiatych rokoch niekoľkí významní vedci predpovedali, že je to slepá vetva výskumu. Našťastie sa našli vytrvalí zvedavci, medzi nimi aj čerstvý nobelista za fyziku Geoffrey Hinton a prišli prvé prelomové
výsledky.
Bolo to možné aj vďaka významnému nárastu výpočtovej kapacity. Ďalší predpoklad, ktorý sa musel splniť pre nástup nového leta AI, bol dostatok kvalitných dát. Pred zhruba sedemdesiatimi rokmi, keď AI vznikla ako pojem, prišli prvé pokusy v počítačovom videní. Vedci skúšali rozpoznávať rastliny a vytvorili prvý dátový súbor so stopäťdesiatkou označkovaných obrázkov. Dlhé roky sme nič lepšie nemali. Dnes už hovoríme nie o stovkách ani státisícoch, ale o miliónoch obrázkov – a nielen tých. V nasledujúcich dvoch rokoch bude zrejme vytvorených viac dát, ako bolo vytvorených doteraz. Počítame ich v zettabajtoch (desať na dvadsiatu štvrtú). Až viacero takýchto faktorov dohromady vytvorí nové príležitosti.
V AI alebo presnejšie v strojovom učení sa modely používajú na istý typ úlohy. Špecifikom v hlbokom učení pritom je, že keď natrénujete model na danú úlohu a potom ho škálujete, trebárs zdvojnásobíte počet parametrov, zistíte, že zrazu má ešte aj nové, iné vlastnosti, napríklad umožní riešiť úlohy, ktoré nikto nečakal. Ak model opakovane škálujete, udeje sa to v nejakej miere znova, aj vďaka tomu, že do výskumu a vývoja AI sú dnes zapojené firmy, ktoré sa pretekajú v trénovaní modelov.
Hoci firmy nezverejňujú všetko, čo je spojené s trénovaním, vieme, že do vývoja naliali veľmi veľa peňazí. Prvé veľké AI modely vznikli vo firemnom prostredí a tento trend pokračuje. Takúto situáciu sme tu však predtým nemali. Akadémia ťahá v strojovom učení za kratší koniec, nemá dostatočné finančné zdroje.
Tie sú potrebné najmä na čo? Hardvér, výpočtovú silu, či skôr kupovanie datasetov?
Závisí to od kontextu. Vo všeobecnosti sú peniaze veľmi dôležité, lebo väčšina veľkých počinov v strojovom učení stojí na tom, že urobíte veľa pokusov, no tie si často vyžadujú veľa trénovania, a teda aj vysoký výpočtový výkon. Aj AI sa dostala v poslednom období do popredia najmä vďaka tomu, že máme výpočtovú silu, akú sme predtým nemali.
Dôležitá vlastnosť veľkých jazykových modelov, o ktorej sme pred pár rokmi netušili, je, že ich viete „dotrénovať“. Takzvané „základové“, foundation modely viete dotrénovať napríklad na iné jazyky, štýl vyjadrovania alebo iné úlohy, ako je napríklad analýza sentimentu. Každý nemusí mať desiatky miliónov eur len na natrénovanie veľkého modelu. Stačí to urobiť raz a ďalší už môžu fungovať nie s miliónmi, ale státisícmi eur. Ak pracujete v cloude, na niektoré úlohy stačia tisíce až desaťtisíce. Vznikne tam však závislosť od príslušného modelu.
Problémy umelej inteligencie
Ako je to s dostupnosťou týchto modelov?
Viaceré foundation modely sú otvorené, v roku 2023 ich bola dostupná skoro stovka. Nástroj je teda už celkom dostupný, akurát musíte mať modely kde dotrénovať a ladiť, čo môže byť stále problém. Grafické karty nie sú práve najlacnejšie, rovnako ani služby poskytujúce výpočtovú infraštruktúru. Pre výskum a aj menšie firmy to môže byť celkom zásadné obmedzenie. Dnes už máme na Slovensku viaceré dobré možnosti. Spoločnosti si môžu v rámci štátnej pomoci de minimis vyskúšať cez hopero.sk superpočítač Devana, ktorý je od minulého roka prístupný pre užívateľov.
Sú problémom aj úložiská dát? Alebo skôr ich dostupnosť a kvalita?
Úložisko je asi najmenší problém, dôležité je najmä mať dobré dáta. Stále platí heslo „garbage in garbage out“, teda nekvalitný vstup, nekvalitný výstup. So zlými trénovacími dátami nemáme veľkú šancu dosiahnuť dobré riešenie. Trochu sa to však mení práve príchodom generatívnej AI. Dnes už nepotrebujete mať vždy dáta vyčistené až tak precízne, no ak chcete napríklad použiť jazykový model natrénovaný na najrôznejších textoch na prácu s legislatívou, ale nedotrénujete ho s dobrými dátami, bude si vymýšľať výrazne viac, ako sme ochotní akceptovať. Navyše bude hovoriť jazykom, ktorý nezodpovedá jazyku právnikov.
Neplatí to len pre posledné roky. S dátami sa pracuje už desiatky rokov a vždy platilo, že osemdesiat až deväťdesiat percent času a energie ľudí sa minie na to, aby sme mali kvalitné dáta. Tento pomer sa síce mení s ohľadom na generatívnu AI, ale zostáva ako zásadný predpoklad dobrého riešenia.
Spomenuli ste aj dôležitosť kvalifikovaných odborníkov. To hovorí prakticky každé odvetvie už dlho.
Osobne si myslím, že v AI sú ľudia úplne najdôležitejší. Peniaze a grafické karty sa dajú zohnať, aj dát je už pomerne dosť a už ich „nenaháňame so sieťkou“ ako kedysi. Spracúvajú sa pomerne kvalitne. Zohnať ľudí ochotných a schopných naučiť sa robiť s týmito technológiami nové veci, keďže vývoj ide extrémne rýchlo, je veľký problém. Špeciálne na Slovensku, z ktorého práve títo ľudia vo veľkom odchádzajú. Zatiaľ tu nevidím realistické kroky smerujúce k tomu, aby sme si šikovných ľudí udržali. Iniciatívy sú skôr náhodné. Naša krajina už dlhšie neslávne vedie v najrôznejších štatistikách týkajúcich sa úniku mozgov a týka sa to najmä informatikov a lekárov.
Zmešká Slovensko vlak?
Ako bude vývoj AI pokračovať? Zaplavia nás aplikácie s AI a používatelia, firmy aj verejný sektor „preplávajú“ do nového sveta, podobne ako sme prešli z počítačov na mobily? Alebo môžu niektoré trhy či štáty zaostať, ak nebudú mať lokalizované verzie, prípadne infraštruktúru?
Umelá inteligencia je horizontálna, asi si nebudeme musieť kupovať úplne nové zariadenia. Už teraz je v telefóne pekná „kôpka“ AI, ale ten typ softvéru, ktorý zrejme zmení svet ešte viac ako doteraz, je ten, ktorý bude ľuďom vo veľkom rozsahu pomáhať v rozhodovaní. Do súčasného boomu pomáhala AI najmä v rozhodovaní vo veľmi úzko špecializovaných expertných a kontrolovaných oblastiach, napríklad vo výrobe alebo v zdravotníctve. Bežným ľuďom možno ešte v navigácii, ale to nie je také rozhodovanie, ktoré by mohlo meniť názory, životný štandard alebo by mohlo viesť k zmene spoločenských pravidiel. A tie sa menia, už teraz je svet iný a v budúcnosti určite bude iný.
V akom zmysle?
V tom, že technológie pomôžu skupinám ľudí zmeniť spoločenské usporiadanie. Pravidlá, ktoré máme dnes nastavené, už nebudú platiť. Tú zmenu algoritmy AI môžu umožniť a urýchliť, najmä ak dovolíme ich nevhodné používanie alebo sami budeme nevedomky k takémuto používaniu prispievať. Svet je viac a viac zložitý, premenlivý, nejasný a nejednoznačný. K tomu sa vďaka AI pridáva exponenciálna rýchlosť a to už je pre človeka náročné zvládnuť.
Čo sa stane v prípade, ak sa Slovensko nebude dostatočne venovať AI?
Ovplyvní nás to. Ak firmy, ktoré podnikajú na Slovensku, nebudú mať dostatočné povedomie o tom, že to, čo robia, môžu robiť efektívnejšie, ich produkty nebudú konkurencieschopné či predajné. Zrejme budú drahšie, prípadne menej kvalitné. Know-how si budú musieť kupovať a to je drahé. Niekedy budú stáť nielen pred otázkou, ako niečo urobiť lepšie, ale aj ako niečo vôbec dokázať urobiť.