Najmodernejšie modely umelej inteligencie neboli schopné vykonávať úlohy tak efektívne ako ľudia a štúdia potvrdila, že súčasná umelá inteligencia stále nie je ani zďaleka pripravená plne prevziať ľudskú prácu do vlastných rúk.
Výskumníci vytvorili virtuálnu spoločnosť so všetkým potrebným: internými webovými stránkami, chatovacou platformou v štýle Slacku a digitálnymi „kolegami“ v úlohách HR manažéra a technického riaditeľa, na ktorých sa mohli obrátiť iní agenti so žiadosťou o pomoc.
V simulovanom podniku nasadili niekoľko špičkových modelov AI a pridelili im úlohy v oblasti financií, administratívy a vývoja softvéru, ktoré by za normálnych okolností zvládli zamestnanci.
Rozsah úloh siahal od analýzy databáz reťazca kaviarní cez získavanie spätnej väzby o výkone inžiniera a písanie hodnotiacej správy až po sledovanie videoprehliadok kancelárií a výber najlepšieho priestoru z hľadiska zdravotníckeho vybavenia zamestnancov.
Výsledky boli žalostné. Najvýkonnejší model (Claude z Anthropic) dokázal úspešne dokončiť menej ako štvrtinu zadaných úloh. Všetky ostatné, vrátane novej technológie Gemini od Googlu a ChatGPT od OpenAI, zvládli len asi desatinu úloh.
„V žiadnej kategórii úloh agenti AI nedokázali dokončiť väčšinu z nich,“ povedal Graham Neubig, profesor na Carnegie-Mellon University a spoluautor štúdie. Inými slovami, agenti neprekonali ľudské úsilie ani v jednom type práce, čo výrazne spochybňuje víziu skorého nástupu plne automatizovaných kancelárií.
Prečo zlyhali AI zamestnanci?
Podľa autorov štúdie sa ukázalo, že technológii chýba „zdravý rozum“ a tápe v situáciách, ktoré by ľudia mohli ľahko vyriešiť. Napríklad jeden agent AI sa pozeral na jednoduché vyskakovacie okno a nemohol kliknúť na krížik, aby ho zatvoril. Keď potom požiadal o pomoc HR bota, namiesto riešení dostal len prázdne sľuby a úloha zostala nedokončená.
Inokedy zmätený „zamestnanec“ AI nemohol nájsť tú správnu osobu vo firemnom chate, a tak namiesto toho vytvoril používateľa s rovnakým menom.
Ostatní virtuálni pracovníci nerozumeli formátu zadania – napríklad nevedeli vložiť odpovede do pripraveného dokumentu – alebo nerozumeli rozhovoru s „kolegami“ a predčasne označili úlohu za splnenú. Tieto chyby viedli k častému nedokončeniu alebo nesprávnemu vykonávaniu úloh. V dôsledku toho v simulovanej spoločnosti vládol chaos a termíny sa nedodržali.
Napriek tomu sa mnohí obchodní lídri pozerajú na systémy založené na agentoch s nádejou. Nedávny prieskum poradenskej spoločnosti Deloitte medzi dva a pol tisíckou manažérov ukázal, že viac ako štvrtina spoločností skúma využitie autonómnych agentov vo veľkom meradle.
Nahlas o nich hovoria aj predstavitelia technologických gigantov – napríklad generálny riaditeľ Salesforce Marc Benioff povedal, že dnešní generálni riaditelia „vedú poslednú, čisto ľudskú pracovnú silu“, a Jensen Huang z Nvidie odhaduje, že „čoskoro bude každé IT oddelenie spravovať tím agentov AI“.
Chýbali sociálne zručnosti
Realita je však triezvejšia: súčasné systémy umelej inteligencie ešte nevedia, ako si poradiť so zložitým konglomerátom podnikových aplikácií, a chýbajú im sociálne zručnosti, ktoré sú kľúčové napríklad v HR alebo žurnalistike.
Dokonca ani spoločnosti, ktoré teraz oslavujú čiastočné úspechy s agentmi AI, sa zatiaľ neodvážili odsunúť ľudí na vedľajšiu koľaj. Napríklad 116-ročná finančná spoločnosť Moody’s experimentuje so školením agentov AI vo svojich rozsiahlych interných údajoch, pričom dúfa, že to urýchli analýzu finančných výkazov.
Americká farmaceutická spoločnosť Johnson & Johnson uvádza, že vďaka interným asistentom AI dokázala skrátiť čas niektorých chemických procesov pri vývoji liekov o polovicu.
Tieto projekty ukazujú, že spoločnosti stále používajú AI na podporu ľudských odborníkov, a nie ako ich náhradu. Napriek rýchlemu pokroku teda systémy umelej inteligencie stále zlyhávajú v zložitých úlohách a trh ešte nesmeruje k masívnemu nahradeniu zamestnancov z mäsa a kostí technológiou.
Článok vyšiel na Forbes.cz. Autorom je Štěpán Vícha.