Pred týždňom predstavila spoločnosť OpenAI svoj najnovší model GPT-5, ktorý má byť oproti svojmu predchodcovi múdrejší, spoľahlivejší a dostupnejší pre širokú verejnosť. Ako však obstál v reálnom testovaní AI expertov? Odpoveď nie je jednoznačná.
Model GPT-5, nasadený viac ako dva roky po debute svojho predchodcu, nahrádza všetky doterajšie verzie a je dostupný zadarmo pre všetkých používateľov. OpenAI si od neho sľubuje výrazný rast počtu aktívnych používateľov a prisľubuje konverzáciu, ktorá pôsobí prirodzenejšie než kedykoľvek predtým.
Generálny riaditeľ OpenAI Sam Altman konštatoval, že GPT-5 stále nedisponuje schopnosťou priebežného učenia, no aj tak dosahuje úroveň znalostí porovnateľnú s doktorandským štúdiom. Na porovnanie – predchádzajúca verzia modelu mala podľa neho znalosti na úrovni vysokoškolského študenta, zatiaľ čo ešte staršie verzie zodpovedali skôr stredoškolákovi.
Po týždni testovania nový model OpenAI vyvolal medzi používateľmi zmiešané reakcie – kým jedni chvália vyššiu spoľahlivosť, iní kritizujú stratu kreativity.
Úsporný režim myslenia
„Je citeľne múdrejší a spoľahlivejší. Menej halucinuje, lepšie chápe kontext a sám rozpozná, kedy má zapnúť hlbšie premýšľanie,“ hodnotí novinku Michal „Mike“ Bubeníček, CEO spoločnosti Etnetera Motion, ktorý GPT-5 denne testoval pri tvorbe komunikačných stratégií, hľadaní copy, základnom kódovaní, práci s dátami a ďalších činnostiach.
Úsporný režim myslenia podľa neho umožňuje rýchlejšie používanie. „Pri zložitejších úlohách dokáže model dodať kvalitné výsledky s menším počtom tokenov, čo pri workshopoch alebo briefingoch naozaj poznať,“ dopĺňa Bubeníček.
Práve automatické prepínanie medzi rýchlymi odpoveďami a hlbšou analýzou považuje za jeden z najväčších pokrokov aj AI expert Ondřej Hlaváč. Podľa štatistík OpenAI sa využitie premýšľajúcich modelov u neplatiacich používateľov zvýšilo z menej než jedného na sedem percent, u predplatiteľov potom zo siedmich na štrnásť percent.
„Považujem to za veľký benefit, keďže schopnosť využívať premýšľajúce modely dokáže priniesť násobne kvalitnejšie výstupy a znížiť frustráciu, s ktorou sa ako konzultant alebo lektor pravidelne stretávam u ‚nepobozkaných‘ používateľov,“ hovorí Hlaváč.
Foto: Unsplash, Bolivia Inteligente
Najznámejším chatovacím softvérom s AI je ChatGPT od firmy OpenAI. Foto: Unsplash, Bolivia Inteligente
Podľa Bubeníčka je obrovským posunom aj bezpečné dokončovanie odpovedí namiesto „nemôžem“. „Dostanem bezpečné, ale stále použiteľné riešenie. A prednastavené osobnosti naozaj menia tón a správanie v konverzácii,“ vyjadruje svoje prekvapenie.
Nie všetky zmeny však experti vítajú. „Komunikácia s ChatGPT sa zmenila z relatívne ľudskej a prirodzenej na formálnu až korporátnu,“ upozorňuje Hlaváč. Podľa jeho pozorovania model výrazne stratil na kreativite a empatii, čo mu potvrdil aj jeho marketingový tím. Spoločne sa zhodli, že výsledné texty sú v porovnaní s predchádzajúcimi verziami menej „ľudské“ a majú generický tón. Model tiež horšie zvláda simulované rozhovory a scenáre, v ktorých má hrať určitú rolu.
„Napríklad pri simulácii obchodného rokovania sme kedysi využívali GPT-4.5 s rozšíreným kontextom o znalosti daného prípadu a ponúkaných produktov. Model dokázal veľmi presvedčivo reflektovať obavy simulovaného klienta, jeho víziu a očakávania, a navyše kládol množstvo relevantných otázok. Opakovanie historického prípadu s GPT-5 sa však točilo skôr okolo jasných dát, požiadaviek na výkon softvéru XY a len minimálne spomínalo jeho reálne potenciálne využitie pre zamestnancov firmy Z,“ opisuje Hlaváč.
Na internetových diskusných fórach navyše panuje zhoda, že GPT-5 aktuálne nedokáže tak dobre pracovať s empatiou, emóciami a bežnými „ľudskými problémami“.
Hlaváč si všimol aj menšie technické ťažkosti, ktoré sa prejavujú občasnými výpadkami – napríklad odoslaním prázdnej odpovede alebo chybovými hláseniami pri používaní novozavedeného agentného režimu. „Verím však, že tieto nedostatky vývojári čoskoro odstránia,“ dodáva.
Na niektoré ďalšie limity upozorňuje aj Bubeníček: „Stále si občas domýšľa, takže pri faktických úlohách je potrebná kontrola. Kreatívne výstupy sú bez nastavenia štýlu trochu suché. A pri dlhých, viacstupňových zadaniach je lepšie nastaviť mu jasné kontrolné body, inak má tendenciu zbytočne rozvetviť cestu.“
Matematické omyly
Paradoxne sa GPT-5 dopúšťa základných chýb v oblastiach, kde by mal excelovať. Virálne sa rozšírili prípady, keď model sebavedome tvrdil, že 9,11 je väčšie číslo než 9,9, alebo nesprávne počítal písmená v slovách. Podobné problémy sa objavujú aj pri vizuálnom porozumení, napríklad pri počítaní prstov na ruke na obrázku.
„Prípad s číslami som skúšal po týždni znova a už odpovedal správne,“ podotýka Hlaváč, ktorý však zaznamenal aj výrazný pokles kritického myslenia, a to aj pri zapojení tzv. premýšľajúcich modelov.
Negatívnym prekvapením preňho bolo aj obmedzenie tzv. rate limits pri „premýšľaní“, kde pôvodný limit bol nastavený na dvesto dopytov týždenne a teraz bol dočasne zvýšený na tritisíc.
„To isté platilo o context length, teda pamäti chatu – tá bola oproti iným modelom obmedzená a vo svojom okolí som zaznamenal určitú nespokojnosť s tým, že po krátkom čase v jednej konverzácii chat úplne stráca myšlienku. Z dlhodobého hľadiska by to mohlo byť pre viacerých používateľov obmedzujúce, ale je pozitívne vidieť, že OpenAI neberie počiatočnú kritiku na ľahkú váhu,“ zamýšľa sa Hlaváč.
Reakcie verejnosti na nový model sú často negatívne. Na sociálnych sieťach sa objavili príspevky používateľov, ktorí „smútia“ za predchádzajúcimi verziami.
GPT-5 je podľa OpenAI základom pre budúcich „všestranných agentov“, ktorí budú schopní pre používateľov samostatne plniť komplexné úlohy – od plánovania dovolenky až po analýzu firemných dát a následné vytvorenie prezentácie.
Pri zložitejších, viacstupňových úlohách však GPT-5 zostáva podľa Bubeníčka náročný na riadenie. „Pri dlhých zadaniach dokáže zájsť ďaleko, ale je lepšie mu dávať kontrolné body, inak občas skomplikuje cestu k cieľu,“ hovorí zo skúsenosti.
Podobnú skúsenosť má s programovaním agentov aj Hlaváč: „Model mal veľké ťažkosti riešiť selektívne chyby a radšej prepisoval celé súbory, než aby vykonal lokálnu úpravu.“
Detské choroby alebo trvalé zmeny?
Reakcie verejnosti na nový model sú často negatívne. Na sociálnych sieťach sa objavili príspevky používateľov, ktorí „smútia“ za predchádzajúcimi verziami. Jeden z príspevkov na Reddite dokonca opisoval stratu „blízkeho priateľa“ v podobe GPT-4.5.
Kritiku vyvolalo aj náhle zrušenie všetkých starších modelov, čo prinútilo používateľov okamžite sa adaptovať na nový štýl komunikácie.
„Negatívne reakcie som zaznamenal aj v prostredí softvérového vývoja, kde niektorí používatelia opisujú, že GPT-5 síce zvládne napísať rozsiahle množstvo kódu, ale chybovosť je často veľmi vysoká,“ spomína Hlaváč.
Pozitívnym signálom je, že niektoré chyby OpenAI rýchlo opravuje. „Dnes, takmer týždeň od vydania, sú základné matematické chyby zrejme odstránené,“ poznamenáva Hlaváč. „Považujem to za dôkaz, že prvotné sklamanie mohlo byť len dočasnou fázou ladenia.“
Experti oceňujú aj sprístupnenie modelu všetkým používateľom vrátane tých s bezplatnou licenciou a vydanie open source verzií, ktoré čiastočne vracajú OpenAI k pôvodným hodnotám transparentnosti.
„Možno najväčšou chybou bolo urobiť takú dramatickú zmenu, akou bolo odstránenie všetkých starších modelov zo dňa na deň,“ zamýšľa sa Hlaváč.
GPT-5 tak predstavuje zaujímavý paradox. Technicky pokročilejší model, ktorý je zároveň menej „ľudský“ než jeho predchodcovia. Otázkou zostáva, či ide o dočasné „detské choroby“, alebo o zásadnú zmenu smerovania OpenAI.
„Kolegovia oceňujú vyššiu spoľahlivosť a nuansy, ale niektorí si ešte odvykajú od klasického prepínania medzi modelmi,“ uzatvára Bubeníček. Pre mnohých používateľov bude preto kľúčové naučiť sa s novým modelom efektívne komunikovať – vrátane používania promptov typu „premýšľaj do hĺbky“ alebo „zváž všetky možné pohľady na problém“, ktoré vedú k podstatne kvalitnejším výstupom.