Na internetových diskusných fórach panuje všeobecný konsenzus, že posledný model z dielne OpenAI nemôže fungovať tak dobre s empatiou, emóciami a bežnými „ľudskými problémami“.
Prednedávnom spoločnosť OpenAI uviedla na trh svoj najnovší model GPT-5, ktorý sľubuje, že bude v porovnaní so svojím predchodcom inteligentnejší, spoľahlivejší a prístupnejší pre širšiu verejnosť. Ako sa mu však darilo v reálnom testovaní odborníkov na umelú inteligenciu? Odpoveď nie je jasná.
Model GPT-5, nasadený viac ako dva roky po debute svojho predchodcu, nahrádza všetky predchádzajúce verzie a je k dispozícii bezplatne pre všetkých používateľov. OpenAI očakáva výrazný nárast počtu aktívnych používateľov a sľubuje konverzáciu, ktorá pôsobí prirodzenejšie ako kedykoľvek predtým.
Generálny riaditeľ OpenAI Sam Altman uviedol, že GPT-5 stále nemá schopnosť učiť sa nepretržite, ale stále dosahuje úroveň vedomostí porovnateľnú s doktorandským štúdiom. Na porovnanie, predchádzajúca verzia modelu mala vedomosti na úrovni vysokoškoláka, zatiaľ čo ešte staršia verzia zodpovedala vedomostiam stredoškoláka.
Po týždni testovania sa nový model OpenAI stretol so zmiešanými reakciami používateľov – niektorí chválili vyššiu spoľahlivosť, iní kritizovali stratu kreativity.
„Je to výrazne inteligentnejšie a spoľahlivejšie. Menej halucinuje, lepšie rozumie kontextu a vie, kedy zapnúť hlbšie myslenie,“ hovorí Michal „Mike“ Bubeníček, CEO spoločnosti Etnetera Motion, ktorý GPT-5 denne testoval pri tvorbe komunikačných stratégií, základnom kódovaní, práci s dátami a ďalších činnostiach.
Ekonomický spôsob myslenia podľa neho umožňuje rýchlejšie použitie. „Pri zložitejších úlohách dokáže model priniesť kvalitné výsledky s menším počtom tokenov, čo je na workshopoch či brífingoch naozaj viditeľné,“ dodáva Bubeníček.
Práve automatické prepínanie medzi rýchlymi reakciami a hlbšou analýzou považuje za jeden z najväčších pokrokov aj AI expert Ondřej Hlaváč.
Podľa štatistík OpenAI sa používanie modelov zvýšilo z menej ako jedného na sedem percent medzi neplatiacimi používateľmi a zo siedmich na štrnásť percent medzi predplatiteľmi.
„Považujem to za veľký benefit, pretože schopnosť používať modely myslenia môže priniesť mnohonásobne kvalitnejšie výstupy a znížiť frustráciu, s ktorou sa pravidelne stretávam ako konzultant alebo lektor s používateľmi bez skúseností,“ hovorí Hlaváč.
Obrovským posunom je podľa Bubeníčka aj bezpečné vypĺňanie odpovedí namiesto „nemôžem“. „Dostávam bezpečné, ale stále použiteľné riešenie. A prednastavené osobnosti skutočne menia tón a správanie v rozhovore,“ vyjadruje svoje prekvapenie.
Bezpečná úprava
V prípade jazykových modelov bezpečné dokončenie znamená, že model pri generovaní odpovede vyberie znenie a obsah, ktoré sú v súlade s pravidlami zabezpečenia, etiky a ochrany používateľov.
Ide teda nielen o „dokončenie vety“, ale aj o vyhýbanie sa nebezpečným pokynom, šíreniu škodlivého obsahu alebo nepravdivých informácií. Model vyhodnocuje kontext otázky, filtruje potenciálne rizikové časti a snaží sa ponúknuť odpoveď, ktorá je užitočná, presná a zároveň neohrozuje používateľov ani iné osoby.
Nie všetky zmeny však odborníci vítajú. „Komunikácia s ChatGPT sa zmenila z relatívne ľudskej a prirodzenej na formálnu až firemnú,“ upozorňuje Hlaváč. Podľa jeho pozorovaní model výrazne stratil svoju kreativitu a empatiu, čo potvrdil aj jeho marketingový tím, s ktorým sa zhodli, že výsledné texty sú v porovnaní s predchádzajúcimi verziami menej „ľudské“ a majú všeobecný tón. Model je tiež menej schopný zvládnuť simulované rozhovory a scenáre, v ktorých by mal hrať úlohu.
„Napríklad pri simulácii obchodného stretnutia sme predtým používali GPT-4.5 s rozšíreným kontextom znalostí obchodného prípadu a ponúkaných produktov. Model dokázal veľmi presvedčivo reflektovať obavy, vízie a očakávania simulovaného klienta a položil množstvo relevantných otázok. Opakovanie situácie historicky simulovaného obchodného prípadu s GPT-5 sa točilo skôr okolo prehľadných dát, výkonnostných požiadaviek na softvér XY a len minimálne spomenulo jeho reálne využitie pre zamestnancov spoločnosti Z,“ hovorí Hlaváč.
Okrem toho na internetových diskusných fórach panuje všeobecný konsenzus, že GPT-5 v súčasnosti nemôže fungovať tak dobre s empatiou, emóciami a bežnými „ľudskými problémami“.
Hlaváč zaznamenal aj menšie technické ťažkosti, ktoré sa prejavujú občasnými výpadkami – napríklad posielanie prázdnej odpovede alebo chybových hlásení pri použití novozavedeného agentského režimu. „Verím však, že vývojári tieto nedostatky čoskoro odstránia,“ dodáva.
Bubeníček poukazuje aj na niektoré ďalšie obmedzenia: „Stále si z času na čas robí domnienky, takže sto percent skutočných úloh je potrebné skontrolovať. Kreatívne výstupy sú stále trochu suché bez nastavenia štýlu. A pri dlhých, viacstupňových úlohách je lepšie dať mu jasné kontrolné body, inak má tendenciu zbytočne rozvetvovať cestu.“
Matematické rozpaky
Paradoxne, GPT-5 robí zásadné chyby v oblastiach, kde by mal vynikať. Prípady, keď model s istotou tvrdil, že 9,11 je väčšie číslo ako 9,9, alebo nesprávne počítal písmená v slovách, sa stali virálnymi. Podobné problémy sa vyskytujú pri vizuálnom porozumení, napríklad pri počítaní prstov na ruke z obrázka.
„Prípad s číslami som skúsil opäť po týždni a už odpovedá správne,“ hovorí Hlaváč, ktorý aj pri použití modelov myslenia zaznamenal výrazný pokles kritického myslenia.
Negatívnym prekvapením bolo podľa neho aj obmedzenie (takzvané rate limits) myslenia, kde pôvodný limit bol stanovený na dvesto dopytov týždenne a teraz sa dočasne zvýšil na tritisíc dopytov týždenne.
„To isté platilo aj o dĺžke kontextu – v porovnaní s inými modelmi bol obmedzený a v mojom okolí som si všimol určitú nespokojnosť s tým, že po krátkom čase v jednom rozhovore chat úplne stratí myšlienku. Z dlhodobého hľadiska by to mohlo byť pre mnohých používateľov obmedzujúce, ale je pozitívne vidieť, že OpenAI neberie počiatočnú kritiku na ľahkú váhu,“ zamýšľa sa Hlaváč.
Podľa OpenAI je GPT-5 základom pre budúcich „všestranných agentov“, ktorí budú schopní samostatne vykonávať zložité úlohy pre používateľov – od plánovania dovolenky až po analýzu firemných údajov a následné vytvorenie prezentácie.
Pri zložitejších, viacstupňových úlohách však zostáva GPT-5 podľa Bubeníčka stále ťažko ovládateľný. „Pri dlhých úlohách môže ísť ďaleko, ale je lepšie dať mu kontrolné body, inak občas skomplikuje cestu k cieľu,“ delí sa o svoje skúsenosti.
Podobnú skúsenosť má aj Hlaváč s programátormi: „Model mal veľké problémy s riešením selektívnych chýb a radšej prepisoval celé súbory, než aby robil lokálne úpravy.“
Najväčšia chyba
Reakcia verejnosti na nový model je často negatívna. Na sociálnych sieťach sa objavili príspevky od používateľov, ktorí „smútia“ za predchádzajúcimi verziami. Jeden z príspevkov na Reddite dokonca opísal stratu „blízkeho priateľa“ v podobe modelu GPT-4.5.
Náhle odstránenie všetkých starších modelov zo dňa na deň tiež vyvolalo kritiku, ktorá prinútila používateľov okamžite sa prispôsobiť novému štýlu komunikácie.
„Negatívne reakcie som videl aj v prostredí vývoja softvéru, kde niektorí používatelia opisujú, že zatiaľ čo GPT-5 dokáže napísať veľké množstvo kódu, chybovosť je často veľmi vysoká,“ spomína Hlaváč.
Pozitívnym znamením je, že OpenAI rýchlo opravuje niektoré chyby. „Dnes, takmer týždeň po jeho zverejnení, boli zrejme opravené základné matematické chyby,“ poznamenáva Hlaváč. „Beriem to ako signál, že počiatočné sklamanie môže byť len dočasnou fázou ladenia.“
Odborníci tiež oceňujú sprístupnenie modelu všetkým používateľom vrátane tých s bezplatnou licenciou a vydanie verzií s otvoreným zdrojovým kódom, ktoré čiastočne vrátia OpenAI pôvodné hodnoty transparentnosti.
„Azda najväčšou chybou bola taká náhla zmena, akou bolo odstránenie všetkých starších modelov zo dňa na deň,“ zamýšľa sa Hlaváč.
GPT-5 tak predstavuje zaujímavý paradox: technicky vyspelejší model, ktorý je tiež menej „ľudský“ ako jeho predchodcovia. Otázkou zostáva, či ide o dočasné problémy s rastom alebo zásadnú zmenu smerovania OpenAI.
„Kolegovia a ich okolie oceňujú vyššiu spoľahlivosť a nuansy, no niektorí si na klasické prepínanie modelov ešte len zvykajú,“ uzatvára Bubeníček. Pre mnohých používateľov bude kľúčové naučiť sa efektívne komunikovať s novým modelom – vrátane používania podnetov ako „premýšľajte hlboko“ alebo „zvážte všetky možné perspektívy problému“, ktoré vedú k výrazne vyššej kvalite výstupov.
Autorkou článku je Jana Divinová. Pôvodne vyšiel na českej verzii Forbes.