Čínska spoločnosť DeepSeek predstavila vlastný model umelej inteligencie, ktorý sa postaral o veľký rozruch. Firma vyhlásila, že vývoj modelu sa jej podaril s výrazne menším množstvom pokročilých čipov a rádovo menšími nákladmi v porovnaní s americkými spoločnosťami.
Výkon porovnateľný s modelom ako ChatGPT, ale za oveľa menej peňazí. Tak by sa dal zjednodušene opísať príbeh nového modelu spoločnosti DeepSeek s názvom R1. Kto stojí za čínskym startupom, ktorý vzbudil pozornosť celého sveta?
Nie je to podnikateľ zo Silicon Valley a jeho primárnou oblasťou nie je umelá inteligencia. Aj napriek tomu sa zakladateľovi spoločnosti DeepSeek Liangovi Wenfengovi podarilo získať pozornosť mnohých podnikateľov z tejto oblasti.
Jeho príchod do sveta umelej inteligencie bol veľkolepý. So svojím novým softvérovým nástrojom totiž spôsobil veľký prepad na akciových trhoch. Výsledkom je, že päťsto najbohatších obyvateľov sveta prišlo o najmenej 108 miliárd amerických dolárov. Najväčšie straty utrpeli tí, ktorých bohatstvo je spojené s umelou inteligenciou (AI).
Lian Wenfeng, ktorý má 40 rokov, pôsobí vo svete financií. Po absolvovaní univerzity založil v roku 2015 hedžový fond High-Flyer, ktorý sa pri vývoji obchodných stratégií spolieha na matematiku a umelú inteligenciu. V priebehu dvoch rokov si firma najala výskumný tím AI a na svoje obchodovanie takmer výlučne používala algoritmy umelej inteligencie.
Ešte v roku 2021 začal masívne nakupovať tisíce čipov, aby mohol zrealizovať svoj vedľajší projekt s umelou inteligenciou. Bolo to ešte predtým, ako administratíva amerického prezidenta Bidena začala obmedzovať vývoz technológií súvisiacich s umelou inteligenciou do Číny.
Známi jeho projekt v tom čase považovali za svojrázny koníček. Nič nenaznačovalo, že by to malo niekam viesť.
„Keď sme sa s ním prvýkrát stretli, hovoril o vybudovaní klastra s 10 000 čipmi na trénovanie vlastných modelov. Nebrali sme ho vážne,“ povedal pre Financial Times jeden z Liangových obchodných partnerov.
Vysvetľuje, že Lian Wenfeng nedokázal svoju víziu presne opísať, jednoducho povedal, že „to“ chce vybudovať a zmeniť tým celú hru. „Mysleli sme si, že sú toho schopné len veľké firmy ako ByteDance a Alibaba,“ dodáva.
Naštrbenie dominancie
O niekoľko rokov neskôr Liang Wenfeng posunul svoj záujem o umelú inteligenciu o krok ďalej. V roku 2023 založil DeepSeek, spoločnosť so sídlom v Chang-čou, ktorá sa venuje vývoju veľkých jazykových modelov. Chang-čou je technologickým centrom vo východnej Číne a domovom čínskeho giganta elektronického obchodu Alibaba Group.
DeepSeek aktuálne naštrbil americkú dominanciu firiem v oblasti umelej inteligencie. V sektore sa držal predpoklad, že náklady na vývoj takýchto modelov sa pohybujú v stovkách miliónov až jednej miliardy dolárov. Čínska firma to dokázala – podľa vlastných tvrdení – za šesť miliónov dolárov.
Okrem toho sa tradične predpokladalo, že úspech vo vývoji umelej inteligencie je podmienený špičkovými technológiami, ako sú napríklad pokročilé čipy. DeepSeek však ukázal, že to nemusí byť podmienkou. Dokázal, že je možné využívať aj menej výkonné čipy.
O svojej ambícii, plánoch s firmou DeepSeek a o celkovej čínskej stratégii v oblasti umelej inteligencii rozprával Lian Wenfeng ešte v lete minulého roka, všíma si Fortune.
„Čínske spoločnosti sú už roky zvyknuté využívať technologické inovácie vyvinuté inde a speňažovať ich prostredníctvom aplikácií,“ povedal v rozhovore pre Waves, ktorý bol zverejnený na webe Čínskej akadémie. Takýto prístup ale podľa neho nie je udržateľný. „Tentoraz naším cieľom nie sú rýchle zisky, ale posunutie technologických hraníc na podporu rastu ekosystému,“ vysvetľoval svoje ambície.
Uznal, že na vývoj technológií je potrebných veľa investícií. Povedal, že Čína predtým prijala už existujúce technológie, pretože jej ekonomika bola ešte v skoršom štádiu vývoja. To však už neplatí, pretože čínska ekonomika je schopná vytvoriť technologické giganty ako Tencent či ByteDance.
„To, čo nám chýba, nie je kapitál, ale dôvera a schopnosť organizovať talenty vysokej kvality pre efektívne inovácie,“ dodal zakladateľ DeepSeek.
Kreatívne spojenia
DeepSeek opisuje ako firmu bez rigidnej hierarchie, v ktorej existuje prirodzená deľba práce bez vopred pridelených rolí. Podľa neho to uľahčuje slobodnú spoluprácu. Uvádza aj jeden príklad: ak príde nápad a ukáže potenciál, manažment prideľuje zdroje.
Hovorí, že každý, kto má dobrý nápad, môže kedykoľvek využiť takzvané tréningové klastre. Dokonca aj zasadacie miestnosti sú ľahko prístupné, aby sa podporila náhodná výmena názorov medzi kolegami a kreatívne spojenia.
„Verím, že inovácia je v prvom rade vecou viery,“ povedal. „Prečo je Silicon Valley také inovatívne? Pretože sa odvážia to skúsiť,“ myslí si.