Laureátom druhého ročníka súťaže AI Awards – Trustworthy AI sa stal startup TrollWall AI, ktorý automaticky identifikuje a odstraňuje nenávistné komentáre na sociálnych sieťach. Vyhlásenie cien prebehlo vo štvrtok 29. mája na Forbes Business Feste.
So spoluzakladateľom a CEO TrollWall AI Tomášom Halászom sme sa rozprávali o plánovanej expanzii aj o ďalšom smerovaní firmy. Počas viac ako dvoch rokoch existencie sa totiž TrollWall AI posunul od moderácie k analytike. Ich umelá inteligencia už nielen odstraňuje vulgárne a nenávistné komentáre, no pomáha social media manažérom v diskusiách reagovať a odpovedať na tie slušné.
TrollWall AU funguje už v deviatich jazykových verziách. Vnímate rozdiely nenávistných prejavov v jednotlivých krajinách?
Rozdiely si všímame napríklad v tom, aké témy dominujú. Sú krajiny, kde je viac rasistických príspevkov proti moslimom, u nás to napríklad nie je až také rozšírené. Inde zase nie je tak veľa homofóbnych komentárov.
A napríklad rozdielne vnímanie vulgarizmov?
To sa týka skôr jednotlivých klientov, než krajín. Napríklad pri športových kluboch, s ktorými spolupracujeme, je nižšia miera citlivosti na tzv. slabšie nadávky než u klientov z bankového sektora.
Čo to v praxi znamená?
Športové kluby sú citlivé na rasistické prejavy a podnecovanie násilia na štadiónoch. Ale sú napríklad ochotnejší tolerovať také tie povzdychy fanúšikov nad zlou hrou. Napríklad to, že padol sprostý gól, je ok. Keď už sa píše vulgárne o rozhodcovi, to nie je v poriadku.
V rekapitulácii roka 2024 uvádzate, že až 27 percent komentárov pod príspevkami vašich klientoch spadalo do kategórie vulgárnych a nenávistných. Mení sa toto číslo v čase?
V dlhodobom priemere asi stále platí, že tie vulgárne a nenávistné príspevky tvoria tak do 30 percent komentárov. Mení sa to skôr v závislostí od udalostí či obdobia. Počas Vianoc je ich vždy menej, v období volieb alebo nejakých vypätých spoločenských udalostí zase viac.
Zakladatelia TrollWall, zľava Tomáš Halász, Tomáš Koctúr, Pavol Bujňák, Filip Strýčko. Foto: TrollWall
Zakladatelia TrollWallu, zľava Tomáš Halász, Tomáš Koctúr, Pavol Bujňák, Filip Strýčko. Foto: TrollWall
Menia užívatelia svoje správanie na profiloch, ktoré spravujete?
Často vidíme, že užívatelia ďakujú v komentároch našim klientom, že začali moderovať diskusie, tvrdia, že už sa to nedalo čítať. Niekedy zase tagnú TrollWall AI v diskusiách, ktoré moderované nie sú, aby nás daná stránka vyskúšala. Mám pocit, že situácia na sociálnych sieťach sa už posunula do tej roviny, že moderáciu debát vyžaduje naozaj široké publikum.
Mňa skôr zaujímalo, či napríklad hejteri zmenia jazyk, aby ich príspevky neboli skryté alebo zmazané.
To si nemyslím. Hejteri hejtujú ďalej a skôr si nájdu iné, nemoderované fórum, kde sa môžu realizovať.
Neskúšajú systém oklamať? Lasica a Satinský v známej scénke hovoria, že Slováci sú veľmi vynaliezaví, čo sa týka írečitých nadávok…
Určite. A nielen Slováci. Aj preto náš model aktualizujeme minimálne dvakrát mesačne vo všetkých jazykových verziách na základe nových dát. Niekedy sa objavia nové témy s novými výrazmi a celkovo sa jazyk stále vyvíja, prichádzajú nové slangy, pojmy a my si dávame pozor, aby sme išli s dobou.
Sú vulgárne a nenávistné príspevky iba reputačný problém?
Mnoho klientov to presne takto vnímalo, teda ako službu, ktorá je„nice to have“. Existujú však štúdie, ktoré dokazujú, že reklamy príspevkov, pod ktorými je hate speech, majú až o 35 percent menej klikov. Takže sa snažíme zákazníkom vysvetliť, že okrem kultivovanejšej diskusie je plus aj vyššia efektivia reklám.
Vraťme sa úplne na začiatok. Príbeh TrollWallu sa začal na jar 2022, keď ste ešte „ručne“ moderovali diskusie na viacerých stránkach po invázii Ruska na Ukrajinu. Považovali ste za hejt vtedy to isté, čo dnes označí vaša AI?
V zásade áno. My za hejt považujeme všetky nenávistné prejavy, útoky na osobu alebo skupinu na základe identity, presvedčenia, sexuálnej orientácie, postihnutia, národnosti a podobných čŕt. Zároveň sem patria vyhrážky, podnecovanie k násiliu a podobne. K tomu pridávame vulgarizmy, toxický jazyk, nadávky. Kritika nevadí, negatívna spätná väzba takisto nie, ak je vyjadrená slušne.
Ako trénujete AI?
Využívame skutočné komentáre reálnych ľudí z internetu. Tie potom anotujú lingvistickí experti z konkrétnej krajiny. Ak sa minimálne traja zhodnú, že ide o nenávistný alebo vuglárny prejav, potom ten obsah ide k AI na trénovanie. Čiže naši ľudia nečistia výsledky po AI, ale učia AI spraviť to lepšie.
Vaši experti určite majú vlastné politické názory, vierovyznanie atď. Ako zabezpečíte, že nemajú predsudky a ich označenia nepovedú k cenzúre?
Dáta, ktoré hodnotia, anonymizujeme. A pri skladaní tímu sa snažíme aj o nejakú geografickú a vekovú rozmanitosť, aby tam bola diverzita. Zároveň, vždy sa musia zhodnúť aspoň traja nezávisle od seba.
Prekvapí vás niekedy vaša AI v tom, čo označí za hate speech?
Prekvapí ma, že niekedy dokáže pochopiť snahu užívateľov oklamať ju. To sú prípady, keď človek chce skryť nadávku v nejakých emotikonoch, cez výkričníky namiesto písmen a podobne. Ak sa však pýtate na chyby, tak spätne zisťujeme, čo sa stalo, a opravujeme. Máme výhodu, že používame vlastný AI model, takže máme kontrolu nad výstupmi. A, samozrejme, predtým ako čosi dáme von, prebiehajú testy.
Tomáš Halász. Foto: Archív Tomáša Halásza
A neostane niekedy zarazený klient, ktorý nemusí rozumieť postupom AI?
Stáva sa to, no je to súčasťou onboardingu, komunikácie, ktorú máme s klientom počas spolupráce. Dobré znamenie však je, že máme zákazníkov, ktorí s nami podpisujú ročnú zmluvu už tretí raz.
Zameriavate sa na rôzne social media platformy. Vidíte potenciál aj inde?
Áno a v súčasnosti už pracujeme s prvými klientami na testovaní moderácie interných diskusných fór či diskusií v hrách.
A čo rozšírenie jazykových verzií?
Aktuálne máme slovenčinu, češtinu, poľštinu, rumunčinu, nemčinu, angličtinu a tri verzie španielčiny. V najbližších mesiacoch chceme pridať ďalšie štyri jazyky, no zatiaľ ich nebudem menovať.
Hľadáte na expanziu aj nové finančné zdroje?
Áno, práve sme v procese fundraisingu. V aktuálnom investičnom kole už máme zabezpečenú viac ako polovicu prostriedkov, hľadáme posledných investorov.
TrollWall sa za tie dva roky posunul aj funkciami, ktoré ponúka. Ako ešte klientom pomáhate manažovať sociálne siete?
Od moderácie sme prešli k tomu, že AI používame aj na analytiku a engagement. Inak povedané, pomáhame tým našim klientom vedieť, o čom sa ľudia rozprávajú, a následne im AI pomôže lepšie a rýchlejšie aj odpovedať.
Ako napríklad?
Naša AI zanalyzuje každý komentár, zároveň má znalosť tónu diskusie daného klienta, jeho preferencie. Takže ak je odporúčanie AI dať užívateľovi odpoveď, rovno ju aj vygeneruje. Potom je len na social media manažérovi, aby ju odobril. Klienti nám tvrdia, že im to šetrí až 80 percent času potrebného na manažovanie svojej komunity.
Jedným z problémov masového nasadenia AI je enviromentálna záťaž. Ako sa s tým vyrovnávate?
Využívame európske servery a datacentrá, ktoré sa snažia používať zelenú energiu. Samozrejme, nejaká spotreba tam je, ale kvôli cene aj životnému prostrediu sa snažíme byť efektívni. My však ani neprodukujeme veľké množstvo dát, takže tá spotreba je oveľa menšia ako povedzme pri generovaní obrázkov cez ChatGPT.