Data Talk #174: Antonín Kučera (Livesport)

V nové epizodě Data Talk si Jirka povídal s Antonínem Kučerou - (Livesport) o tom, jak se mění role BI a datové analytiky v době rychlého nástupu AI. Antonín popsal svou cestu od prvního analytika v Livesportu až po budování a transformaci datového týmu, který dnes prochází zásadní reorganizací směrem k datové platformě a data science. Diskuse se dotkla také technologických výzev spojených se sběrem a správou dat v prostředí iGaming affiliate marketingu a rostoucích nároků na data quality a governance. Antonín sdílel svůj pohled na to, jak AI mění práci analytiků, proč bude stále důležitější rozumět byznysu i technologiím a proč podle něj poroste role analytics engineerů. Jirka diskusi vedl také směrem k budoucnosti BI nástrojů a k otázce, jak by se datoví lídři měli připravit na transformační změny, které AI přináší.

Strojový přepis

Dobrý den, moje jméno je Jirka Vicherek a vítám vás u dalšího dílu Datatalk podcastu. Mým dnešním hostem je Tonda Kučera, Head of BI v LiveSportu. Ahoj Tondo, vítám tě zpátky v Datatalku.
Ahoj Jirko, díky za pozvání.

Dnes se podíváme s Tondou na to, jak fungují data v LiveSportu, jak funguje BI oddělení a další oddělení, která má Tonda pod svou správou. Probereme také aktuální update, protože Tonda byl hostem Datatalk podcastu na úplném začátku, v epizodě 23. To je téměř přesně tři roky od našeho posledního natáčení s ním. Během těch tří let se toho v oblasti dat a technologií hodně změnilo. Podíváme se tedy, jak to vypadá dnes. Zároveň probereme, jak Tonda přemýšlí o budoucnosti svého týmu, roli BI a datových analytiků v organizaci a kam se podle něj celý tento svět ubírá. Dnešní epizodu si moc užijte.

Začneme ale klasicky – pro ty, kteří nás nesledují od dílu 23, můžeš na začátek popsat svoji kariérní cestu a trochu se představit našim posluchačům?
Mile rád, ať je jasnější, jak a proč jsem se dostal tam, kde dnes jsem. Mám IT background už ze střední školy. Původně jsem chtěl jít na hotelovou školu, ale nějakým vnitřním prozřením jsem si řekl, že si vyberu něco jiného. V životě obecně volím často věci, které jsou větší výzvou, než na jaké možná v dané chvíli mám kapacity. Většinou se mi to vyplatilo. Někdy hraji na jistotu, ale většinou zkouším právě ty náročnější cesty.

Šel jsem tedy na IT školu v letech 2003 až 2007, kde jsem programoval například ve Visual Basicu .NET, učil se nastavovat sítě, spravovat Linuxové servery, kreslil výkresy v CADu – zkrátka celý IT background. Tam jsem získal skvělý základ v databázích a IT obecně. Byla to polosoukromá střední škola a vždycky se mi smáli lidé z ekonomky, protože oni si v pátek zatahali, zatímco u nás se počítala absence, což bylo poměrně náročné. Tak jsem přemýšlel, co budu dělat dál. Nechtěl jsem školu dokončit úplně, ale zjistil jsem, že programování není úplně moje cesta, nějak jsem se s tím trápil.

Proto jsem našel kombinovanou cestu, podobně jako mnoho dalších lidí, přes Vysokou školu ekonomickou (VŠE). Jak se říká, je to možná nejtěžší gymnázium v Čechách, nebo možná v Praze. A nějak jsem se dostal na aplikovanou informatiku. Na bakalářském studiu jsem se zpočátku spíš trápil, některé předměty mě nebavily, ale postupně jsem si to ujasnil.

To bylo takové opakování – polosoukromá střední škola a pak VŠE. Tam mi také některé věci zpočátku nesedly, ale našel jsem své místo. Měl jsem jiné starosti než lidé na ekonomické fakultě, kteří se koukali na funnelové analýzy v Google Analytics, například u formulářů, takže jsem se snažil některé z těchto záležitostí řešit za ně.

Potom se stalo, že díky Pavlovi Ješkovi, který znal člověka pracujícího na marketingu v LiveSportu, jsem se dostal k pohovoru. Původně jsem chtěl pracovat přímo ve sportu, ale tam jsme se nedohodli – nechtěl jsem dojíždět do Berouna, nebylo to vhodné. Když mi bylo řečeno, že v LiveSportu také shánějí lidi, přihlásil jsem se tam. Bylo to v červnu roku 2015.

Takže nyní tam budu už 11 let. Někteří kolegové tam jsou déle než já, ale jejich počet klesá. Pamatuji si, že dříve jsem znal skoro všechny, dnes už většinu ne, protože se tam hodně lidí vystřídalo. Zejména na centrále v Praze.

Já jsem byl první takový „datáš“. Kolega Mirek Mace, který předtím dělal performance marketing a SEO, už s daty nějak pracoval, ale ne tak, jak nyní. Dřív to bylo hlavně v Excelu, ručně se přepisovalo z Google Analytics. Já spravoval asi 60 domén, kterým někdo ty data připisoval. První, co jsem udělal, bylo zautomatizování tohoto procesu. Nastavil jsem skript v ERP, který data tahal sám, bez manuálních exportů. Tehdy žádné exporty do BigQuery neexistovaly.

Firma rychle rostla a tenkrát si pamatuji, že tehdejší CEO Patrik mi řekl, že si umí představit, že bych si k sobě přibral ještě jednoho člověka. Tehdy ale nikdo netušil, kam se firma dostane. Z původních 40–50 lidí se počet zaměstnanců zvětšil do stovek. V roce 2021 jsme například nabrali 100 lidí během jednoho roku, což bylo hodně.

Postupně vznikala nová oddělení marketingu, produktového vývoje a tak dále, a tím pádem rostly i požadavky na to, co mají data umět. Na začátku roku 2021 vzniklo samostatné oddělení Business Intelligence (BI). Původně to byla produktová analytika zabývající se marketingem a produktem, byli jsme součástí produktového týmu.

Později jsme se přesunuli pod nově vzniklé oddělení komerčních aktivit, dnes již neexistující, a nyní jsme pod finančním oddělením. Takže BI spolupracuje mnohem více se čísly a financemi.

Zmiňoval jsem již, že jsem nebyl hostem v posledních třech epizodách, ale přemýšlel jsem, jestli jsem si před třemi lety dokázal vůbec představit, jak bude dnešní svět a data vypadat.

Nechci být pesimista, ale myslím, že nikdo nedohlédne tak daleko dopředu. Kdybyste viděli, kam se posunuly nástroje – před třemi lety některé věci, které dnes používáme, ani neexistovaly. Většinu pomůcek, které mám dnes v práci, bych tehdy neznal. Kromě AI jazykových modelů, které dnes pomáhají psát SQL dotazy (SQL je přitom jazyk, který existuje od 70. let), většina těchto nástrojů je nová.

Dokonce jsem některé nástroje si vytvořil sám, což bylo před tím nemyslitelné. V posledních letech tedy došlo k obrovské disrupci, která mi přijde velmi pozitivní.

Samozřejmě jsou lidé, kteří to vnímají jako hrozbu. Já však raději investuji energii do toho, jak tyto změny využít, než se bát, co bude za pár let.

Dokonce jsem přestal sledovat každodenní novinky v tomto oboru – předplatil jsem si newslettery, ale většinu jsem odhlásil. Teď místo toho používám Perplexity.space, kde mám nastavený prompt, který mi každý den shrnuje novinky, co je pro mě relevantní.

Doufám, že mezi odhlášenými newslettery není Datatalk. Ten si nechávám. Používám jen pár newsletterů, zbytek mě zahlcuje přílišným množstvím informací.

AI news vydávají 50 nových věcí denně, je prakticky nemožné to všechny sledovat.

Máme také hedž s názvem „gossip“ – pokud nevěnujete pozornost, ten gossip nevygooglíte, jsou to zákulisní zprávy o dění na scéně, které nejsou snadno dostupné z oficiálních webů.

Než přejdeme k našemu tématu, rád bych ještě dvě věci zarámoval.

Myslím, že neexistuje posluchač, který by neznal LiveSport. Opravdu si to nedokážu představit.

Na druhou stranu, kdykoli někde přednášíš a představuješ velikost firmy, její škálu a neuvěřitelný komerční úspěch, vždy mě to znovu překvapí – jak se z pražské firmy podařilo vybudovat globální, velký a velmi ziskový byznys.

Pojďme to tedy trochu zarámovat.

Když jsem do LiveSportu nastoupil před 11 lety, nevím přesně, jestli firma měla 20–30 milionů uživatelů měsíčně. V digitálním prostředí ovšem tato čísla nemají vždy přesnost, protože není možné přesně měřit hlavičky uživatelů.

Naším cílem bylo ale od začátku co nejpřesněji modelovat data i v rámci GDPR, které některá data nedovoluje přímo měřit, takže některé metriky je potřeba modelovat.

V současné době, včetně našich dceřiných společností, protože se hodně zaměřujeme i na akvizice, tak se snažíme nejen organicky ovládnout trh, ale i akvizičně převzít jeho část, protože věříme, že to umíme dobře.

Dnes se pohybujeme kolem 150 milionů uživatelů měsíčně, přes 400–420 milionů stažení aplikací. Přesná čísla se průběžně mění, protože přibývají další projekty.

Počet zobrazení (imprese) dosahuje zhruba 40 miliard měsíčně, což je obrovské číslo. Záleží ovšem na tom, jak člověk zobrazení měří, protože některé metriky u aplikací nejsou úplně plně zaznamenávány.

Celkově je tedy objem aktivit uživatelů obrovský – stovky milionů uživatelů měsíčně, stovky milionů downloadů a desítky miliard impresí.

Samozřejmě známá značka má i stinné stránky – lepidlo v podobě lidí, kteří kradou obsah. Proto vedeme také boj s tím, že někde například v Asii nebo v Koreji najednou zaznamenáme náhlé zvýšení návštěvnosti na některé doméně, což je důsledek skrýpování obsahu.

Lidé jsou totiž mistři ve skrýpování dat a dříve to vyžadovalo nějaké úsilí a čas, aby si člověk našel návod, jak vytvořit správného skripera. Na YouTube byl spousta návodů.

Dnes AI dokáže takového skripera vytvořit během pár minut.

Takže bojujeme proti stále větší skupině veřejnosti, která si chce stavět svá vlastní data, ne vždy však ke správnému účelu.

Mnozí tvoří modely nad našimi daty pro osobní potřebu, případně i webové systémy, což jsme již několikrát zaznamenali.

Na YouTube byly i návody, jak skrýpovat naše domény – to bylo docela vtipné.

Na druhou stranu je to i znamení, že něco určitě děláme správně a že není mnoho kvalitních zdrojů jako jsou naše data.

Přestože přesné statistiky nemám, tak denně zpracováváme statisíce sportovních událostí. Sledujeme různé incidenty, jako jsou góly, žluté karty, střídání atd., které na webu i v aplikacích zobrazujeme.

To je oblast, kterou by znalí kolegové z engineeringu mohli detailněji rozvést.

Velmi jsme se snažili, aby… (text přerušen, pokračování chybí).

Ocel bych řekl, že klademe větší důraz na fotbal a na velmi pokročilé statistiky, nebo spíše na takové ty dost geekovské.

Co se týká fotbalových věcí, zabýváme se například heatmapami a různými pokročilými statistikami jako XG a vlastně řešíme výpočet vlastního ratingu hráčů. Tento výpočet zajišťuje kolega v týmu, který se tomu věnuje téměř na plný úvazek. Děláme tedy ten výpočet ratingu hráčům, protože pak hráč dostane hodnocení třeba 6,5 nebo 8,2 a tak dále, což je docela věda, která mně se nezdála snadná. A to vše vím jen díky historickému dílu s Eleven Hacks, kde XG znamená očekávané góly, jenže pro někoho, kdo se nezabývá moneyballem ve fotbale, je to jen pro upřesnění.

Možná se tím teď na chvíli zastavím. V jednu dobu si pamatuji, že jedním z motorů růstu byly právě neobvyklé sporty, jako je kriket a podobně. Teď se však ten fokus trochu posunul na nejpopulárnější sport na světě, tedy na fotbal.

Ano, to je vlastně pravda. Myslím si, že Lightsport do jisté míry vyrostl i v zemích, kde by možná bez určitých sportů nevznikl nebo neměl takovou pozici, jakou dnes má, protože ty sporty jsou specifické pro daný region. Například v některých ne úplně vrcholných zemích se dají zmínit například šipky v Nizozemsku, vůbec na ostrovech kriket, i když v tom kriketu jsme tolik neuspěli, protože je to ovládané spíše z Asie, ze zemí jako Indie, a pak různé sporty jako házená, která je populární v Německu, Dánsku, na Balkáně, vodní polo a tak dále. Myslím si, že i to, že máme výsledky i z těchto sportů, je znakem toho, že to pomáhá uživatelům. Možná by fotbalový výsledek dostali dříve, a to nejen u nás, ale i u konkurence. My jsme však zároveň měli a určitě stále máme zpracované i další sporty.

To znamená, že šlo vlastně o takový „all-in-one“ produkt, který přinášel kompletní informace. My jsme většinou tento produkt dělali velmi uživatelsky jednoduchý. Máme například konkurenci, kterou vždycky nazýváme „omalovánkami“, ale některým uživatelům to možná víc vyhovovalo. Takže si myslím, že to určitě zaujalo širokou škálu uživatelů a ta šíře různých sportů nám pomohla s akvizicí. Na druhou stranu je to velmi těžké udržovat v kvalitě, protože samozřejmě fotbal máme v jiné kvalitě a některé sporty zase v jiné kvalitě, protože jsou k dispozici odlišná data.

Fotbal je celosvětovým fenoménem a je málokterý sport, u kterého existují tak detailní data, se kterými by se dalo pracovat a něco vytvářet. Navíc, i přes širokou škálu soutěží – neodbavujeme jen ty nejznámější –, zpracováváme i data například z brazilského trhu, kde potřebujeme kvalitní data k sérii A, B, C a dalším regionálním soutěžím. Tohle je docela komplexní problém a v Evropě například moc nechápeme, jak to tam funguje. Brazilci mají například rádi basketbal, který je pro nás také velmi zajímavý sport a snažíme se ho pokrýt. Takže jsme vybrali top sporty, do kterých investujeme a rozvíjíme je, ale nejvíce bych řekl, že táhne fotbal.

Když to otočím a zmíníš škálu uživatelů, událostí a věcí, co to znamená pro tebe na datové straně – jaká je škála dat, se kterými pracujete? Kolik máte třeba datového skladu, jaký je denní ingestion?

To je dobrá otázka. Neřekl bych, že se výrazně liší oproti situaci před třemi lety, i když jsme vyrostli, pokud jde o uživatele – z průměru asi 50 milionů měsíčně na několik stovek milionů měsíčně, což však zásadně neovlivnilo objem dat. Objemy jsou spíše ovlivněné tím, že jsme zapojeni čím dál více do různých A/B testů, pokročilých měření a podobně, takže nám do Google Analytics teče daleko víc událostí, které musíme zpracovat.

Na druhou stranu už máme zkušenost s tím, kolik nás to stojí, a dnes se bavíme o denních objemech dat mezi dvěma a třemi terabajty. To jsou v podstatě tisíce řádků na kilobajty, tedy možná dva kilobajty na řádek, takže jde o miliardy řádků a dat v terabytech. Snažíme se je pravidelně čistit.

Co se časem změnilo, je rozšíření počtu zdrojů, ze kterých informace bereme – to je součást té škály. Ale mnohem větší komplexita není tolik v objemu, ale v složitosti dat, což je druhá strana té rovnice. První jsou data o uživatelích, druhá jsou data týkající se peněz.

Jelikož jsme globální a působíme téměř na všech trzích, co si člověk dokáže představit, a pokud vezmu nějaké regulované trhy, kde spolupracujeme primárně s sázkovými kancelářemi a dalšími subjekty, s nimiž pracujeme, tak je to několik desítek trhů, často 40, 50, 60 % všech trhů existujících, kde probíhá operativní prodej či sales.

Některé trhy běží trvale a nijak se s místními nevyjednává – prostě se tam jen umísťuje reklama, protože sázkové kanceláře tam mohou operovat –, ale jsou i jiné trhy, jako Velká Británie, Španělsko a další, kde se skutečně obchoduje a pracuje s trhem. Těmto trhům je věnována B2B stránka.

K tomu jsou lidé, kteří dělají sales přímo pro danou zemi nebo region. Zajímavé je, že najednou zjistíte, že subjektů, s kterými spolupracujeme, je třeba 150, 200, 300. Místní české sázkové kanceláře obvykle operují ve střední Evropě, ale představte si v Keni třeba 80 nebo třeba i 100 sázkových společností. Samozřejmě otázkou zůstává, kolik z těchto subjektů představují pochybný byznys. Snažíme se tomu vyhýbat, protože nechceme posílat své uživatele do prostředí, kde by jim pak mohl být zablokován účet. Dále je pro nás důležité mít stabilní B2B partnery, nechceme, aby někdo se nás snažil obrat, nebo manipulovat s daty.

Takže tento segment generuje určitý příjem a zvláštní statistiky a čísla jsou zaznamenávána právě u těchto subjektů, s nimiž spolupracujeme. Co je zajímavé, že na trhu existují platformy, které ony subjekty používají. Není to tak, že by měl každý svoji proprietární platformu. Stávají se však i větší společnosti, které vlastní své systémy, ke kterým se můžeme napojit obvykle přes API.

Upřímně řečeno, někdy mě překvapuje, jak tato odvětví technologicky zaostávají za jinými. Takže to znamená, že máme desítky systémů, do kterých musíme být schopni se napojit. Naštěstí vznikl kanadsko-maltézský startup jménem Statzdrom, se kterými jsme se setkali na konferenci na Maltě. Pomáhají nám, protože oni jsou prostředníkem mezi světem iGamingu a affiliate lidmi, kteří data posílají.

My nespolupracujeme s kasiny, protože těch je mnohem více než sázkových kanceláří, což je úplně jiný typ byznysu. U nás v klubu na kasino obvykle neuvidíte sportovní fanoušky. To ovšem neznamená, že sázkovky nemají kasina, ale my se typicky zaměřujeme na sportovní fanoušky.

Je potřeba konsolidovat data, a představte si, že u jedné sázkové kanceláře máme třeba otevřeno účty pro deset zemí. To znamená, že v důsledku máme i 300 až 400 „pointů“, ze kterých třímáme data. Data samozřejmě nejsou standardizovaná, takže jedna metrika může mít různé názvy a nemusí vždy znamenat totéž, například někdo do čísel započítá i bonusy a další.

Takže to nejsou příliš velká data, spíše megabajty až gigabajty, ale problém je komplexnost, která začíná být velmi složitá a často i nestabilní. Nechci tím podceňovat ta uživatelská data, ta jsou důležitá a generují příjem. Ale myslím, že si nimi nezakoupíte kancelářské centrum, jako třeba vy.

Abych se vrátil zpět, vzniká komplexita v tom, že neřešíme velká data, ale široká, různě propletená a různě kvalitní. Snažíme se propojovat věci, i když někdo čeká stoprocentní data, tak si musíme uvědomit, že pracujeme často jen s nějakým vzorkem.

Snažíme se získat například hráčská data ze sázkovek, která jsou pro nás velmi důležitá, protože potřebujete vidět, jestli příjmy, které ze sázkovky plynou, skutečně tvoří hráči, například skupiny lidí, které jste získali před deseti lety nebo třeba minulý týden. Bez těchto dat to není vidět, protože je velmi těžké data propojit.

Podařilo se nám až letos nebo loni vlastně data propojit, takže víme, že někdo přešel k nám a nakonec do sázkovky. Jenže některé sázkové kanceláře či platformy toto vůbec nepodporují.

Takže ta škála není tak důležitá z hlediska objemu, jako z hlediska složitosti a množství partnerů, což znamená rozmanitost dat, které je třeba zpracovávat. A právě v této rozmanitosti je hodnota, která vydělává. Je zde velký tlak na kvalitu dat a na to, abychom je měli co nejdříve k dispozici.

Dříve byly data k dispozici s několikaměsíčním zpožděním, například data za leden jste viděli až v březnu. Dnes už data vidíme prakticky během měsíce u většiny věcí, ale pořád pracujeme s 80% vzorkem, protože často musíme čekat na vyexportování ze sázkových kanceláří z různých důvodů – může jít o technické potíže, chybějící expertízu, právní předpisy a podobně.

To vede k tomu, že některé platformy nejdou automatizovat. Typicky například koupíte firmu a rozdělíte ji na podobné byznysové jednotky, což znamená, že z původních 150 subjektů se jich najednou stane třeba 300 a můžou se data násobit.

Pokud máte například 10 % práce manuální a zabere vám to tři hodiny, další zpracování sedmi subjektů přidá dalších 21 hodin, což se násobí. Proto se teď hodně zaměřujeme na umělou inteligenci a agenty, kteří by za nás chodili do určitých účtů a dělali tuto práci přes scrapy, API nebo jiné přístupy – otevřeli by účet, stáhli report, nahráli ho a my bychom s daty mohli pracovat.

Samozřejmě jednu komplikaci představuje bezpečnost, protože je potřeba zadávat přihlašovací údaje, což bezpečnostní oddělení nebývají ráda.

Musíte takto zacházet s účty bez ohledu na to, jestli účet generuje 100 tisíc eur měsíčně, nebo 10 eur měsíčně, protože potřebujeme získat kompletní příjmy, i když nejsme účetnictví. Ale potřebujeme tomu rozumět, takže se snažíme co nejvíce automatizovat.

Myslím, že v uživatelských datech jsme si velmi dobře poradili, spousta věcí funguje automatizovaně – například v Google Analytics kliknete na tlačítko a vysypete data do BigQuery, kde si je zpracujete. Tady je to však složitější.

Jsem rád za tento update, protože když se na to podívám s odstupem a vzpomenu si na dřívější debaty o exportu, vy jste pro mě byli střediskem excelence v produktové analytice, a to i díky škále dat a produktu. Co se týče webové analytiky a dat z mobilních zařízení, byli jste velmi hluboko zapojeni.

Pokud měl někdo background z oblasti PPC marketingu, tak k tomu šel právě do exportu, kde se dostal k opravdu pokročilým analýzám s nejnovějšími nástroji.

To, co teď vyprávíš, ukazuje, že tuto část máte zvládnutou na světové úrovni. A že nyní je příležitost právě v B2B stránce, integračním procesu a větších integracích i s ohledem na akvizice. Zkrátka, přecházíte na jinou platformu a jiné druhy dat, že se tedy posouváte jiným směrem?

Posun ve vašem zaměření je skutečně více na B2B segment?

Ano, vlastně už jsem nechtěl říkat, jestli je to hlavní důvod, ale vezmu to komplexně.

Pár dní zpátky jsme rozdělovali tým podle obchodních vertikál, takže jsme měli tým specializovaný na uživatelská, marketingová a produktová data a tým, který se zaměřoval na „revenue“ data.

Cílem bylo dát k sobě technicky zdatné lidi, tedy analytiky nebo data inženýry, což mírně upravuje definice, ale vznikl nám tým, který nazýváme Data Platform and Analytics, tj. lidé, kteří se starají o sběr dat, reporting a zpracování.

Tento tým umožňuje komukoli ve firmě používat data, nejen BI oddělení.

Vedle něj máme tým, který nazýváme Research and Data Science, který se specializuje na marketingový výzkum, pokročilá témata, prediktivní analytiku, sportovní data, ratingy hráčů, výpočty pravděpodobnosti výhry a podobně.

Tento tým také vyvíjí spoustu automatizací, například recommendation engine, monitoring konkurence a další.

Základním enablerem je však právě Data Platform tým, který umožňuje všem používat data napříč firmou.

Návrat k myšlence „self-service BI“ jsem nikdy neměl rád – bylo to před pěti, šesti lety velké téma a nyní už se toho mnoho očekávání nesplnilo.

Většina platforem jako Tableau a podobné jsou skvělé, ale jakmile musí uživatel psát SQL, značně to ztěžuje rozvoj. Dokonce už ani já sám SQL nepíšu a povzbuzuji ostatní, aby se na to také vykašlali…

I když vím, že jsou v tom skvělí, říkám prostě: Hele, já vím, ale nepíšte to úplně od začátku. Začni tím promptem, udělej si nějaké šablony, nějaké věci, pracuj s tím a můžeš to potom rozšiřovat.

Chápu, že jsou případy, kdy to nedává smysl, a nejde mi o to, aby to dělali tupě a následovali to, ale spíš, aby v tom něco našli a měli ten mindset, že možná… Že nechci se v něčem zlepšovat, tak ne, FSQLku.

Mně vlastně přijde, že jsem před nedávnem říkal, že se hlavně soustřeďme na matematiku a angličtinu, češtinu a podobně neřeš, a teď jen říkám: Hele, fakt je důležitá i čeština a obecně práce s jazyky, myslím tím formulování požadavků. A to je jedno, v jakém jazyce, obecně formulování požadavků.

Sice můžu napsat, ať to ta AI za mě vyformuluje, ale to není úplně ono, aby přinesla ty myšlenky. Proto podle mě je formulace požadavků jedna z klíčových dovedností aktuálně, protože čím lepší zadání dám té AI, tím lepší výstup dostanu, byť AI je čím dál chytřejší.

Teď v našem případě na B2B straně je výzva konsolidovat ta data, protože ta oblast je specifická. My ta data potřebujeme a musíme řešit věci, protože naši partneři mi nesprovozní API nebo neaktualizují, i když to slíbí, může to trvat roky a já se na to nemohu spolehnout. Takže hledám jakékoliv cesty, jak se k těm datům dostat, a zajímavá cesta je využít AI k tomu, abych ty data získal. Zajímá mě, jestli AI může nahradit lidi, kteří normálně otevřou něco, stáhnou data a dělají ty opakující se, nudné práce.

Jako první cestu hledám nahrazení, čím vůbec začínáme – použitím AI na repetitivní práce, tzv. monkey jobs, tedy ty opakující se bezpřidané úkoly, které se dělají pravidelně každý měsíc. Já raději budu dělat vizuální kontrolu, protože například vytváříme kampaně, kde přicházejí chyby, a pokud by agent měl knowledge base o tom, jak se to má vytvořit, AI to udělá za pár sekund, bez potřeby, aby to dělal člověk, a nebudou zbytečné diskuse.

Je to podle mě hodně o mindsetu. Já tomu říkám transformační projekt – AI obecně, ať už v BI nebo v jiných oblastech firmy, je často o change managementu a transformaci. Není to jen další nástroj typu Snowflake nebo Tableau se zajímavějšími funkcemi, ale jde o změnu, jak se věci dělají.

Nejsem ten typ člověka, co si myslí, že lidé nebudou potřeba. Nevím, co bude za 20 let, ale v nejbližších letech si troufám tvrdit, že lidé v těch firmách zůstanou potřební, ale práce se změní.

Mám s tím zkušenosti z různých oblastí, i s osobním příkladem. Škála možností, co jde škálovat, jak věci dělat rychleji a co nového dělat, co předtím nebylo možné nebo bylo velmi časově náročné.

Například my používáme nástroj na řízení úkolů (issue management) – máme tam tikety, které si zadáváme. Když přibyli další lidé v týmu, chtěl jsem vidět všechny změny a reporting, který nástroj umožňuje, měl API. Tak jsem si napsal konektor do Airflow, respektive do Google Cloud Composer – což je zapouzdřený Airflow – a začal využívat Antigravity (nástroj od Google podobný Cursoru), který funguje na agendovém způsobu práce.

S tím jsem komunikoval, testoval modely a vytvořil konektor, který nyní běží a tahá data každou hodinu. Pak jsem včera vytvořil konektor i na logy z Tableau Cloudu, který jsou uloženy v Amazonu, konkrétně na S3 – znám to stejně jako Google Cloud Storage.

Přijde mi skvělé, že mi AI nejen pomůže s kódem a s napsáním aplikace, ale že se s ní mohu i bavit. Například posílám screenshot nastavení nějakého transferu v cloudu a říkám: „Nastav tohle, případně na tohle sáhej jen pokud chceš, a na tohle vůbec ne,“ a AI to podle toho nastaví.

Někdy se stane, že něco nefunguje úplně správně, ale to se dá vyřešit. Pro mě je AI jako juniorní nebo středně pokročilý kolega, někde seniorní, který má obrovské znalosti a čte obrovskou knowledge base. Je to takový Google, Slash a Stack Overflow na steroidech, se kterým se mohu ještě bavit.

Dříve jsem hledal informace v knížkách nebo na webu, ale zjistil jsem, že třeba před čtyřmi lety jsem ještě řešil přihlášení do Urely (jestli to znáš), kde bylo mnoho materiálů. Tam už ale několik let nejsem, protože mi nedává smysl číst odborné knihy takovým způsobem.

Místo toho beru různé PDF z různých průmyslových oblastí, co je nového v AI a dalších tématech, dávám je do notebooku s Language Modelem (LM) a tam s tím komunikuju. Raději si přečtu nevědeckou literaturu – teď mám rozečtený Jackalanda, „Démona alkoholu“ a „Tuláka po hvězdách“ –, než se zdržovat odbornými texty.

Lidé říkají, že kvůli AI lidé budou málo číst a budou hloupnout. Mně se naopak zdá, že čtu mnohem víc, píšu i čtu víc, protože musím vstřebávat výstupy AI a procházet je. AI mi pomáhá oddělit signál od šumu, protože v různých reportech renomovaných i méně renomovaných firem bývá spousta zbytečných informací.

To mi přijde skvělé. Vidím, že před námi jsou velké výzvy, ale i obrovský potenciál. Snažím se tým motivovat, aby AI používal, protože spousta lidí už sama od sebe začíná a nebojí se ji využívat denně. Vidím ale, že to bude ještě chvíli trvat, než to všichni přijmou.

Abychom to zarámovali – kolik máte lidí v týmu? Říkal jsi, že jste pod financema, a zároveň máte AI tým – ty v BI a vedle toho AI tým. Jen abychom to dali do kontextu.

Určitě. Co se týká našeho Business Intelligence týmu, máme kolem 13-14 lidí, pak dva parttimisty a stážisty.

Navíc jsme převzali tým Ad Operations, který původně patřil pod sales. S nimi hodně spolupracujeme na kampaních, reklamě a vyhodnocování dat, sedíme spolu pod jednou strukturou. Tento tým má asi deset lidí, včetně teamlídrů.

Pod námi teď částečně spadá i proces after sales, tedy to, co udělají account manažeři a salesáci – domluví obchod, podepíšou smlouvy, a pak je proces po prodeji až do reportingu postupně pod námi.

Snažíme se to automatizovat, aby salesáci mohli snadno zjistit, jak s jakou inventurou mohou pracovat pro jednotlivé země, kolik impresí a jaký prostor mohou nabídnout partnerovi.

Začínáme řešit yield management – i když někteří s tím pracují roky, pro nás byl trh malý, ale s růstem se vyplatí optimalizovat i těch 10-15-20 % věcí, které mohou výrazně pomoci.

Yield znamená rozhodování, kde co dát – jestli affiliate, fixní kampaně nebo programatickou reklamu. To je něco, čemu se teď věnujeme.

Jen než přejdu k agentní budoucnosti v life supportu a jiných oblastech, vrátím se k produktové uživatelské analytice v B2B. Říkal jsi několikrát, že do S3 se moc nepodíváš, používáš Antigravity, protože pracujete úzce s Google Cloud Platform (GCP) a BigQuery. Platí to?

Ano, platí to zcela. V našem analytickém BI oddělení se točí vše kolem Google Cloudu. Je to středobod, kam vše skládáme a nad tím stavíme reporting.

BigQuery považuji za velmi rychlý databázový engine, který zvládá i terabajty dat během sekund. Teď už je to vlastně celý systém, možná podobný Snowflake, který rovněž směřuje tímto směrem.

V BigQuery můžeš používat integrovaný Dataform (pro ty, kdo Google neznají – je to podobné jako dbt, i když jednodušší), který umožňuje ETL procesy, míchá JavaScript s SQL, zpracovává transformace a dotazy.

Dále je tam spousta integrovaných funkcí, dokonce i možnost vizualizace již po zpracování dotazů. K dispozici jsou různé konektory, například na Looker.

Vše je v jednom ekosystému, takže analytika se dá dělat komplexně tam.

Novinkou je i konverzační analytika – například nyní testujeme agenta, se kterým si můžeme povídat nad určitými datovými výřezy, a odpovědi jsou zatím velmi kvalitní.

Náš kolega Honza Prováč společně se Zdeníkem vytvořil nástroj (něco jako Jupiter notebook), který generuje metadata a komplexní popisy sloupců a tabulek – což je důležitý základ pro konverzační analytiku.

Chceme to propojit například do Slacku – Slack neumí vykreslovat grafy, takže řešíme, jak a kdy budou grafy vykreslovány.

Toto je nyní jeden z velkých projektů, většina práce se odehrává v Google Cloudu.

Tablo ještě máme, ale já se opravdu zabývám tím, jestli ho nechat nebo ne. Nechci lidi strašit, že tablo zmizí, máme závazek do příštího léta, ale řeším pozici to nástroje, protože jsme do toho investovali značné prostředky s vizí, že tam bude self-service část.

Myslím si ale, že to tak nebude, mimo jiné možná kvůli tomu, že Tableau je nyní hodně prodáváno spolu se Salesforce, které nemáme, a verze Tableau, která se tlačí, je integrovaná s Salesforce, což já nechci a neumím si představit.

Možná Tableau udržíme jako reportingový nástroj pro omezenou skupinu lidí. Pro většinu ale nebude potřeba.

Problém je také v tom, že musím platit licenci za lidi, kteří se třeba jednou za čtvrt roku podívají do reportu.

Navíc máme mnoho lidí mimo centrálu – třeba redaktory či editory v obsahovém oddělení, kteří by chtěli sledovat například čitelnost článků – což opět cenu navyšuje.

Řešili jsme například Looker Studio, který je zdarma, ale nevím, jestli se tomu vyhneme, protože potom máme data rozesetá v různých systémech, což se mi nelíbí.

Hledám tedy, jak bude pozice Tableau nad Google Cloudem – jestli zůstane pro manažerské reporty používané třeba CEO, CFO a pár dalších lidí, a spousta dat půjde ven do Slacku dotazováním SI, nebo do jednoduchých reportů v Looker Studiu.

Je to otázka, kterou zatím řeším, mám na to zhruba rok.

Jistěže to stojí peníze, ale náklady na vizualizační platformu nejsou problémem, problém je to, že člověk je v tomto trochu limitovaný.

Máme data v BigQuery, a vzhledem k jejich velikosti nemůžeme mít u Tableau takzvané live connection kvůli rychlosti a dalším problémům.

(To bylo v původním textu nedokončené, rokli jsem to na místě, kde text končil.)

Největší problém je kvůli ceně, protože kdyby kdokoliv přišel s nějakými reporty, generovaným dotazem, a při těch asi 150 lidech, které máme v platformě, by se to mohlo pěkně prodražit. Takže je to jedna z věcí, kterou řešíme, jaká vlastně má být role tohoto nástroje, ale jinak mě Google zatím nijak nenavádí k nespokojenosti, naopak přijde super, co dělají. Mám pocit, že v posledních dvou letech neskutečně šlapou do toho, jak bych to řekl, data analytics nebo umělé inteligence.

Z databáze se stala platforma. Ano, a ty služby kolem jsou skvělé – cloud storage, data form, vůbec Airflow, které používáme, Composer a spousta dalších mikroslužeb, například Vertex AI. To je věc, která zapouzdřuje spoustu modelů a funkcí, které lze volat přes SPL-ka, BigQuery, což také v některých případech používáme. Člověk může zavolat modely přímo přes SPL-ka a vyřešit spoustu věcí tímto způsobem.

Zároveň je do toho integrovaný Gemini, máš tam konzoly, můžeš si povídat s Geminim o kódu, který tam je. Samozřejmě uživatelské rozhraní nemá takovou komplexitu a kvalitu jako třeba UI nebo Daddy, se kterým máš kurzor a různé nástroje. Myslím, že Google vyvinul Antigravity právě proto, že tam je trochu problém řešit CICD, verzování a tak dále, protože BigQuery na to není úplně nachystané, i když je cloudové, ale směr, kterým jdou, se mi líbí a my na něj stále sázíme.

Jo, a zase z těch rozhovorů...

Nejprve se změnil ten stack. Mluvili jsme o tom, že modern data stack je mrtvý. To na začátku bylo velmi kontroverzní, ale pak bylo jasné, že hyperskalery a platformizace všeho, malé nástroje s jedním účelem to budou mít hodně těžké. Teď se to ještě více projevuje, když se zvyšuje inženýrský výkon, tak už obyčejné zlepšení nástrojů nestačí.

Pro mě je to takový základní most k tomu, jak se změní nejenom stack, struktura a systém, ale také role jednotlivých částí stacku a změna role lidí v týmu – co ještě dělat manuálně a co předat agentovi. To je pro mě zásadní téma diskuse.

Ještě k tomu začnu tvrzením, že to není kouzelná hůlka. Máte totiž ohromnou výhodu v tom, jak jste pracovali se svými daty, kolik jich máte. A i když teď to nebude v tom nástroji a bude se to muset přepsat, logika se posune, ta inteligence, vědět, co data znamenají, jak pracovat s jejich komplexitou a různorodostí, to je skvělá výchozí pozice k tomu, aby se pak nějaký agent mohl pustit do práce, protože data jsou uspořádaná.

To platí hlavně u uživatelských dat, ale jak jsem zmínil dříve, revenue data často trpí problémy s kvalitou, kvůli technickým potížím. Proto si myslím, že je potřeba ošetřit spoustu věcí, například nějakou semantickou vrstvu a obecně kontext, který agent bude potřebovat. Například data se mohou velmi snadno měnit, protože v platformě dochází k úpravám, opravám, někdy je potřeba mazat nebo upravovat záznamy.

Nemůžeme mít takzvané "golden queries", které by potom sloužily k validaci výsledků agentova přirozeného jazyka, protože validace nespočívá ve srovnávání výsledků, ale v tom, že agent vygeneruje stejný dotaz. Protože query může v pondělí vracet hodnotu 19 dolarů, ale týden poté to může být 21, nebo také 18, protože došlo k nějaké korekci dat.

U nás se taková čísla mohou hýbat, a na to musíme samozřejmě myslet. To je velmi zajímavý problém, protože většina lidí vnímá data jako pravdu, od které se vše odvíjí. Když se ale data v některých částech mění přímo „pod rukama“, je potřeba k tomu přistupovat jinak.

Další záležitostí je, že děláme fixní reklamní kampaně, to znamená, že obchodník dohodne v nějakém regionu, například v Brazílii, prodej určitého objemu nějakému subjektu. Dále máme systém, do kterého se to zadává, a vše se reportuje.

Nicméně se může stát mnoho věcí. Reklama může například podávat horší výkon, což znamená, že skutečný výsledek je horší než plánovaný. Buď se to pak v rámci dalšího obchodu kompenzuje, nebo dochází k vrácení peněz, chcete-li vrátce. Něco může být podepsané, nebo naopak nemusí ještě být fakturované, ale již to evidujeme v reportingu.

Tento byznys je velmi specifický, málokdo si to dokáže představit, ale nemyslím tím, že by partneři neplatili, ale přistupuje se k tomu trochu jinak, zejména u afrických a jihoamerických zemí. V takovém rozsahu byznys vypadá jinak.

Může se stát, že s partnerem uzavíráte dohodu, ale ta již běží i přes to, že ještě není úplně uzavřená. Obvykle to řešíte týdny, ne dny, a kampaně se pustí bez čekání na dohodu. Pak může dojít k dohodě na jiné částce nebo k neshodě. Jsou tam různé situace a zřejmě musíme být sdílní.

Také se trochu data pohybují kvůli měnovým konverzím, někdy něco špatně přepočítáme kvůli zaokrouhlování. Často se nám stalo, že jsme měli v reportingu rozdíl třeba 20 haléřů, což pak způsobilo, že klient odmítl proplatit fakturu, protože čísla neseděla s jejich systémem. Takže občas vznikají takové vtipné situace, ale to už je spíše okrajové.

Takže vidím určitou výzvu v tom, jak s tímto kontextem a daty pracovat, zvláště z hlediska agentů, protože oni musí znát kontext. Myslím, že lidé v týmu by se měli obecně posouvat, a doufám, že tomu tak je. Nechci to říkat příliš formálně, ale měli by mít pojem o umělé inteligenci.

Neříkám jen obecně „vědět o AI“, ale chápat ji do hloubky – jak funguje agent, co je to RAC, jak model pracuje s kontextem. Nemyslím si, že by se museli týmy znát do detailu na rozdíly mezi jednotlivými modely. To je spíš práce AI týmu, který jsi zmínil. Ten u nás není v týmu, ale vedle, v engineeringu. Jsou to asi tři nebo čtyři lidé, kteří zajišťují enablement AI v celé firmě, spravují nástroje jako Gemini, Cloud Code a další.

Chystají nové modely, které my v enterprise zatím nepoužíváme, používáme například free verze, a máme i další zajímavé věci – generátory pro sociální sítě, generování náhledů a spoustu dalších funkcí. Je toho velmi mnoho a teď se zaměřujeme na to, co má smysl využívat.

Podle mě bude role lidí v BI a analytice velmi silně taková, že budou jakoby „pasáci agentů“. Zní to zvláštně, ale věřím, že to tak bude. Musí si totiž své nástroje ochočit, ať už jsou to modely, agenti, nebo částečně kódování.

Dříve by člověk nemusel být technický, stačilo psát SQL a tvořit dashboardy, být spíš business analytikem. Dnes si myslím, že tato role bude vyžadovat více technické zdatnosti a hlubší porozumění, praktičtější přístup, až na úroveň inženýra.

Je otázkou, zda to lidé budou dělat jako black box, kdy se jen kontrolují výstupy, nebo budou více technicky zapojeni, „otevírat černou skříňku“. Například u nás diskutujeme, jestli nad daty v rámci konverzační analytiky použít jednoho agenta, kterého postupně učíme data, nebo mít agenty specializované na různé datové zdroje (affiliate, fixní reklama), a pak master agenta, který orchestru další agenty.

Existují různé protokoly jako E2A (nebo MCPčko od Antropy), o kterých možná někteří slyšeli, někteří je používají, ale není úplně jasné, jak by se měly použít v datech, jelikož to má svá specifika.

Dále je třeba si uvědomit, že modely jsou pravděpodobnostní, zatímco data vyžadují přesnost, přesné regionální určení a konkrétní odpovědi. Modely nevytvářejí odpověď samy, jen generují kód, kterým se informace vyhledá.

Myslím, že směřujeme k větší governance, kontrole kvality. Dříve, když se udělala chyba, stačilo ji opravit jednou, dnes lze tuto chybu udělat mnohokrát, proto je potřeba na to dbát.

Líbí se mi pozice „analytics engineer“, tak trochu fullstack člověk, který může teoreticky udělat end-to-end nějaký proces, nemusí to zbytečně přesouvat do jiných týmů.

Dříve by to trvalo týden, ale člověk na to třeba neměl čas nebo nebyla jeho práce se tím zabývat. Na druhou stranu vidím riziko, že lidé mohou propadnout detailům a zbytečně spálit hodně času, proto je důležité mít jasné priority a umět ty priority správně nastavovat.

Také je potřeba naučit se formulovat požadavky, protože snadno je možné věnovat týden programování něčeho, co nakonec zjistíme, že nemá žádnou přidanou hodnotu.

To je podobné jako při nástupu nástrojů typu Tableau, kdy každý chtěl dashboard, za týden jich bylo vytvořeno patnáct, ale většinou je používal jen jeden člověk.

Myslím, že AI přinese velkou příležitost k tomu, na co jsme roky v BI zapomínali, i když v engineeringu ne. Dokumentace a review kódu, nastavení pravidel, jak by kód měl vypadat, to jsou věci, kde vidím prostor ke zlepšení.

Jak bude AI vypadat za pár let, to nevím, ale myslím si, že role klasického datového analytika, který uměl hlavně SQL a dělal vizualizace, bude velmi výrazně klesat.

Dashboardy asi nevymizí, protože někdy je potřeba něco vidět, podobně jako vidím při této nahrávce ekvalizér, který ukazuje, že se něco děje.

Ale myslím, že dashboard bude řešit jen první úroveň informací, další informace pak půjdou skrze konverzační analýzu nebo agenty, kteří budou dodat další insighty.

Takže analytici v BI budou spíše architekti těchto systémů než řemeslníci nebo elektrikáři.

Řekl bych, že dnes dokážeme díky agentům zvládnout práci menšího počtu lidí. Tam, kde dříve pracovalo třeba 30-40 lidí, dnes to zvládne 15 díky podpoře nástrojů a agentů, pokud je vše dobře nastavené.

Není to otázka mávnutí kouzelným proutkem a vše začne fungovat od zítřka, ale pokud se k tomu postupně dostaneme, můžeme zjednodušit mnoho procesů, které dříve vyžadovaly dohled nad mnoha záležitostmi a skladování různých dat.

Vše se musí odehrávat tak, aby měl business z těch opatření reálný přínos.

O tom krásně mluvil Andy Zahurajky, který postavil reportingovou mašinu a nyní se snaží vybudovat stroj nejen na insighty, ale také na akci.

Někdy nemusíš ani vidět trendovou křivku, ale potřebuješ, aby ti v tu pravou chvíli přišla SMS s upozorněním – třeba „zavolej klíčovému rozhodovateli, protože spadlo to o 20%“.

Mám pocit, že poprvé v historii je odemčené to „golden rule“ BI: správná informace správnému člověku v ten správný čas.

Proto jsme museli stavět, nebo spíše vy, protože já si ruce kódováním nešpiním už nějaký čas, průmyslové továrny, které z nepořádných dat dělají krásné reporty.

Teď je to možná něco jiného a posunuje se to tímto směrem.

Co se týče tvého týmu, zmiňoval jsi, že někdo je skeptičtější, nebo je potřeba někoho krotit, aby dva týdny nestrávil laděním v Cloud Code nebo Kurzorovi něčeho, co nemá absolutně smysl, protože je zamilovaný do nástroje a jeho výstupů, ale nevidí širší smysl.

Jak ty toto lépe řídíš? Jak se na to díváš?

Mně v tom hodně pomáhá podpora firmy, protože už loni jsme dostali do cílů oblast AI a automatizace, která tvořila až 50 % váhy ročního hodnocení.

Když se pak řeší bonusy, lidé tomu věnují větší pozornost.

Možná by se mnou všichni nesouhlasili, ale mně to přišlo jako dobrý krok.

Bylo to sice velmi vágně nastavené, ale byl jsem radši, protože jsme to probírali i se svojí nadřízenou Lindorou a částečně i s CEO Pavel Krcem.

Řešili jsme, jak to uchopit. Nebylo to tedy o tom „dělejte AI pro AI“, ale spíš o tom, aby tým lídrů a headové přemýšleli, kde jsou největší příležitosti k automatizaci.

A teď jsem to ně...

Kde jsem slyšel, a nevím, jestli to bylo u vás pod kostrou někde, že vlastně AI hodně převedla do automatizace, hodně to dokopalo věci automatizovat. Proč to bylo AI a automatizace?

My jsme zjistili, že spoustu věcí, co jsme loni udělali, nebo spoustu některých věcí, bylo docela neefektivních. A to podle mě není úplně typický AI v tom smyslu jazykových modelů.

Takže spíš jsem lidem říkal, že jestli je něco, co ti trvá deset minut měsíčně, tak nad tím neuvažuj. Pojďme po věcech, u kterých strávíš za tím víc hodin měsíčně a děláš to repetitivně, jako opakuješ to každý pondělí, každý den, každý měsíc, a v součtu to děláš hodiny.

Tak pojďme tyto věci zautomatizovat a pomoct si v určitých oblastech něčím, co nám pomůže ve větším rozsahu.

My jsme kdysi řešili situaci, kdy podle uživatelského vstupu, co tam dá, rozpoznáme, co to třeba znamená, co ten uživatel tím myslel, protože AI má výrazně větší znalostní základnu a dokáže vygenerovat více a lepší nápady než člověk. Takže i doplnění nějakých dat a pomoc v těchto oblastech.

Snažím se lidi motivovat, aby se toho nebáli, aby si nainstalovali nějaké to IDE, například antigravity kurzor, zkusili agentní vývoj, nebo si zkusili ptát, dělali třeba review kódu, nebo se s tím prostě pokusili pracovat.

Někteří jsou v tom opravdu nadšení, někdo si rozjíždí vlastní agenty, jiný spíš ten svět objevuje, a já si myslím, že je to přes nějakou motivaci. Občas je to o tom, že se snažím vést příkladem (lead by example). Dřív to bylo těžké u technických věcí, protože jsem neměl tolik času, abych na někoho zamachroval.

Já jsem vlastně radši, protože jsem o tom mluvil i s Lindou, s těmi nadřízenými a částečně i s Pavlem Krcem, naším CEO. Říkal jsem, jak to vlastně uchopit. Nebylo to o tom, že děláme AI pro AI, ale spíš bylo na nás, na lídrech týmů, na heads, abychom se zamysleli nad tím, kde jsou u nás ty největší příležitosti pro automatizaci.

Teď jsem to někde slyšel, a nevím, jestli to bylo u vás pod kostrou někde, že vlastně AI hodně převedla do automatizace, hodně to dokopalo věci automatizovat. Proč to bylo AI a automatizace? My jsme zjistili, že spoustu věcí, co jsme loni udělali, nebo některé věci, byly docela neefektivní. A to podle mě není úplně typický AI v tom smyslu jazykových modelů.

Takže spíš jsem lidem říkal, jestli je něco, co ti trvá deset minut měsíčně, tak nad tím neuvažuj. Pojďme po věcech, u kterých strávíš za tím víc hodin měsíčně a děláš to repetitivně, jako opakuješ to každý pondělí, každý den, každý měsíc a v součtu to děláš hodiny. Tak pojďme tyto věci zautomatizovat a pomoct si v určitých oblastech něčím, co nám pomůže ve větším rozsahu.

My jsme kdysi řešili situaci, kdy podle uživatelského vstupu, co tam dá, rozpoznáme, co to třeba znamená, co ten uživatel tím myslel, protože AI má daleko větší znalostní základnu a dokáže vygenerovat větší nápady než člověk. Takže i doplnění nějakých dat a pomoc v těchto oblastech.

Snažím se lidi motivovat, aby se toho nebáli, aby si nainstalovali nějaké IDE, zkusili agentní vývoj, nebo se prostě ptali, dělali třeba review kódu, nebo se s tím snažili experimentovat. Někteří jsou do toho opravdu nadšení, někdo si rozjíždí vlastní agenty, někdo spíš ten svět objevuje, a pro mě je to o motivaci a o tom, že se snažím vést příkladem (lead by example). Dřív to bylo těžké v technických věcech, protože jsem neměl tolik času, než bych na někoho zamachroval.

Ale já prostě přijdu a řeknu: „No, ale já to udělal,“ tady v tomhle projektu. Možná to není dokonalé, ale funguje to. Podle mě je to motivační – když to zvládne třeba i Tonda, tak to přece... Jasně, samozřejmě bych to udělal jinak, ale snažím se to nějak ukázat. Ne proto, že bych chtěl, ale proto, že myslím, že to dává smysl i pro mladší kolegy, kteří dělají s těmito věcmi, aby lidem ukazovali cestu, možnosti.

Super je, že u nás má AI tým název AI Ambassador Meeting, jednou za měsíc se tam setkávají lidé, ukazují nové věci, je tam prostor pro ostatní zaměstnance, ukazují se oddělení, co kdo dělá, což je takové zajímavé sdílení.

Máme ještě pravidelné týmové meetingy, kde o těchto věcech mluvíme a snažíme se ukazovat, co kde a jak.

Teď si myslím, že hodně lidí mohlo zaznamenat výsledky, jak to bude fungovat například jako konverzační analytika. To je moment, kdy možná přestaneme psát SQL dotazy na query a někdo jiný – možná AI – to udělá za nás. A možná to bude něco, co někomu řekne: „Ano, tak možná už jsme tam.“

Některé věci bych možná nemusel řešit, možná je to moje motivace: „Tyjo, musím dělat ten dashboard a…“

Propagovalo se to do hiringu? Když teď nabíráš někoho, kdo řekne, že nevěří AI, tak je v tu chvíli asi automaticky diskvalifikovaný?

Poslední pozici, kterou jsem nabíral, se jmenuje AI developer and data engineer, takže to se výrazně promítlo do náboru.

Říkal jsem si, že to chci otočit tak, aby AI byla součástí DNA lidí a pozic, tedy AI first, a nechci jim to komplikovat. Spíš vidím možnost – nepřijímám všechny pozice jen kvůli AI, ale vidím v tom potenciál.

Tak to jsi si to mohl poslat sám. Já koukám a říkám: „Víš, že je tam invence člověka, je to rozpracované, ale pro mě to znamená to, že dřív by to bylo něco, na co by si s tím člověkem sedl na pět minut, nebo mi přišlo pár bullet pointů ze Slacku, a teď mi přijde: ‚Tady mě napadlo...‘“ říkám si: „To je zase megalomanské, musí to mít nějaké hranice.“

Myslím si, že nikdo nechce generovat obsah, který začne pálit na lidi. Mluvím o tom balastu, je velmi jednoduché vygenerovat obsah, který pak hromadně rozesíláš.

Sám si promptoval s AI, něco uděláš, ale to je právě to, co bych nerad. Aby někteří lidé vzali výsledky jako čisté AI outputy a pak řekli: „Uděláš mi z toho sumarizaci.“ Myslím, že to je problém. Snažím se lidi motivovat, což by asi měli říct oni sami.

Možná je motivuje okolní svět, já netuším. Každý to vnímá jinak. Doufám, že si alespoň částečně uvědomují, že se věci mění. Neříkám, že každý má být každý den ve stresu, ale možná, kdo sleduje, co se děje, uvědomuje si, že to, co dnes umí, začíná být komodita a musí hledat, kde má přidanou hodnotu.

Myslím si, že v našem oboru – nejen v kombinaci BI a gamingu, kde působím – to bude stále znalost a kontext oboru, vztahy, protože to AI bota nemá.

Na konferencích se o nás často mluví – jsou to vztahy, lidé.

U nás, například v Rohlik.cz, chápu, že něco je automatizované a nemusí být člověk, který podle dashboardu doobjedná zboží. Naprosto chápu, že dodavatelé pak obdrží požadavky a dovezou zboží.

Ale u nás je často potřeba, aby se někdo potkal, udělal díl, a to není možné zautomatizovat. Není tam data driven možnost, že díl nemusíš udělat. Skutečně se musí potkat lidé.

Někdo nakupuje třeba reklamu, a to nikdy nebude automatizované tak jednoduše. Jistě, někdy to udělat můžeš, ale je naivní si myslet, že to lze udělat u celého průmyslu. Jsou odvětví, kde je to jednoduché, ale my působíme ve velmi regulovaném byznysu a mnoho věcí se jednoduše neudělá.

Možná doplním jeden zajímavý fakt. Kolegyně byla na konferenci v Barceloně, já nejel. Byla to konference iGamingu, sázek a podobně. Říkali tam, že hodně dochází k podvodům, kdy lidé pomocí AI vytvářejí falešné občanské průkazy, aby mohli hrát na více účtech, protože obvykle je možné mít jen jeden účet.

Nebo tak, že si třeba „vymění“ věk, že jsou mladší.

Myslím občanské průkazy.

Ano, občanské průkazy. Například v Brazílii do loňského roku neexistovalo KYC (Know Your Customer). Trh se stal loni plně licencovaným, což znamená, že většina sázkových kanceláří se stáhla, pak zažádali o licenci.

Licence může stát třeba milion až dva dolarů ročně, což pro malé firmy není možné.

Nyní musí splnit velmi přísné podmínky – například přeregistrovat všechny uživatele, které měli dříve. Tohle je příležitost pro krádeže identity, protože lidé procházejí KYC, ale dřív se registrovali jakýmkoliv způsobem.

Někdy tam byly i vícenásobné účty. Nikdo tam nechtěl být, například proto, že dotyčný je hledaný, nebo má nějaké finanční problémy.

Brazílie je obrovská země se 200 miliony obyvatel.

Často na to v Česku koukáme jako na samozřejmost, ale to je podle mě nesmysl. Podobné to je Slovensko, Polsko, ale v Německu, Rakousku se na věci dívají jinak.

Rozdíl je i v Africe, Indii, jiných státech. Nemůžeme předpokládat, že rozumíme všemu, ani když chápeme globální byznys, ale neznáme místní trhy. Můžeme mít představu, ale často nevíme, že například lokální přítomnost je extrémně důležitá, že lidé musí znát značku a mít k ní vztah.

Podnikání funguje různě, podle regionů.

Když se nám podaří, nebo v uvozovkách to self-service dostat do širší firmy a umožnit lidem, aby kdykoliv 24/7 mohli pracovat s daty, třeba se ptát – samozřejmě na omezenou množinu dat – plánujeme data přidávat.

To sebou podle mě přinese jednu důležitou věc, a to kvalitu dat a správu dat (data governance). Budeme muset více tlačit na kvalitu, možná zjednodušit některé věci, možná osekávat data, která nepotřebujeme, aby data nebyla příliš komplexní.

Co se týká revenue, tak to bude právě kvalita dat – úplnost, integrita, rychlost.

Myslím si, že zároveň budeme muset řešit roli analytiků a jejich spolupráci s lidmi, což chci otevírat.

Taky budeme muset vyřešit roli dashboardů – to bude jeden z projektů, který chci řešit.

Budeme zkoumat, jestli jsme schopni věci vizualizovat třeba i v rámci konverzační analytiky a zároveň zjistit, jestli bude potřeba mít na konci tolik nebo takové náklady na tableau (tyto nástroje).

Konverzační analytika je pro mě jasný projekt, který spojí týmy, data platform tým a inženýry v jejich rolích.

To bude klíčový projekt.

Také si myslím, že budeme muset tyto věci naučit komunikovat směrem ven.

Spousta lidí si uvědomí, že musí lépe komunikovat s koncovým uživatelem a stakeholdery svůj datový asset.

Protože právě on bude používat konverzační analytiku, a bude třeba s lidmi komunikovat, stejně jako jsme předtím ukazovali dashboard.

Třeba bude třeba monitorovat, co uživatel tam zadá a co mu systém vrací, jestli to dává smysl.

Také budeme muset řešit finance, protože nemáme tušení, jakou lavinu to spustí, kolik lidí bude „komunikovat“ s agenty, s AI, a jaké to přinese náklady, protože to je něco úplně nového.

Zajímavé časy.

Děkuju moc, držím palce!

Jak se čas zkracuje, určitě nebudeme čekat tři roky na tvou další návštěvu. Nejpozději za rok bych se rád podíval, jak se vám daří s těmito velkými transformačními otázkami a projekty, co se vám podařilo, jaká jsou zjištění.

Moc děkuju, Tondo, držím palce a ať live sport dále na globálním trhu dělá české jméno skvělé.

Dobře, moc děkuju za pozvání a doufám, že nakonec vyhrají lidé.

Děkujeme, že jste doposlouchali až sem, a díky také našim stálým partnerům a členům Data Talk klubu.

Těmi jsou Sazka, TV Nova, Direct Technologies, GoodData, Meton, Colors of Data, b.street, Flow, Karl Data Company a Intex.

Díky moc za podporu a nechť vás provází data.

Podcast

Data Talk #174: Antonín Kučera (Livesport)

Strojový přepis

Odebírejte Data Talk