Podcast

Data Talk #3: Prokop Šimon (Oddin.gg)

epizoda#3 |  vyšlo  |  délka  | 747 poslechů |   |  mp3

Nikdy neholdoval sázení ani online počítačovým hrám, ale i přesto má Prokop podle svých slov práci snů. Na starost má totiž šelmostroj a srdce celého českého startupu Oddin.gg - analytickou platformu, která je schopná v reálném čase vypočítávat pravděpodobnosti toho, jak zápas skončí, a modelovat z dat ze hry a sázení hráčů sázkový kurz pro přední světové online sázkové kanceláře. S Prokopem řešíme analytické a technické výzvy, které Oddin.gg ve stavění neuronové sítě a analytického enginu řeší, ale i tom, proč se real-time analytika bude týkat čím dál více datových projektů. Moderuje Jirka Vicherek z agentury Fenek^^.


Strojový přepis

Ahoj, zdraví vás Jirka ve Chrek a vítám vás v novém Data Talku. Data Talk je podcast s datovými profesionály pro datové profesionály a dneska tady mám jednoho datového profesionála, Data Science team leadera z českého startupu OdinGG, kterým je Prokop Šimon. Ahoj, Prokope.

Ahoj, Jirko, díky za pozvání.

Odín je velmi zajímavý český startup, hlavně tím vaším zaměřením. Myslím si, že i v té sféře datové analytiky řešíte úplně jinou oblast, než se potkáváme běžně. Můžeš nám, prosím, představit OdinGG a co vlastně děláte?

Jasný, moc rád. V podstatě v Odinu je naším zaměřením kombinace dvou světů. Na jedné straně stojí betting, sázení, a na druhé straně stojí e-sporty. Vlastně náš core produkt, to hlavní, na co se nyní soustředíme, je poskytování kurzů na sázkové příležitosti u e-sportových zápasů – jak v pre-match, což znamená před tím, než zápas začne, tak i v live části, to znamená in-game betting, když už ten zápas běží. V podstatě ta live část, ten in-game betting, je to, na co se specializujeme a kde vidíme naši konkurenční výhodu díky algoritmizaci a automatizaci veškerých procesů a změn kurzů během hry.

To je skvělé. E-sporty jsou zajímavá a rychle rostoucí oblast. Jak ses k tomu vlastně dostal? Byl jsi vždycky gamer?

Já jsem vždycky rád hrál počítačové hry, ale spíš šlo o strategie. Nikdy jsem se nedostal k Dotě, LoLku nebo CSku, k těm kompetitivním online hrám.

To jsou ty hry, které vlastně OdinGG pokrývá.

Přesně tak. To jsou momentálně tři největší e-sportové tituly, co se týkají počtu turnajů, profesionalizace, prize poolů a celého prostředí profesionálního herního prostředí. K těmto hrám jsem se poprvé dostal až ve chvíli, kdy mě začalo zajímat, jak vypadá ta hra, jejíž data zpracovávám.

Nicméně aby to bylo od začátku – já jsem v roce 2015 dokončoval na Matfyzu svoje studium na oboru teorie pravděpodobnosti a matematická statistika. Potkal jsem se s jedním kamarádem, který mi doporučil skvělého vedoucího diplomové práce. Chtěl jsem mu poděkovat, zjistit, co je nového, a zjistil jsem, že pracuje ve firmě zabývající se e-sporty. Doporučil mě na pohovor, který jsem zvládl, a tak jsem získal práci v e-sportovém průmyslu ještě dřív, než jsem měl šanci poslat životopis jinam.

Takže v roce 2015 jsem začínal v RTS, v RTS Unity jako junior přímo po škole. V RTS jsem se setkal s Vlastou Vencíkem, zakladatelem a CEO Odinu. Po nějaké době byl Vlasta mimo RTS a zakládal svoji společnost. Když jsme se znovu potkali, dal mi možnost přidat se k němu.

Jeho sales pitch byl, že budeme dělat nacenění paliva pro benzínové stanice lépe, rychleji, efektivněji, automaticky, algoritmicky, což znělo docela zajímavě. Já jsem se k němu přidal a začali jsme vyvíjet beta produkty a aplikace, kde jsme se snažili sehnat data z různých zdrojů – od dopravy přes placení. Získávali jsme informace o ranní špičce, kdy jezdí více nebo méně aut, kdy se více či méně čerpá, jaké jsou platební metody a co si lidé k tomu rádi kupují.

Naším úmyslem bylo zlepšit nacenění zákazníkům, tedy benzínovým stanicím. Myšlenka byla, že i deset haléřů na ceně benzínu může při velkém objemu udělat slušnou marži.

Takže tě Vlasta vytáhl z e-sportové analytické firmy do startupu, který se měl zabývat benzínkami. Jak se ale stalo, že z toho vznikl startup datově analytický na e-sporty?

Začali jsme vyvíjet produkt na benzínky, ale po nějaké době se ukázalo, že náš produkt v B2B segmentu bude poměrně obtížně monetizovatelný. V B2B navíc vždy znamená velkou počáteční investici a dlouhou dobu, než se člověk prosadí. Já ani Vlasta navíc nebyli jediné osoby s dřívější zkušeností v e-sportech. Asi po půl roce až roce se nám naskytla příležitost vrátit se k e-sportům a postupem času se e-sporty staly stoprocentním zaměřením naší firmy.

To znamená, že benzínkám jste se věnovali asi rok až rok a půl, ale s klesající intenzitou, a nakonec bylo jasné, že e-sporty jsou budoucnost.

Jak jsi to poznal? Bylo tam nějaké velké rozhodnutí, nebo jste dělali víc věcí a postupně to krystalizovalo? Protože to je velký pivot.

Rozhodně ano. Myslím, že k tomu by nedošlo, kdybychom neměli předchozí zkušenost s e-sporty. Vybírali jsme vlastně mezi oblastí benzínek, kde jsme žádnou expertízu neměli, a e-sporty, kde jsme měli několik let zkušeností.

Věřili jsme, že benzínky v porovnání s e-sporty nenabízí tak dynamický růst. Také jsme věřili, že když budeme v e-sportech začínat právě tehdy, budeme na správném místě ve správný čas, abychom naplnili budoucí poptávku v e-sportech.

Navíc jsme se spojili s naším prvním partnerem a investorem, který investoval právě do e-sportovního projektu, nikoli benzínkového.

Tyto faktory převážily a s klesající intenzitou jsme se od benzínků odkláněli. Navíc jsme zaznamenali problémy s daty kvůli GDPR a dalším záležitostem.

Postupně to teda vedlo k jasnému zaměření na e-sporty a benzínky jsme přestali řešit, protože prostě nebylo na čem pracovat. E-sporty nám naopak začaly brát stále více času.

No a ve světě e-sportů jsou vašimi klienty sázkové kanceláře?

Přesně tak. Jsme B2B poskytovatelé sázkových kurzů, nedržíme klienty ani jejich peníze, přímo u nás si ani vsadit nemůžete.

Poskytujeme sázkovým kancelářím řešení pro oblast e-sportů. Říkáme jim, že mají velikou nabídku ze všech možných oblastí, a e-sporty, i když jsou nyní malé, budou v budoucnu výrazně větší.

Jsme globální jedničkou v poskytování kurzů na e-sporty. To je náš business plan a cesta, kterou jdeme.

Jak velká je vaše firma nyní? Můžeš ji nějak představit?

Od začátku bylo jasné, že musíme cílit globálně, protože bez toho by ty objemy neměly smysl.

Produkt není složitě škálovatelný, protože kromě specifických licencí neřešíme exporty nebo podobné věci.

Je to technický produkt, který se škáluje sám.

Startovali jsme asi s pěti až šesti lidmi a nyní nás je kolem 70 až 80, i když vývoj dělá relativně málo lidí, asi 15, když sečtu matematický a development tým.

Velkou část týmu tvoří tradři, což jsou kolegové, kteří sledují zápasy, dozorují je a zajišťují, že modely fungují správně.

Tradři proto, že jejich práce je podobná práci lidí, kteří tradují jakékoliv jiné věci. Sice netradují aktivně na trhu, ale snaží se odhadnout férovou cenu, sledují příchozí sázky a vyhodnocují, jestli není něco špatně.

Mají také poměrně velký vliv na vývoj produktů.

To je zajímavé. Jak se člověk stane traderem?

Dobrým předpokladem je, že je gamer, což ale není nutné ani u traderů a ani u ostatních týmů.

S tím, že hráčská zkušenost je hlavní náplní pracovního času, takže je lepší, pokud člověk nějakou hru má rád.

Jinak stačí, když nám člověk napíše. Hledáme nové tradery prakticky nepřetržitě.

Hlavními kvalitami jsou zájem o oblast a základní znalost jednoduchých počtů. Člověk musí rychle odhadnout pravděpodobnosti a odpovídající kurzy včetně přidané marže.

Je to elementární matematika, kterou ale usnadňuje zkušenost.

Super. Jak teď OdinGG funguje co se týče počtu lidí, sázek, datových zdrojů a procesu tvorby kurzů? Co všechno musí proběhnout, než pošlete kurz přes API?

Jak jsem zmínil, hlavní zaměření máme na live trading, tedy na probíhající zápasy, a naše výhoda je automatizované zpracování dat.

Systém funguje tak, že na jednom konci máme datový zdroj a na druhém konci jsou feedy, což je API pro naše zákazníky, kteří si odebírají rozvrh zápasů a konkrétní kurzy.

Datové zdroje dělíme na dva typy. Prvním je API, kdy jsme schopni získat oficiální data z turnajů. Ta data jsou rychlá a čistá.

Druhým typem jsou data načítaná ze streamu, což se používá, když oficiální data nemáme.

Stream navíc není jen záložní možnost, ale i trader má za úkol co nejvíc zjistit, zda někde neexistuje nějaký stream, který unikl a který je například o 10–20 sekund napřed.

Pokud někdo má data o 20 sekund napřed, pak je vlastně úplně jedno, jak kvalitní data my máme, protože sázející s tímto náskokem má obrovskou výhodu.

V takovém případě přecházíme řešení k rozpoznání obrazu a ta data si pak z streamů vytahujeme.

Je to sice problematičtější, protože ta data je třeba čistit a může tam být chybovost, ale je to automatizovaný proces, kde trader jenom přepojí stream a systém už jede.

Pak tato data dále procházejí systémem, kde se z nich počítají regresory a ty se používají v modelech.

My v matematickém týmu do toho celého flow zapojujeme náš datový produkt, který z těchto dat generuje pravděpodobnosti.

Jakmile máme pravděpodobnosti, je poměrně snadné vytvářet kurzy, které se potom posílají dál.

Trader sedí u toho a všechny tyto části kontroluje. Máme vlastní platformu, přes kterou může interagovat, upravovat kurzy, pozastavovat je a ovlivňovat, ale systém funguje i bez jeho zásahu.

Jakmile se ve hře něco stane, kurz se automaticky změní v datech.

To je velká výhoda.

Kolik sázek zpracujete denně nebo měsíčně? Jak je to výpočetně náročné? A známe některé vaše klienty? Kde můžeme s vašimi kurzy vsadit?

Máme různé druhy klientů.

Jedním základním modelem je, že klient platí za náš feed. My mu posíláme kurzy a tím to pro nás končí.

Kurzy jsou co nejkvalitnější, ale co klient s nimi dále dělá, je jeho věcí.

Máme klienty, kteří náš feed odebírají, ale nevíme, jestli kurzy používají přímo, nebo si nad nimi dělají vlastní trading či je nějak rozšiřují.

U těchto klientů nejsme schopni přesně poznat, jak velký objem sázek prochází jejich systémem.

Na druhou stranu nabízíme vylepšené produkty, kdy nezasíláme pouze kurzy, ale také zpětně od klientů získáváme informace o jednotlivých sázkách.

To je pro nás výhodné, protože pak můžeme tyto sázky zapojit do rozhodovacího procesu a naše kurzy vylepšovat.

Co se týče výpočetní náročnosti, samotné hry a modely nejsou příliš náročné na výpočet.

Existuje ale určitý countdown, který musí kurz dodržovat, aby sázkové kanceláře byly chráněny proti rychlejším datům, která by někomu dala nespravedlivou výhodu.

Proto nemusíme mít reakční čas v milisekundách.

Naopak výpočetní náročnost roste s počtem zpracovávaných sázek.

Momentálně nabíráme nové klienty, produkt jsme spustili v roce 2020, a máme desítky klientů z různých zemí.

Jsme aktivní na všech kontinentech kromě Antarktidy.

Naše kurzy například běží na Tipsportu, což je jeden z našich nejstarších zákazníků.

Dalším významným klientem je Betway, to je relativní novinka.

Máme také spolupráci ve Vietnamu, kde spolupracujeme s jediným licencovaným poskytovatelem sázek na e-sporty.

Všechny tyto novinky najdete i na našem LinkedInu, kde jsou veřejně dostupné jako marketingová prohlášení.

Počet sázek se výrazně mění v průběhu roku, zejména při velkých eventech nebo integraci nových velkých klientů.

Nedávno jsme začali spolupracovat s klientem, který je větší než všichni předchozí dohromady.

Myslím, že tento růst není poslední.

A pro vás to zřejmě znamená, že můžete model optimalizovat s reálnými nákupními a transakčními daty.

Rozhodně, to je nejzajímavější část a také nejvíce výpočetně náročná část. Aktuálně jsme schopni dělat nad sázkami různé analýzy a poskytovat doporučení.

Například traderům a do budoucna bychom chtěli vyvíjet nějaká naše vlastní algoritmická řešení, která by vlastně spojovala odhad naší férové ceny z modelu a některých tiketů. Myslím, že jdeme postupnou cestou, kdy spolupracujeme s tradery, kteří mají zkušenosti a postupně nám dávají tipy. Tyto tipy se snažíme zapracovávat do našich systémů. V podstatě digitalizujeme jejich zkušenosti a zapracováváme je. Snažíme se vytáhnout věci, které jsou čitelné, jednoduché a opakující se, a implementovat je do algoritmů nebo heuristik.

Co to znamená pro práci tebe a tvého týmu? Jaké výzvy řešíte a co budujete? Skoro to zní, jako byste postavili jeden model, který skvěle funguje, prodáváte jeho výsledky a jde o nějaký black box, který sázkové kanceláře využívají, protože sami to neumí a jedná se o oblast, kterou ještě dobře neznají. Zní to až jednoduše, ale vím, že to jednoduché není. Takže mám několik otázek. Za prvé: Jak to, že jste tak dobří?

Je to způsobeno tím, že e-sport je nová kategorie, nebo že jste dali dohromady opravdu skvělé matematiky a vývojáře? Jak vypadá trh a máte konkurenci globálně?

Myslím si, že naše výhoda je v relativně dlouhé expertíze v oblasti e-sportu, jak jsem zmínil na začátku. Oblast je hodně mladá a každý rok se v podstatě počítá. Zároveň jsme jako firma vznikli v roce 2018 a všechny naše přístupy jsme mohli navrhnout podle tehdejších standardů. Náš produkt je tak šitý na míru a moderní. Ve srovnání se sázkovými kancelářemi, které vznikaly v 50. letech a teprve postupně přecházely na digitalizaci, je reakce na změny u nich mnohem pomalejší.

To je podle mě důvod, proč mohou nové firmy uspět – jsou flexibilnější než zavedení hráči. To beru jako dva hlavní důvody. Na začátku nebylo jasné, zda nejsme příliš brzy na trhu, ale například koronavirus nám pomohl. V roce 2020 bylo několik měsíců, kdy se žádný klasický sport nehrál, pouze e-sport. To byl nejsilnější argument pro naše uplatnění. Říkali jsme si, že se taková situace může opakovat za rok či dva a musíme být připraveni přepnout nabídku na e-sport a fungovat dál, jako by se nic nestalo. Rozhodně jde o zkušenost na mladém trhu, která je v tomto kontextu neocenitelná.

Jaká je tedy ta zkušenost? Čím je trh s e-sportovním sázením tak specifický, že je tato zkušenost natolik relevantní? Mají ty věci, které se v e-sportu učíte, nepřenositelnou povahu? Z datového pohledu – čím je e-sport betting trh unikátní?

Myslím, že to není unikátní jen pro e-sport, ale zkušenost je výhodná v tom, že při modelování e-sportových her nebo tradingu existuje hodně slepých uliček. Vývoj modelů lze dělat prakticky neomezeně dlouho. My už teď známe některé limitace a slepé cesty a máme lepší představu, co funguje a co ne. Umožňuje nám to, že ke každému kurzu jako poskytovatelé přidáváme určitou marži, což je náš polštář. Ten nám umožňuje nabídku držet otevřenou déle i s drobnou chybou, která pro nás není zásadní, protože marže nás chrání.

Takové věci se člověk postupně naučí. Je jich mnoho a právě to představuje zkušenost, kterou máme a stále zvelebujeme.

Máš něco, co objevuješ v analytice a modelování e-sport sázení a kurzů, co by mohlo platit i v jiných online oblastech? Třeba real-time analytika je nyní všude zmiňovaná.

Každá firma chápe pojem real-time jinak – někde jsou to milisekundy, jinde sekundy nebo dny. Vidíš v tom změnu přístupu k datům nebo nové produkty díky tomu, že se data zrychlují a máme jich více?

Svojí zkušenost mám zatím pouze z e-sportu, ale vidím výrazné paralely mezi klasickými sporty a e-sporty, zejména v přístupu a modelech. Často se snažíme u nových her čerpat z něčeho, co už bylo řešeno, někdy najdeme podobnosti, jindy ne. Daří se nám používat podobné metody pro podobné hry. Typickým příkladem jsou hry jako Dota, League of Legends, Kings of Glory (mobilní verze Lolka) – všechny jsou založené na podobných principech.

Přemýšlel jsem, co by bylo obdobou e-sportu v nějaké úplně jiné oblasti, ale kromě propojení s klasickými sporty mě nic nenapadá. Myslím, že významnou výhodou e-sportu je množství a kvalita dat, která jsou dostupná. V klasickém sportu se data také zlepšují, například v nejvyšších ligách jsou podrobné informace o výkonu hráčů. Věřím, že tyto oblasti se budou vzájemně přibližovat.

Kromě klasických e-sportů začínáme dělat i e-sportové analogie klasických sportů. Například pracujeme na e-sportní verzi fotbalu. Už máme produkt, kdy děláme e-sportové fotbalové zápasy, což spojuje model klasického fotbalu s e-sportovními specifiky. To byla zajímavá výzva, které jsem se osobně věnoval asi před půl rokem.

To je opravdu fascinující. Jak se z pohledu sázkových kurzů a modelování přibližujete k FIFA fotbalu?

Začali jsme klasickým fotbalovým modelem, ale zjistili jsme, že góly padají mnohem rychleji a jich může být více než v normálním fotbalu. I když zápas v e-sportu trvá dvě krát čtyři minuty, výsledky byly spíše podobné hokeji než klasickému fotbalu. Hodně jsme museli ladit čas, protože rychlost hry a zbývající čas ovlivňují model. Museli jsme zkoumat, kdy góly padají, jaká je minimální doba mezi jednotlivými góly, která může být velmi krátká.

Navíc pravidla nebyla přesná; pokud poločas trvá čtyři minuty a hraje se do dohrávky, může být přidána i minuta navíc. Byly to spíše kalibrační úpravy. Obecně model pro klasický fotbal fungoval, ale bylo třeba doladit mnoho parametrů.

Jak modely udržujete a optimalizujete v čase? Jak jsou verzované a jak fungujete jako tým v praxi? Předpokládám, že to není jednorázová práce – stále přicházejí nové výzvy.

To předpokládáš správně. Čím více modelů máme, tím více práce s nimi časem vzniká. Jako firma máme backend napsaný v Kotlinu, což je developerská platforma. Matematické modely, data a reporty mají na starost matematici, kteří pracují v Pythonu.

Protože nejsme zaměřeni na vysoce frekvenční modelování, můžeme si dovolit používat Python i v produkci, což je pohodlné.

Firma běží na AWS, což je příjemné z hlediska škálování. Produkční části matematického týmu máme v cloudu, ale jedna z výzev je přesun tahání a přípravy dat, generování regresorů a přetrénování modelů z lokálních počítačů do cloudu.

Je to zajímavá, nová oblast s mnoha možnostmi automatizace, ale zatím jsme někde na půli cesty. Například už jsme schopni vyzvednout data hned po skončení hry a data jsou k dispozici, ale ještě nejsme ve stavu, kdy by se modely přetrénovávaly automaticky každý den, reporty se samy odesílaly a systém běžel zcela autonomně.

To zatím není úplně realita, že bychom přišli do práce, dali nohy na stůl a sledovali, jak se modely samy přetrénovávají, ale pracujeme na tom.

Testujete modely na historických datech? Jak moc se to dá? Sázkové kanceláře totiž před rokem nemusely mít hodnotu, protože hry a jejich hrdinové se výrazně měnili. To je hodně diskutované téma v e-sportu.

To je velmi dobrá otázka a jedno z hlavních témat, které řešíme od začátku a stále řešíme. Hry pravidelně přicházejí s patchemi, které mění podmínky hry, aby ji vyrovnaly. To jde proti tomu, co se snažíme v modelech zachytit – dlouhodobé fungující vzory.

My se snažíme v modelech najít něco, co funguje, ale patchy tyto efekty negují a vrací hru zpět do rovnováhy. Proto sázkové kanceláře z loňska a nyní jsou v zásadě stále relevantní, ale sázejí na trochu jinou hru.

Tento efekt je výraznější v League of Legends a Dotě než v Counter-Strike, kde jsou změny minimální, například v cenách některých zbraní nebo jedné mapě.

Změny mapy pro nás znamenají jen parametrizační úpravy. Jinak jsou sázky od sázkovek pro nás vynikajícím zdrojem informací. Jde o real-world testování našich modelů, tedy co si o nich myslí zbytek světa.

Velmi důležité je pro nás analyzovat tikety – které jsou ztrátové, kde jsou slabiny modelu, kde lidé vydělávají. Na začátku, když jsme šli poprvé na trh, jsme zjistili, že i jednoduché sázkové strategie dokázaly naše modely porazit.

Právě tak začala naše validace – přehráli jsme si tikety, našli slabá místa, vylepšili modely a opakovali.

Aktuálně máme některé strategie připravené a pokud se objeví lepší data nebo modely, porovnáváme jejich výkon například na jednoduchých strategiích.

Pro nás, kdo jsme nikdy nesázeli, co jsou ty jednoduché strategie?

Znám například sázení na černou, což funguje. Na našich prvních modelech před dvěma lety to byla strategie:

  • sázet na favorita,

  • sázet na velkého favorita,

  • sázet na malý počet gólů,

  • sázet na vysoký počet gólů.

Strategie fungovaly tak, že kdyby v nabídce byl favorit za kurz menší než 1,2, prostě bys na něj vsadil.

Tohle jsme nikdy předtím neověřovali a také patří do našeho know-how a pochopení specifik sázení.

Ještě bych se vrátil k tiketům – kromě toho, že nám dávají náhled na to, co sázící zkouší využít za informace, jsme schopni nasimulovat, jak by na novém modelu dané tikety vypadaly.

Nepoužíváme rok staré tikety, většinou jsou to spíše tikety z posledních měsíců. Proto je pro nás velkou výhodou, když přidáme velkého klienta, protože získáme obrovský objem aktuálních tiketů.

Jsme schopni pro každé vsazení tiketu spočítat kurz podle nového modelu, který chceme použít místo starého.

Samozřejmě nevíme, jestli by se tikety za těchto nových kurzů skutečně objevily, protože sázkaři sázejí za kurzy dané v době vsazení.

Přesto to poskytuje velmi dobrou indikaci směru, kam by se kurz modelu měl pohybovat.

Trénujeme modely podle ztrátové funkce, kterou se snažíme optimalizovat, ale ta nevyniká tím, kam přesně zaměřit pozornost.

Tikety představují jakousi zlepšenou ztrátovou funkci, která klade největší váhu na oblasti, kde lidé vsadili nejvíce peněz – což je klíčové, protože tady může dojít k největším ztrátám.

Z tohoto pohledu jsou a jednoduché strategie, i tikety vlastně vylepšeními ztrátové funkce, která více odpovídá reálnému použití modelu.

Pro vás je ztrátová funkce tedy to nejdůležitější, co optimalizujete?

Takto jsme začínali.

Jak jsem už zmiňoval, hlavně tikety nás vedly k tomu, že jsme se začali víc zabývat validací modelů.

V poslední době jsme sice nepřišli s revolučními nápady na vývoj modelů, ale rozhodně jsme si ujasnili, co naše modely umí, kde mají slabiny a jak je využívat.

Ztrátovou funkci máme definovanou, abychom měli benchmark a mohli měřit zlepšení.

Používáme nejjednodušší přístupy na začátku a postupně jdeme ke složitějším, pokud to dává smysl.

Nejdůležitější je pro nás vědět, jak se model chová a kde může chybovat.

Specifikum sázení je, že sázky na první pohled mohou vypadat rovnoměrně, ale ve skutečnosti jsou sázky výrazně koncentrované v určitých oblastech.

(Pro zbytky textu chybí pokračování.)

Riziko je špatné, proto sázejí více. A úplně nejvíce sází, když je kurz velmi nevyhovující. To znamená, že se snadno může stát, že pokud bychom měli model, který 98 % času funguje správně a 2 % špatně, ale hodně špatně, tak nám těch 2 % v podstatě vymažou veškerý zisk z těch 98 %. Můžeme tedy skončit i s modelem, který má celkově horší ztrátu (loss).

Na druhou stranu v situacích, kdy model má svá slabá místa, není to tak špatné. Je vlastně v určitém smyslu konzistentnější. To znamená, že se určitě musíme dívat na mnohem více dimenzí, a to je něco, co nás naučil kontakt s reálným světem. Protože jsme museli do určité míry replikovat sázející, museli jsme se dívat na to, jak oni přemýšlejí a na co sázejí. Myslím si, že jsme byli schopni i vylepšit téma loss funkce, aby nám lépe seděla, ale nejsme schopni pomocí jediné loss funkce vystihnout všechny dimenze.

Takže je to zatím vždy o nějakém lidském úsudku, kdy sledujeme, jak model funguje z různých úhlů pohledu. A samozřejmě ve chvíli, kdy se model testuje, je jedním ze základních požadavků i to, aby herní expert či trader, který na model pohlíží, byl s modelem v podstatě ztotožněný a aby mu dávalo smysl, co model dělá. Protože on je nakonec koncový uživatel pro nás a jediný účel týmu je vytvářet dobrý produkt právě pro trading a vlastně i pro náš odsfeed jako takový.

Co máte nyní v plánu? Jaké další věci máte ty a tvůj tým v plánu? Jaké jsou další milníky a výzvy?

Pipeline je dlouhá. Máme mnoho plánů, jak ty naše interní, tak i požadavky od zákazníků. Zlepšování modelů je nikdy nekončící proces. Ve chvíli, kdy rosteme a máme větší objemy, dostáváme se do situací, kdy i relativně malé procentuální zlepšení má velký dopad na větší objemy.

Zlepšování modelů je tedy kontinuální práce, nicméně ji musíme vyvažovat s jinými plány. Jednou z hlavních příležitostí je přidávání nových sportů. Neustále hledáme nové, zajímavé sporty, u kterých existuje dobré zázemí v podobě organizátorů turnajů, fanoušků, sponzoringu a podobně. Nezaměřujeme se na sporty, které mají pouze přechodný hype, ale spíše potřebujeme dobře zavedené prostředí.

Proto jsou pro nás tři největší e-sporty stále Dota, League of Legends (LOL) a Counter-Strike (CS), což byste slyšeli i před pěti lety. Je to hlavně setrvačnost a fakt, že se jedná o hodně zavedené prostředí.

Další výzvou je jednoznačně zlepšená práce s takzvanými „ketty“ (pozn. termín není vysvětlen, pravděpodobně jde o terminologii z dané oblasti), protože to je náš svatý grál. Kdybychom byli schopni shromáždit na jednom místě názory našeho modelu na fairprice, názory celého světa přes tyto ketty a navíc hodnocení trhu, tedy jak vnímají situaci naši konkurenti, mohli bychom z toho vytvořit ultimátní cenu, respektive kurz, který bychom vypisovali. To je oblast, která nám vydrží velmi dlouho jako výzva.

Jak jsem také zmiňoval, nové sporty nemusí být pouze e-sportové tituly, mohou jít i o nějaké analogie klasických sportů, například rozšířit náš aktuální fotbalový produkt o další aspekty.

Naše situace je taková, že získáváme stále více zákazníků i ketů, zvyšuje se nám objem a snažíme se to celé nějakým způsobem zvládnout. Celá naše práce má totiž i velký overhead ve smyslu udržování, vylepšování existujících funkcí, tvorby nových funkcí, řešení bugů a podobně. To nám samozřejmě bere čas, ale zároveň nás posouvá dál a dál.

Současně s růstem zákazníků a ketů se snažíme zvládat i náš růst jako firmy. Už delší dobu nepřetržitě hledáme nové kolegy a kolegyně do matematického, developerského i trading týmu. Pokud by vás tato oblast zaujala, určitě se podívejte na naše stránky nebo mě kontaktujte na LinkedInu, rád si s vámi popovídám.

Co tě na tom ještě pořád baví? Po sedmi letech, i s krátkou přestávkou u benzínek, co ti dělá v této práci největší radost?

Myslím si, že jedna z velmi zajímavých věcí je, že kdybyste přišli do naší firmy s zavřenýma očima a slyšeli vzrušenou diskuzi o tom, jestli má pick and ban velký nebo malý vliv na výsledek zápasu v LOL, nedokázali byste poznat, jestli se právě odehrává týmový meeting, nebo jen neformální rozhovor u kávy v kuchyňce.

To je věc, která mě asi nikdy neomrzí, protože toto jsou naše skutečná témata, která řešíme. Nikdy bych si nepředstavoval, že takto bude vypadat můj pracovní čas místo volného času.

Musím říct, že jsem i trochu více ocenil e-sporty jako takové, protože čím více se o nich dozvídám, tím více v nich vidím aspekty, které jsem si předtím neuvědomoval.

Například Dota je velmi náročná hra díky množství všech možných proměnných a herních situací, které mohou nastat. Nejde jen o mechaniku a dobře odehraný zápas, ale je potřeba mít vše dobře promyšlené. Je to nikdy nekončící výzva.

Jde o to, že se snažíte najít funkční myšlenky, chytré strategie, co vlastně druhá strana dělá a jak na to mohu zareagovat. Je to jako napůl detektivní práce a to mě na tom hrozně baví.

Baví mě i vy a ty také. Děkuji moc, že jste pozvání přijal.

Děkuji za pozvání a za to, že jsem mohl být dnes hostem DataTalku. Věřím, že to nebylo naposledy.

Díky za pozvání, Jirko, děkuji, že jsem tu s tebou mohl dnes mluvit, a těším se na další DataMesh. Na shledanou.

Na příštím DataMesh nebo uslyšíme se u DataTalku. Na shledanou.

Na shledanou.

Děkujeme, že jste poslouchali DataTalk až do konce. Jak se vám tato epizoda líbila? Co byste na našem podcastu vylepšili? Koho pozvat příště? Dejte nám prosím vědět, co si myslíte. Můžete to udělat osobně na příštím DataMesh meetupu nebo hned teď na e-mail jirkazavináčdatatalk.cz.

Pokud se vám epizoda líbila, doporučte ji prosím dál. Klikněte na srdíčka, na hvězdičky, dejte odběr, ať nám svítí dashboardy zeleně, křivky tvoří stoupající trend a všichni stakeholderové schvalují dodatečný rozpočet.

Ještě jednou vám děkujeme. Poděkování patří také mým kolegům, Nikovi a Iris, stejně jako členům našeho partnerského klubu — Big Hubu, Deep Note, Atakameně a Mantě.

Pokud máte návrhy, tipy na hosty, témata, pořádáte vlastní akce nebo byste chtěli podpořit datovou komunitu jinak, určitě mi dejte vědět. Děkuji.

Nechť vás provází data.

Odebírejte Data Talk

Apple Podcasts Spotify Deezer Overcast Podcast Index RSS Feed