Data Talk #66: Johnson Darkwah (Gauss Algorithmic & Kapnetix)

Dnešní host Data Talku je Johny Darkwah, CEO Gauss Algorithmic a co-founder Kapnetix, s 17+ lety v datech. Začínal v Telcu, kde postavil největší Oracle systém té doby. V Gauss Algorithmic se začal věnovat ML a AI a postupně přešel ze Solutions architekta na pozici CEO. Jeho zápal pro herní průmysl vedl k založení Kapnetix, kde pomocí AI urychluje motion capture. A o tom bude dnešní díl, který moderují Jirka Vicherek a Barbora Hinnerová.

Strojový přepis

Dobrý den, moje jméno je Jirka Vyšerek.
Ahoj všem, moje jméno je Barbora Hinerová.
A vítáme vás u dalšího dílu Datatolku.

Naším dnešním hostem je Johnny Darkvach, CEO firem Capnetics a Gauss Algo.
Ahoj, zdravím všechny.
Ahoj Johnny, děkujeme.
Ahoj.

Dneska se s Johnnym budeme povídat o datech v gamingu. Ale než se k tomu dostaneme, Johnny, pověz nám, jak ses dostal k datům?

Tak ten můj příběh začal asi před sedmnácti lety. Byl jsem na škole v prvním ročníku a neměl jsem peníze, takže jsem potřeboval nějakou brigádu. Obcházel jsem různé… McDonaldy. No, McDonaldy mě úplně nebavily, ale obcházel jsem různé agentury, které by mi snad mohly pomoct. A přes různé pohovory jsem se dostal do firmy, která se tehdy jmenovala Logica CMG. Postupně se přejmenovala na SGN a byla to jedna z největších společností vyrábějících řešení pro mobilní operátory. Oni vlastně kdysi dávno vymysleli SMS a MMS komerčně. A tehdy, někdy kolem roku 2007, zhruba sedmdesát procent SMSového trafiku na světě právě procházelo těmito systémy. Já jsem tam měl na starosti data, vůbec zpracování.

To jsi to dělal za školu?

No, jakože v prváku jdeš jinak, místo do McDonaldu přihazovat burgery, tak přihazovat data, jo? Takže nám běžely SMSky. Byl jsem na Vysokém učení technickém v Brně, studoval jsem elektrotechniku.

V Brně?

Ano, v Brně. Ale byla tam taky ČVUT, Barboro. Já jsem studoval vlastně dvě školy zároveň, zkusil jsem i zemědělskou, ale vzal jsem si možná až příliš velký soustop. Brno je lepší. Minimálně jsem se o teleinformatiku, nějaké komunikace, signály zajímal, takže proto byla práce tady na tom nějakým způsobem lákavá. Ale tehdy firma potřebovala supportáky, lidi, kteří uměli aspoň nějaký základní Linux a SQL. Já jsem vlastně ani při nástupu nevěděl, co přesně budu dělat.

No, to bývá tak nějak běžně.

Ale dostal jsem se do velmi dobrého týmu. Ti kluci, kteří tam byli zkušení, mi hodně pomohli, abych postupně dostal svůj skill na zajímavou úroveň. Ale především tam byla Oracle databáze, kterou tehdy ani ve škole neučili. Bylo to poměrně drahé Oracle databázi provozovat, ale umožnilo mi to začít zpracovávat opravdu velká data, která tehdy byla. Mobilní operátoři měli opravdu hodně informací, které mohli sbírat.

Takže sis potom chvíli točil kolem telekomunikací, zabýval ses Oracle databázemi a podobně?

Ano, byl jsem tam zhruba devět let. Postupně jsem šel od supportáka k něčemu, co se jmenovalo deployment engineer. Začal jsem cestovat po světě, vybaloval servery z krabic, instaloval software a vkládal je do racků. To bylo jedno z nejzajímavějších období mé kariéry, protože jsem navštívil přes sedmdesát zemí, včetně těch, kam se člověk běžně nedostane. Možná i některé, kam jsem ani nechtěl, ale práce je práce.

A jak data začala přibývat, firma se začala zajímat o nové technologie, protože zpracovávat je na Oracle už nestačilo. Jeden z mých klientů byl Sprint v Americe, tehdejší jeden z největších mobilních operátorů. Oracle systém už nestíhal. Měli jsme prostředky rozšiřovat systém, ale narazili jsme na technologické limity.

Takže jste přešli na systémy vyvinuté technologickými firmami jako Yahoo, Google a další, které byly distribuované a umožňovaly jiný druh výpočtu. Tak jsem se postupně dostal k tématu velkých dat.

Moje kariéra pokračovala dál. V poslední pozici jsem byl datovým analytikem a chyběly mi metody, jak zjistit fakta, která klasické SQL neumožňovalo. Měli jsme produkt, který umožňoval lidem s předplacenými kartami si vzájemně platit účty. Například děti měly kredit a když jim došel, služba automaticky posílala odesílateli SMS, jestli nechce zaplatit zprávu, kterou dítě chtělo poslat. Bylo pro nás důležité poznat, jestli to opravdu bylo dítě, nebo jestli šlo o lidi z byznysu, protože to pomáhalo rozšiřovat produkt.

Já nebyl úplně zdatný v algoritmech, tak jsem se začal zabývat možnostmi machine learningu. Čirou náhodou v Brně byla firma, která se tomu věnovala, a já už po devíti letech v jedné firmě byl otevřenější novým příležitostem, tak jsme navázali spolupráci.

A kdy jsi tedy přešel do Gausu?

Myslím, že to bylo na přelomu let 2015 a 2016. Začal jsem tam jako zaměstnanec a později jsem se stal CEO.

Dnes tady tedy sedí pan CEO.

Ano, i když jsem stále zaměstnanec. Vést firmu má své klady i zápory. Jsou euforické dny, ale jsou i dny, kdy vás to budí v noci.

Představ nám Gaus. Jak firma vypadá dnes, kolik vás je, co děláte?

Gauss Algorithmic pomáhá firmám implementovat především technologie kolem umělé inteligence, strojového učení a částečně se zabýváme datovým managementem. Pomáháme firmám téměř v jakémkoliv odvětví, nejsme zaměřeni pouze na bankovnictví nebo telekomunikace. Jsme aktivní v asi dvanácti odvětvích, kde firmy působí různě. Zvolili jsme zakázkový vývoj, protože není mnoho firem, které to v této oblasti nabízí.

Když jsem začínal, prodávat strojové učení a hluboké neuronové sítě na trhu v letech 2015–2016 nebylo úplně jednoduché. Většina lidí si nedokázala představit, co to může pro firmu znamenat. Proto jsme se zaměřili na datový management a na něm firma vyrostla. Naše specializace byla velká data, hodně jsme spolupracovali s mobilními operátory a bankami, které měly velké množství dat.

Naše projekty jsou více infrastrukturní a konzultační, specializujeme se na machine learning ops, infrastrukturu a škálování dat. Snažíme se nabízet end-to-end řešení, protože zákazník přijde s požadavkem na koncové řešení, ale je potřeba zjistit, zda je vůbec možné machine learning v požadované podobě dodat. Pak ověřujeme, zda má zákazník data, zda je technologicky připraven, děláme proof of concept, testy a postupně implementaci.

Musíme zákazníka provést i datovým managementem a porozuměním algoritmů. Často také nemají jasné představy, kde chtějí machine learning provozovat.

Před asi dvěma lety jsme se rozhodli provozovat i vlastní cloudový stack pro machine learningové modely. Zákazníci tak při spolupráci mohou hned začít používat naše prostředí, kde máme API nebo konektory. Vznikl nám tak model předplatného s opakujícím se příjmem.

Ty doby, kdy se takové systémy netvořily, jsou pryč. Bylo to jedno hezké období, protože je potřeba občas svět sledovat z dálky.

Super, teď bych se přesunul do gamingu. Před natáčením jsme si povídali, že se vám povedla neuvěřitelná věc – získat předního klienta a produktivizovat konzultační know-how. Jak se Gauss dostal do gamingu? Z telekomunikací a bankovní sféry to přece jenom je dlouhá cesta.

Myslím, že pro mnoho odvětví, nejen gaming, bylo složité potkávat se s firmami jako jsme my. My máme svoje konference, oni své. Nebylo příliš příležitostí se potkat. To neplatí jen v gamingu, ale třeba i ve výrobních firmách. Proto jsme investovali čas a chodili na akce, které nebyly naše tradiční. Právě na jednom takovém eventu jsme se potkali s herní firmou. Povídali jsme si o tom, co děláme, a téma umělé inteligence je zaujalo, protože ji chápali spíš jako automatizaci. V gamingu standardně znamená „umělá inteligence“ něco jiného – chování postavy, které je pevně naprogramované. V budoucnu uvidíme.

Co nabízíme my, oni spíš chápou jako automatizaci, kdy algoritmy nebo neuronové sítě něco dělají – to je pak druhá věc.

Takže jste se potkali na eventu?

Ano, potkali jsme se na eventu, který nebyl čistě gamingový. Byla to akce spojující dvě různá odvětví – kreativní průmysl. Setkali jsme se tam s filmaři, což jsou lidí, kteří se často nepotkávají s herními vývojáři.

Z toho vznikl nápad, na kterém jsme začali pracovat konzultacemi, zkoumali jsme, co je zajímavé. Nebavili jsme se o AI-generovaných postavách. Největší zájem byl o zrychlení vývojového procesu.

Kdy se to celé začalo?

Začalo to asi před dvěma lety. Výzkum a vývoj občas trvá déle, než se dospěje k podstatným výsledkům. Už se ale modely využívají v reálné hře, která je dnes na trhu.

Takže hlavní motivací bylo zrychlení vývoje her?

Ano. Myslel jsem, že půjde o snížení nákladů, ale v jejich situaci je na prvním místě kvalita a na druhém, zda kvalitu zvládnou dodat v termínu. Každá hra má datum vydání, které se zhruba v polovině vývoje stanoví, což znamená velký tlak na tým. Kvalita je pak rozhodující, protože špatná hra může hru zcela zničit. Komunita je nelítostná.

Protože váš klient je anonymní, bojím se jmenovat konkrétní tituly.

Upřesním pro posluchače: bavíme se o počítačových a konzolových hrách, ne o mobilních hrách. Jedná se o AAA tituly, tedy velké hry známé široké veřejnosti.

Výzkum má k dispozici nejkvalitnější data, protože zařízení, která data produkují, jsou špičková, i když stále ne dokonalá. Někdy data chybují, což je způsobeno prvky fyziky, které brání dosažení ideálního výsledku na první pokus.

Říkáš data, můžeš být konkrétnější?

Data vnímám jako jakýkoliv přírodní jev, který lze vyjádřit čísly a vzorci. Může jít o obrazy, zvuky, spektra a podobně. V 3D animacích pracujete v prostoru, kde se k datům musíte chovat jinak než v klasickém datovém skladu. Musíte chápat souvislosti jednotlivých bodů a jejich interakce v prostoru.

Když máte herní postavu, tak znáte fyziologii těla, což jsou další data, která musí být zahrnuta, aby nebyly například nepřirozeně vykloubené ruce – což vypadá ve hře nepřirozeně.

Pak jsou data ze samotných konzolí, například logy, která všechna lze využít k analýze a zpracování.

Kde jste tedy začali? Máte mnoho možností využití dat a automatizace ve firmě, zaměřili jste se na vývoj her? Nebo spíše na online hry a zvyšování zisku s hráči?

Zaměřili jsme se opravdu na tvorbu produktu, tedy vývoj her.

Co se děje potom?

Co požadujete jako první? Chcete třeba optimalizovat práci vývojářů? Jak jste přišli na to, že řešit animace a 3D prostor je vhodné?

Nejzásadnější je pochopit problém a „bolavé místo“. To děláme standardně workshopy a rozhovory s lidmi. Snažíme se být u klienta na místě, abychom poznali jeho prostředí a každodenní práci. Abychom položili správné otázky.

Já osobně se snažím dostat ze člověka, jak vypadá jeho pracovní den, co dělá, a aby nám ukázal příklady své práce. Potom to v hlavě spojuji s datovými toky a algoritmy, které by se mohly použít.

Cílem je najít ideálně první příklad, který se dá udělat relativně snadno. Nehledáme hned velkou věc, protože to bývá nejtěžší.

Když máte prvního klienta, snažím se ukázat superschopnosti, kterým začne věřit.

V této oblasti jsme se dívali na programování, animace, QA a testování. Zrovna QA byla část, kde…

Myslíme si, že dlouhodobě bude největší úspora právě zde. Pro ty, kdo možná ten proces neznají, může se testování hry jevit jako sen mnoha lidí: sednout si a jednoduše si zahrát danou hru a projít se jejím světem. Avšak hra v této fázi vlastně vůbec nevypadá, jak by se mohlo zdát. Vidíte šedého panáčka, který skáče po různých platformách. Záleží na tom, v jaké části hry se nacházíte, ale je to poměrně nezábavná záležitost.

Létají vám před očima logy. Není to nic, co by bylo zábavné, žádná legrace. A v konečném důsledku, když se vám něco nepovede, musíte to opakovat několikrát. Než se dostanete k příslušné části, najdete problém, vytvoříte reprodukční scénář – tu jednu část hry třeba hrajete třicetkrát za sebou. Zkrátka to je v konečném důsledku noční můra každého hráče. Někteří hráči dokonce říkali, že když odchází z práce, jdou domů zahrát si normální hru, aby si spravili náladu.

Je tam totiž takový strach, podobný tomu, když pracujete v řeznictví a když pořád vozíte maso, můžete ztratit chuť na maso. Takže i podobné pocity tam jsou. Nicméně QA (kontrola kvality) je poměrně složitá, protože zahrnuje nejen sběr a analýzu dat, ale je také nutné vracet výsledky zpět do hry, aby bylo možné jej efektivně řídit. Proto bude automatizace tohoto procesu vyžadovat více času. Je třeba rozebrat celý proces na menší části a podívat se na ně detailněji.

Nejzajímavější pro nás byly animace. V animacích jsme zjistili, že v jednom procesu, který se nazývá motion capture, existuje část zaměřená na postprodukci. Říkají tomu čištění. Herci si navléknou speciální obleky, na kterých jsou reflexní markery – malé balónky, na které míří infračervené světlo, které se odráží zpět do kamer. Díky tomu získáme nějaké body v prostoru, které je potřeba zpracovat.

Do těchto dat je vložena kostra, aby výsledný pohyb vypadal přirozeně. Následně se na kostru obalí tzv. rig – tělo postavy. Nevím přesně, jaký je správný český výraz, ale jde o pohyblivou modelovou konstrukci postavy. Postavu je třeba škálovat do různých výšek, protože máte například šest herců, ale ve hře – například ve sportovní hře – je mnoho hráčů. Musíte tedy postavu škálovat tak, aby pohyb zůstal přirozený, ale zároveň vypadala trochu jinak.

Některé hry mají pak specifické nepřirozené pohyby, například když postava kulhá, nebo je zraněná, například postřelená. Začínám to brát trochu osobně – rozhodně nekulhám z chvály. Nebo hrajeme basketbal – meniskus. V tomto případě jsme došli k poměrně zajímavé statistice, což vedlo k našemu projektu. Zajímalo nás, jak dlouho celý proces trvá, protože jsme viděli potenciál úspory času.

Například natočit jednu hodinu čistého záznamu znamená zhruba jeden natáčecí den. Tu hodinu záznamu pak musíte několik dní čistit – od jednoho do pěti dní, které jsou věnovány čistě postprodukci. Jen jedna postava na jednu hodinu záznamu znamená hodně práce. V rámci animací jsme nejprve zkoušeli automatizovat čištění Marker Cloudu.

Marker Cloud jsou prvotní data, která vychází ze systému – body v prostoru. Díky optické technologii však může dojít ke ztrátě dat, například když herec dělá kotrmelec a body nejsou vidět. Aby další zpracování bylo přesnější, je potřeba tyto body doplnit, vyčistit a zlepšit kvalitu dat. Tam jsme chtěli automatizovat proces.

Vyvinuli jsme neuronovou síť, která sbírá tyto vstupní data a snaží se vyhladit trajektorie markerů. Zohledňuje nejen jednotlivé markery, ale i jejich vzájemné vztahy. Například marker na loktu souvisí s markerem na zápěstí, aby marker nevystřelil někam do neznáma.

Jeden z problémů nastal s markery na koleni, když jsem měl „špatný marker“ – marker posunul. Tento první model byl nicméně poměrně úspěšný. Měli jsme kritérium, že marker po vyčištění nesmí být vzdálený víc než pět milimetrů od stavu vyčištěné animace.

Proč říkám „v podstatě“? Protože animátoři nepracují úplně přesně – mají určitá pravidla, která se snaží dodržet, ale animace často posouvají myší, takže přesnost není úplně dokonalá.

Je rovněž důležité, aby se při pohybu neobjevovaly nežádoucí jevy – například aby lokty neprocházely tělem a podobně, aby nohy byly uzemněné a postava „nelevitovala“. Tento proces musí být prováděn správně a je to disciplína, kterou zpravidla provádějí běžní dodavatelé motion capture řešení, především ohledně hardwaru, ale zatím to dělají málo za pomoci AI a neuronových sítí.

Ideální by bylo, aby během celé animace postavička končila v přirozených polohách. Pokud se do jistých poloh nevrátí přesně, znamená to, že došlo k odchylce a pohyb nebyl úplně správný. To byly metody, které jsme testovali.

Druhou částí byla tzv. „solving“. Lidé si často představí, že když máte dva markery na loktu, stačí „přesně hodit kost“ doprostřed, což je přirozené. To přesně dělají výrobci těchto hardwarových systémů. My jsme však zjistili, že to není vždy žádoucí, protože pak lokty mohou být příliš zkroucené na jednu stranu, nebo postavička nestojí přirozeně, například mírně nakřivo. Může tam být mnoho deformací.

Takže Marker Cloud a následné solving byly vlastně dva samostatné projekty, resp. POC (Proof Of Concept), které jsme testovali na reálných datech a následně se implementovaly.

V podstatě jde o cloudovou službu: vezmete soubor z motion capture systému, nahrajete jej do našeho systému – běží v tradičním cloudu, protože je potřeba větší výpočetní výkon – a systém vám vrátí zpět soubor ve stejném formátu, ale s upravenými hodnotami markerů a výsledků řešení.

Testovali jsme to v provozu na reálné hře a já osobně jsem jel do Spojených států, abych se na celý proces podíval. Výsledek byl poměrně úspěšný.

Tato metoda funguje na začátku produkčního pipeline v části zvané „range of motion“ – před tím, než herci jdou na natáčení velké scény, projdou základním cvičením, kdy pohybují rukama a nohama, aby se určil rozsah jejich pohybu.

Už během toho se daná postava vyčistí, takže při samotném natáčení je větší pravděpodobnost, že data budou v pořádku. Tento proces je třeba občas opakovat, například když herec musí na záchod – už se daný pohyb natáčet nebude, ale herec si musí oblek sundat a po navlečení zpátky dojít znovu na cvičení, protože markery se mohou posunout.

Je to tedy opakující se proces několikrát během dne – frekvence využití je poměrně vysoká.

Proč jsou markery optické a ne prostorově senzorické? Existují sice obleky s jiným typem senzorů, ale optické markery jsou zatím mnohem přesnější.

Každý výrobce vám řekne, že oba systémy jsou vysoce přesné, ale oba mají jiné typy chyb. Optické markery trpí tím, že pokud není vidět část markerů, systém data nezachytí a musí se to následně opravit.

Senzorické obleky zase bývají citlivé na rušení, například magnetické. Používaný magnetometr totiž určuje polohu senzorů v prostoru, takže ty senzory nejsou jen gyroskopy a akcelerometry. Čištění dat je třeba dělat jinak.

Senzorické obleky rozstřelí data například v železno-betonových budovách, což optické systémy tolik netrápí.

Má to své výhody i nevýhody. Velká herní studia používají senzorické obleky zejména pro natáčení venku.

Co se týče kombinace obou řešení, i takové existují – dnes se dokonce využívají i třetí metody, jako je natáčení bez markerů („markerless motion capture“). Používá se několik klasických kamer a umělá inteligence k vyříznutí obrazu a jeho převodu do 3D dat.

Možná už za chvíli ani herci nebudou potřeba – tato problematika se řeší, ale zatím jsem neviděl úplně dobré výsledky. Viděl jsem první pokusy, kdy někdo spojil něco jako ChatGPT s vytvářením animací podle pohybových promptů.

Přejděme zpět do Ameriky. Náš POC byl velkým úspěchem na začátku práce na hře, na které jsme měli čest spolupracovat – ale o projektu nesmíme nikomu mluvit, protože je to tajné.

Se studiem pokračujeme ve spolupráci a hledáme další příležitosti, kde uplatnit algoritmy strojového učení. Ukazuje se to jako významná příležitost pro celé odvětví.

Proto jsme začali uvažovat trochu jinak. Dlouhodobě Gauss hledá produkt, kterým by obohatil trh svými zkušenostmi. Chtěli jsme najít oblast, která nás zajímá, kde máme i zájem – například hraní her.

Gaming je navíc oblastí, do které se jiní hráči dostávají poměrně obtížně. Z obchodního pohledu můžeme dělat strojové učení v e-commerce, bankovnictví, ale tam je mnoho firem s většími zkušenostmi než my.

Gaming může přinést přidanou hodnotu herním vývojářům, protože umožňuje zkracovat některé procesy ze dnů na minuty. Vidím v tom značný potenciál a peníze, pokud to vezmeme z obchodního hlediska.

Nebojím se to tak říkat. Přijde mi to velmi zajímavé.

Nyní se dostáváme ke Capnetixu – produktu vzniklému z této spolupráce.

Zajímavé je to, že když jsi mluvil o Gaussu, jednalo se o velmi široké zaměření – dvanáct různých odvětví, agnostické, široké a generické řešení.

Teď jsme ale v úzkém, jasně definovaném oboru, kde jsme se zaměřili hlavně na animace – to je první use case.

Důvod je jednoduchý – věřím, že v oblasti strojového učení budou vítězné řešení spíše v úzkých vertikálách.

Je to pro mě zajímavé, protože dnes už každá digitální agentura je expertem na AI, každá právní firma je expertem na AI – někdy nemáte ani potřebu najímat agenturu nebo firmu, protože generické nástroje jsou zpřístupněné. V jejich situaci bych se choval stejně.

Zjednodušilo se to. Mnoho modelů, algoritmů a řešení je nyní dostupných jako API, takže proč to nenabízet klientům, když je o to zájem.

Myslíš, že budoucnost tvůrců strojového učení a posluchačů na straně tvůrců a konzumentů spočívá ve specifických, dobře definovaných věcech? Generické věci jako by spolkly OpenAI, Azure a další cloudy a staly se komoditou.

Já si myslím, že umělá inteligence bude vlastně novou infrastrukturou – podobně jako máme Amazon, Google, Microsoft Azure k řešení výpočetní síly a úložišť.

Frameworky kolem umělé inteligence nabídnou základní programovací vrstvu, na které bude možné stavět.

Pak už půjde jen o to, jak to zúžit na konkrétní oblast, aby bylo možné problém lépe vysvětlit konečnému zákazníkovi.

Paradoxně na webu Capnetixu máme mnohem větší konverze než na webu Gaussu, protože problém je velmi úzký a lidé si ho snadno najdou, když …

[část textu končí beze zbytku, ale informativní obsah byl zachován]

Ficky, když s nimi mluvíš, raději přesně označuješ ty problémy. Výzkum to prodáváš. Přesně tak. Landing page je přesně specifikovaná.

Nyní nám se ozývají zhruba tři až pět firem, někdy dokonce ani ne firmy, je tady poměrně velký zájem i od indie developerů. Pro ně to ještě není úplně připravené, protože my to teď zvládáme na high-endových systémech, proto je naším cílem nasbírat dostatek dat, aby to bylo přínosné i pro ty indie hráče. Komunitu chceme demokratizovat.

Když se podíváme na to, co znamená vlastně něco změnit v produktu, to by chtěl úplně každý. Neexistuje agentura, která by neměla velký sen – mít vlastní produkt místo prodeje vlastních služeb a díky tomu škálovat. Přesně tak, škálovat, ne lidmi. Je to složité, chce to poměrně pevně ty dvě věci oddělit. Na to jsem přišel až po dlouhých úvahách – musí to být dvě naprosto oddělené oblasti.

Proto jsme k tomu tak i přistoupili. Cupnetics je samostatná firma, nespadá pod Gauss ani nic takového. Gauss pomohl nějakým způsobem tento projekt bootstrapovat, tedy Gauss je v podstatě investorem do Cupnetics. Gauss nyní drží asi 20 % podílu a část týmu z Gaussu přešla do Cupnetics, aby mohl projekt dále rozšiřovat. Skutečně je to zatím tým, který je věnovaný a připravený řešit problémy zákazníků.

Z právně-organizačního a firemně budovatelského pohledu je tedy vše jasné. Co se týče technologického a produktového vývoje, co bylo třeba udělat poté, co už vám produkt krásně funguje a běží v produkci u jednoho z největších globálních hráčů? To je skvělé potvrzení Product Market Fitu – když máte platícího klienta, který platí násobně více, protože jde o custom řešení, tak je natolik jasné, že existuje trh i pro firmy, které zaplatí desetkrát méně za generické řešení.

To zní dobře, ale co děláš dál s kódem? Jak vlastně zabalíš produkt? Je potřeba ho dále rozšiřovat. Především to spočívá v nových naturálních rozšířeních, protože i tam je poměrně velká variabilita v animacích a datech z motion capture. Proto je potřeba mít dostatek animací, aby byla pokryta co nejširší škála použití. Když budu mít jen animace golfových hráčů, nebude to univerzálně fungovat pro všechny případy – to si lidé dokážou představit.

Data tedy nějakým způsobem sháníme, kupujeme, barterujeme – směňujeme data. Pokud přijde zákazník a zajímá se o technologii, v tuto chvíli jsou pro nás cennější data než to, co by nám zaplatil za samotné využívání. Data si samozřejmě necháváme k trénování modelu, přičemž klient dostane nějaké časově omezené bezplatné využití vzniklého modelu.

Jak vlastně produkt vypadá dnes? Co všechno umí? Když se podíváme na váš projekt u velkého vydavatele a teď na Cupnetics, čím se liší a čím je zajímavý? Jak moc jste výsledek zúžili? Museli jste zúžit rozsah, aby to fungovalo tak, že na dva kliknutí zapnu a mám hned nějaké výsledky, ne?

To jsme dlouho řešili a chtěli jsme to nechat hlavně v rovině věcí, které se osvědčily. Nemá smysl odebírat základní funkcionalitu jako prvotní úspěch, ale rozšiřovat to o další potřeby, aby to bylo použitelné i pro menší studia a podobně.

Proces má několik částí. Začíná akvizicí dat a jejich čištěním a pokračuje napojením na různé systémy jako Unreal Engine, Unity a podobně. Jednou z klíčových částí, na kterou chceme zapracovat, je integrace, aby bylo možné například připojit senzorické obleky tak, abychom měli dobré pokrytí optických systémů, ale zároveň i markerless (markerless tracking) technologie jako nová řešení. Už se začali ozývat potenciální klienti z této oblasti. Cílem je udělat to opravdu na jeden klik.

V tuto chvíli stačí mít správně naformátované soubory, my v cloudu máme jednoduchý upload, který soubor nahraje a vrátí výsledek zpět. Člověk nemusí nic víc dělat. Do budoucna chceme přidat nějaké uživatelské rozhraní, které ukáže rychlost zpracování při větším objemu dat, ale nyní si myslím, že to není nutné, protože hodnotu klient ověří u sebe ve svých lokálních nástrojích.

Vyvíjet lokální nástroje, jako jsou Blender nebo Autodesk, pro nás nemá smysl, bylo by to velmi nákladné.

Je ale něco jiného kromě čištění dat? Řešíme i akviziční část, protože zjistili jsme, že obzvlášť menší hráči, nejen v herním průmyslu, ale i filmovém, potřebují jednodušší způsoby, jak data vytvářet. Začali jsme testovat různé modely, které by z kamer dokázaly markerless sledování různých částí těla nebo objektů. Současná řešení se zaměřují hlavně na postavy, ale nikdo moc neřeší třeba hlavu nebo prsty.

Mluvili jsme s firmou, která má hodně scén, kde se hrají karty u stolu, a potřebují kamery, které snímají ruce a jemné pohyby prstů. Existují sice senzorické rukavice, ale výsledky nejsou moc dobré. Prsty jsou opravdu problém. Proto zkoušíme sledování prstů z kamer a minimálně by to mohlo ulehčit přípravu dat.

Díky našemu čistícímu mechanismu mohou i ne úplně dokonalá data projít procesem čištění, což je založené na obrovském množství tréninkových dat, a dostat správnou kvalitu i pro malé hráče, kteří takové technologie nemají dostupné.

Připomněli jste mi video, které doporučím posluchačům, o tom, proč velké obrazové modely – tedy mediální modely – nejsou schopny dobře zachytit prsty. Je to proto, že databáze obličejů a lidských postav je násobně větší než databáze prstů a rukou. První problém je tedy nedostatek datasetů zaměřených na ruce.

Druhý problém je, že ty modely vůbec neznají fyziku prstů. Celou dobu o tom přemýšlím, když Johnny mluvíš o tom, že model pracuje na základě toho, co vidí, a že RIG v sobě má fyziku těla, například svalů, které ovlivňují pohyby.

Myslel jsem, že už jsme dále a že model postavy v hře není jen body v prostoru, ale propracovanější systém s fyzikou. To by částečně mohlo být, ale jsou zde ovládací limity. I když jsou rozsahy pohybu variabilnější, postava je omezena tím, co umožňuje zařízení jako Xbox nebo Playstation, která mají limity, aby hry vůbec fungovaly.

Jsou tam různé překážky, které si myslím, že se budou postupně vylepšovat, ale chce to ještě chvíli času.

Jenny, rád bych se vrátil k jedné věci, kterou jsem nestihl zmínit, a to je, jak jsi velmi pěkně přiznal, že v gamingu je velké množství peněz. V naší bublině všichni vědí, že gaming je větší průmysl než hudba a filmy dohromady a že jeho velikost už několik let předstihla jejich trh.

Jak podle tebe tento trh vypadá, když do něj vstoupil? Jaká jsou specifika trhu? Je dostatečně digitalizovaný? Jde o počítačové hry a tak?

Já bych řekl, že digitalizace je už poměrně rozsáhlá, ale tradičně jsou to programátoři na jedné straně a na druhé straně kreativci, kteří vytvářejí scény, postavy a podobně. Propojit oba světy je složité pro mnoho firem.

Měl jsem možnost podívat se do Pixaru, do jejich studií, kde se této problematice věnují již 40 let. Stále musí držet krok s inovacemi a udržovat proces, kdy někdo vytvoří koláž postavy z různých materiálů, která se poté projde celým dlouhým procesem, aby vznikla finální digitální podoba.

Je to nikdy nekončící proces.

Obecně je gaming opravdu obrovský trh. Letos by měl dosáhnout hodnoty 188 miliard dolarů, což je pro představu asi polovina HDP České republiky, pokud tedy můj přepočet není chybný.

Navíc jsou hry čím dál nákladnější. Důvodem je, že vysoké rozpočty se vyplácejí – statisticky velké hry mají návratnost. I když se nám zdá šílené, že jedna hra stojí půl miliardy dolarů a další půl miliarda je utracena za marketing, tak to funguje a velká studia jdou tímto směrem.

Hlavní otázka je, co se stane s menšími studii? Menší studia, která nejsou AAA, mají menší rozpočty, ale pokud chtějí něco zkoušet, musí být vysoce efektivní, aby dosáhla zajímavých výnosů.

Navíc se střední segment trhu – střední firmy – začínají ztrácet kvůli konsolidacím na trhu. Viděli jsme akvizice jako Activision, Blizzard, Microsoft, 2K, Zynga, takže na trhu bude spousta nákupů a vznikne obrovská propast.

Tencent koupil Bohemia Interactive a podobné akvizice se budou dít neustále.

Na trhu je akvizice běžná – když například vyjde hra Rockstar, neznamená to, že ji vytvořil pouze Rockstar, ale je tam celá pyramida týmů pod ním, kteří se na ní podíleli.

Důvodem jsou multikonzole – když vydáváš AAA hru, potřebuješ ji vydat na Xbox, Playstation a PC ve stejné kvalitě, což pro vývoj jsou vlastně tři různé týmy.

Je to jedna z příčin. Další je nedostatek kapacit, zkušeností a lidí, takže firmy buď pronajímají kapacity, nebo kupují další firmy.

Váš přístup byl automatizace herního vývoje. Změnila se vaše pozice v posledním roce?

Před nedávnem jsme oslavili rok od uvedení ChatGPT a v Gaussu je teď vše jinak než před šesti lety, kdy jsme museli vysvětlovat, že lidé mohou mít své AI.

Někdy slyšíme, že zákazníci nevědí, co chtějí, ale chtějí AI.

Jak to vnímáš v gamingu? Co změnil poslední rok?

Řekl bych, že hodně věcí. Umělá inteligence se v gamingu už běžně řeší.

Byl jsem na konferencích, kde většina keynote přednášek a paperů obsahovala prvky AI.

Problém je však převod do reálné produkce.

Mluvil jsem s lidmi z Ubisoftu, kteří mají přes 100 lidí specializujících se na machine learning v Torontu a dalších místech v Kanadě.

Mnoho prezentovaných věcí vypadá skvěle, ale v produkci je to obtížné, protože často mění, jakým způsobem se práce dělá.

Studia jsou proto často vůči tomu defenzivní.

Jedna věc, na kterou jsme se zaměřili, je, aby současná pipeline a čištění dat nebyly příliš změněny.

To je snáze akceptovatelné, nevyžaduje to nový hardware ani najímání nových lidí.

Často si myslím, že problém je právě v tom, že je tu něco, co práci urychlí, ale přetvoří celou pipeline.

Proto i značná obliba markers řešení – například je lákavé místo pětimilionového kamerového systému používat jen čtyři iPhony za zlomkovou cenu.

To zní hezky, ale není to tak jednoduché.

Je potřeba dobře promyslet nasazení technologií.

To mě přivádí k tématu ChatGPT a nových technologií – co se vlastně změnilo?

Vidíme obrovskou chuť a zvýšený zájem firem to vyzkoušet.

Naše zkušenost za deset let je však taková, že nejtěžší je dostat věci do reálného světa.

Více než 50 % práce spočívá v přípravě dat, správném získávání dat ze systémů, zajištění včasnosti a kompatibility celého procesu.

To je reálná práce, která se často podceňuje.

V gamingu si umím představit, že věci budou fungovat, ale je potřeba dát tomu čas a výzkum.

Není to o tom vzít nějakou aplikaci a ihned to nasadit.

Předpokládám, že AI bude přibývat postupně, po malých částech.

A pokud se vrátíme k Cupnetics, kde v budoucnosti gamingu vidíte Cupnetics?

Jak to plánujete propojit? Budete se specializovat na animace nebo rozšíříte další uživatelské případy, o kterých jsi mluvil na začátku u POC?

Cupnetics považuji za nástroj využívající umělou inteligenci k tomu, aby pomohl herním vývojářům ušetřit čas na důležité věci.

Někdo chce být kreativnější, někdo se chce věnovat spíše scénám.

Mým cílem je je odprostit od práce, kterou nechtějí dělat.

V motion capture často opravují chyby technologie, což pro ně není příliš zábavné.

Dlouho jsme přemýšleli o ideální platformě, kde by se všechny tyto věci odehrávaly.

Jednoduchost přichází s tím, že integrujete data stejným způsobem, a celý proces by měl fungovat tak, aby na jedno kliknutí bylo možné data zveřejnit například do Unreal Engine.

Z existujících firem se mi nejvíc líbí, co dělá Hugging Face – přinesou modely vyřešící specifický problém, například snímání rukou; jednoduše se připojíte, nahrajete data a obdržíte výsledky.

Tak si představuji budoucnost.

Zda budeme dělat vše od vývoje až po QA, ukáže čas, ale ideální je začít kvalitně ve vybrané oblasti.

Zatím se zaměříme na animace, VFX a postupně se možná přesuneme k testování a dalším oblastem.

Co se týče plánů spolupráce s nejmenovanou velkou značkou, plánujete mít postupně více zákazníků…?

V portfoliu mezi zákazníky – co to pro vás bude znamenat v příštím roce? Asi budeš zase hodně létat. Ano, budu asi hodně létat.

Možná bohužel boudík, velkým trhem pro nás budou Spojené státy, Kanada, prostě ta Severní Amerika představuje podstatnou část vývoje her, takže se tam budu soustředit a cílit. Myslím, že máme obecně dobré téma i vzhledem k Evropě a umělé inteligenci, jak se tady věci chystají. Líbí se mi to i z pohledu toho, že nebudeme až příliš ovlivněni tím, co se tady možná nastane. Teď úplně přesně nevím, v jakých fázích to je.

Takže ano, budu létat, budu navštěvovat zdejší klienty a přes prvního klienta, který má poměrně velké jméno, nám to snad usnadní otevírání dveří u jiných firem. Zatím jsem měl štěstí více u filmových společností, povídal jsem si s lidmi v ILM, byl jsem v Disney, v Pixaru, kde jsem si postupně budoval kontakty. Ale příští rok to bude o rozšíření té sítě, protože herní průmysl je poměrně specifický svou komunitou. Nechci říci, že lidé jsou uzavření, ale mají své konference a vlastní způsoby, jak se setkávají a komunikují. Snažíme se do toho proniknout, ale tak, abychom byli přirozeným hráčem, spíše než někým, kdo se snaží umělou inteligencí do této oblasti násilně prosadit.

Jasně, ale obecně platí, že umělá inteligence způsobila ve filmovém průmyslu mnohem větší rozruch než v jiných oblastech, například kvůli stávkám v Hollywoodu a podobně. Myslím, že se to bude dít i v dalších oblastech. Vidíme to přes Gauss, účetnictví, automatické přepisování různých materiálů, které dnes spousta lidí používá jako podstatnou část své práce. Tyto systémy najdou a přečtou různé dokumenty, takže šéf se nemusí ptát někoho, aby mu přinesl informace – prostě napíše prompt a dostane odpověď.

I v gamingu nebo filmovém průmyslu se lidé budou určitým způsobem bránit. V herním odvětví jsme to už trochu zažili, protože záleží na roli konkrétního člověka a na tom, jak moc mu umělá inteligence bere práci. Je to přirozené. My však vždy věci augmentujeme, snažíme se pomoci. To je správný výraz – augmentace. Přesně, augmentace.

Promiň, Báro, ještě bych se chtěl zeptat – narazil jsi na jednu věc. Mluvil jsi o AI Act a Evropě. Ve spolupráci s americkými firmami cítíš rozdíl v legislativě? Nebo máme my tu regulaci tvrdší než ve skutečnosti potřebujeme, takže když se pohybujeme tam, jsme v pohodě a máme všechny štemplíky? Jak to řešíte, nebo je to všude prakticky stejné a všichni chtějí ochranu?

To je součást otázky. Ochrana je v gamingu obecně velmi důležitá. Herní společnosti považují data za naprosté zlato, musíme s nimi velmi dobře nakládat, protože data nesmějí uniknout. Jejich uniknutí by znamenalo ztrátu podstaty hry a jakýkoliv problém v tomto směru je obrovský problém.

Co se týká legislativ, sledujeme je, ale myslím, že Evropa jde na věc pomalu a trochu „s křížkem po funuse“, protože svět se pohybuje tak rychle, že než stihneme vydat nějaký AI akt, je situace úplně jiná. To je jeden problém. Druhý problém je, že nechápu, proč se regulace tak moc řeší, když Evropa bude nejmenším hráčem na trhu a většina řešení na konci dne bude pocházet ze Spojených států nebo míst, která nechávají inovacím volný prostor.

Něco nelze dělat jen na univerzitách, musí to do světa dostat firmy a organizace, kde se ukáže, jestli to funguje či nikoli. I když Biden v Americe vydal jejich variantu AI aktu, podle mě to pro firmy není až tak omezení.

Doporučuji mnoha lidem, aby si sedli do letadla a jeli se podívat třeba do New Yorku, San Francisca, a zeptali se „na ulici“, jak regulaci vnímají. Prvním člověkem, kterého jsem se zeptal, byl investor v San Franciscu, který říkal, že cena tržního podílu je mnohonásobně vyšší než cena za splnění regulací. Jinými slovy, je pro ně přijatelné něco zaplatit jako „formu zdanění“; dej pět milionů a jedeme dál.

Pokud to tak uzavřu, vy v Gaussově jste už měli spoustu klientů i globálních, zmínil jsi například francouzský Burger King, takže nejste jen lokální tým. Je něco fakt jinak, když pracuješ pro americké velké globální klienty kromě časových posunů?

Je to hlavně o přístupu. Tady v Evropě potřebujeme větší jistotu, děláme třeba tři PoC (proof of concept) na ověření správného směru. Na americkém trhu bylo i jen jedno PoC pro gaming mnohem větší než mnoho z našich kompletních projektů zde. Objemově je to větší, a když američtí klienti do něčeho jdou, tak jdou opravdu naplno.

Je tam menší potřeba přemýšlet „před“ a více jde o akci.

Rozumím. A co se týká Kapneticsu, asi to neplánujete úplně bootstrapovat, takže čeká vás nějaké financování?

Zjistili jsme, podobně jako ostatní v HAI komunitě, že trénovat modely není levné. Není snadné sehnat hardware, jako jsou grafické karty, které jsou nyní nedostupné. Část problému lze řešit cloudem, ale pak potřebujeme data – sehnat je, koupit. To taky něco stojí. Někdy si vypůjčíme studio, abychom natočili specifické pohyby nebo extrémy, které v běžných datových sadách chybí.

Co jste naposledy točili?

Naposledy jsme točili dvě věci s nějakými… no, já si představoval hrozně věcí, když řekneš něco normálního, tak mi to pomůže představit si konkrétně. Podle mě se to týká hlavně pohybů, které třeba neudělá každý – například salto. Ne v každé hře jsou takové prvky, jak si lidé často myslí, takže je potřeba dostatečně pokrýt existující množství animací.

Pak to mohou být situace, kdy potřebujeme více postav, například různé střety. Nejšílenější scénář, který jsme dělali, bylo, že jsme se rozbíhali proti sobě. V takovém případě, když čistíme marker cloud, může dojít k tomu, že systém si zamění markery a přiřadí je špatně – třeba jeden marker patří postavě druhé. Výsledkem je, že pak jedna postava „má třeba tři nohy“. Takové scénáře je potřeba testovat.

Dalším důvodem, proč chceme mít vlastní datové sady, je mít standardizované testy.

Chcete je potom třeba také prodávat nebo vytvořit knihovnu, jak jsi zmiňoval dříve?

Chceme také vytvořit komunitu. Vidíme to například na příkladu Hugging Face, kde komunita má velkou sílu. Někdo data má, ale neví, jak správně připravit model, my mu můžeme pomoci. On to může publikovat, monetizovat, nebo vydat jako open source – s tím umíme také pracovat.

Síla řešení podle mě spočívá spíše v zjednodušení přístupu než vymýšlení specifických postupů pro každý segment.

Johnny, děláš v gamingu jen byznys, nebo si taky hraješ?

Rád si zahraju. Dlouhodobě jsem hrál FIFA, teď se to jmenuje jinak. Je tam spousta postaviček, mám ke sportu blíže. Nedávno jsem přešel z PlayStationu, koupil jsem manželce trenažér a začal jezdit ve Zwiftu, virtuálním cyklosvětě.

Takže to vlastně jen používáš, není to tvoje?

Ano, půjčuju si to. Ale koupil jsem to manželce k narozeninám, takže je to vlastně dárek pro ni. Ale Zwift je teď ta hra, které se věnuje.

Držíme palce, ať se vám daří nejen ve Zwiftu, ale i profesně v gamingu, ať máme další… dalšího unicorna. Minimálně dekacorna jsou dneska v kurzu. Ať máme další firmu, na kterou můžeme být globálně hrdí. Myslím, že máme jich pár v herním odvětví.

Držíme palce a přejeme odvahu – jako bys byl Američan.

Děkuji, že jsem tady mohl být, ještě naposledy zdravím všechny a sledujte nás na Kapnetics.ai.

Děkuji moc.

Děkujeme za rozhovor. A to je všechno. Děkujeme, že jste doposlouchali až sem, a děkujeme také našim partnerům: Big Hub, Rekombi, Intex, Nanoenergies, Livesport, SaaSce, Bystrýti, Colors of Data, Revolt BI a Good Data.

Pokud vás zajímá více z české datové scény a datových technologií, napište nám e-mail na datatalk.cz nebo přijďte na některý z našich meetupů.

Nech vás provází data.

Podcast

Data Talk #66: Johnson Darkwah (Gauss Algorithmic & Kapnetix)

Strojový přepis

Odebírejte Data Talk