Data Talk #173: Martin Prchal (Addvery)
epizoda#173 | vyšlo | délka | 557 poslechů | permalink | mp3
V této epizodě Data Talk podcastu byl hostem Martin Prchal, který vede datové oddělení konzultačně technologické firmy Addvery. S moderátorem Jirkou Vicherkem Martin popsal, jak v týmu o 20 lidech zvládají projekty napříč doménami a státy, od energetiky v Rumunsku přes výdejní boxy v Řecku po CRM v Litvě. Právě CRM je věnována největší část epizody. Martin popisuje, jak vypadá práce se zákaznickými daty ve velkých firmách jako je CME nebo Rewe (Billa), proč je základní jednoduchá lifecycle segmentace většinou mnohem účinnější než pokročilé ML modely a jak uvažování nad personalizací mění AI.
Strojový přepis
Dobrý den, jmenuji se Jirka Vicherek a vítám vás u dalšího dílu podcastu Data Talk. Mým dnešním vzácným hostem je Martin Prchalo, šéf datového oddělení ve společnosti Advery. Ahoj, Martine.
Ahoj, Jirko.
Dnes se s Martinem podíváme na Advery, na to, jak fungují, pro jaké klienty pracují, protože v českém prostředí mají výhodu velké rozmanitosti a globálního dopadu, a podílejí se na velmi zajímavých projektech. Jaká byla tvoje cesta do Advery a jak ses stal šéfem datového oddělení? Odkud jsi vlastně přišel?
Moje cesta k Advery vůbec nevedla přímo k datům. Přišel jsem z vysoké školy. Vystudoval jsem v Brně aplikovanou matematiku a ekonomii a už během studií mě data a modelování velmi přitahovaly. Už někdy ve čtvrtém či pátém semestru směřovala moje cesta k Airbance a nakonec do Home Creditu, kde jsem se opravdu setkal s reálnými datovými sadami, s těmi takzvanými „špinavými“ Excelem, ne s hezky upravenými databázemi uloženými někde v cloudu. To byly začátky, které mě rozhodně neodradily, naopak ve mně vzbudily vášeň pro data. Už tam jsem se potkal s velmi zajímavými lidmi.
V rámci Home Creditu musím vyzdvihnout a trochu se vrátit zpět k dobám talentového programu HCnet, kdy ve firmě skutečně existoval „tunel“, tedy cesta, jak se dostat k zajímavým projektům a získat možnost mít během školy osobní konzultace s tehdejším šéfem risku, Michalem Vrchlovským. S ním jsem na měsíční bázi probíral, jak se mi daří, co děláme v oblasti dat a co by bylo možné zlepšit. Byla to skvělá škola.
To byl můj start do světa dat. Tato cesta pokračovala v rámci Home Creditu a talentového programu, který vždy směřoval k nalezení šikovných lidí a jejich poslání do světa. Jak bylo dosaženo na papíře, tak to skutečně i proběhlo. Velmi krátce po absolvování školy jsem odjel, ani ne tři měsíce po státnici, na tři roky do Indonésie. Tehdy jsem nevěděl, že to bude právě tříletá zkušenost. Zpočátku to měla být jen roční zkušenost, rozhodně toho nelituji. Ta příležitost byla výjimečná.
Dnes už s rodinou bych se asi na takovou dobu nepřestěhoval, ale tehdy to byla skvělá příležitost, a myslím, že jí vděčím za to, kde dnes jsem. Ta škola byla opravdu hodnotná. Rok po škole jsem začal pracovat v Indonésii a po šesti až sedmi měsících už jsem vedl malý tým, jednoho člověka, kterého jsem sám najal. Myslím, že v Česku by mi to trvalo dlouho déle.
Je pravda, že vzdělání v Indonésii není na takové úrovni jako v Česku, což vytváří bublinu expatů, protože tamní firmy lákají znalosti zvnějšku. Po šesti měsících jsem dostal první povýšení. Tento prostor tam vznikl a zkušenost byla skvělá. Po dvou, třech letech jsem tam strávil celkem tři roky, ve finále jsem vedl tým o čtyřech až pěti členech. Ačkoli to nebylo obrovské, zodpovědnost, kterou jsem měl, byla obrovská. Stál jsem za vytvořením celého schvalovacího procesu od základu.
V Home Creditu jsem pracoval primárně na rizicích a fundraisech, kde jsme měli proces schvalování lounů. Dostal jsem příležitost vytvořit schvalovací proces pro zcela nový produkt – kreditní karty, pro které Home Credit získal licence na některých institucích v Indonésii, což je docela těžké. Na mně bylo vybudovat celý schvalovací proces, samozřejmě s určitými přejímkami z jiných procesů pro půjčky. Celý jsem ho otestoval a nastavil.
Když mi nyní projde první kreditní karta, stále si doma schovávám první schválenou kreditní kartu na své jméno. I když samozřejmě šla přes whitelist, protože nemám indonéské občanství, které je potřeba k získání karty, tato zkušenost byla fakt super. Takže takhle přes Home Credit.
Potom došlo k návratu do České republiky během covidu. Pracoval jsem dál na dálku pro Indonésii, vydržel jsem takto asi tři až čtyři měsíce. Práce s týmem na druhé straně světa, setkávání se jen na pár schůzkách brzy ráno, například v pět nebo osm hodin, pak nemožnost si skutečně sednout a něco nakreslit na tabuli, to mi nevyhovovalo. I dnes, jak se ukazuje v Advery, mi vyhovuje spíš hands-on práce a trávení času u klientů.
To byl tedy signál, že je potřeba něco změnit. Vrátily se tak mé kontakty z Home Credit a Michal Rychnovský tehdy zakládal Advery BI v Brně. Spojili jsme se a domluvili na spolupráci velmi rychle, v podstatě na jednom kole mě pozval, a říkal: „Zítra začínáme, přijď si poskládat svoji židli.“ Tak rychlá byla moje cesta z Home Creditu do Advery BI.
Který to byl rok? Rok 2021. Ano, v roce 2021 už Advery existovalo zhruba rok. Společnost založili pan Novák s Lukášem Markem. Edvery tedy už fungovalo rok, ale po čase začali cítit, že jim chybí datové kompetence. Částečně si pomáhali externě, ale nechtěli outsourcovat veškerou datovou práci. Chtěli zakládat vlastní datové oddělení uvnitř konzultační firmy, což vedlo ke vzniku Advery BI.
Proto tedy Advery BI a i proto jsem v Advery já. Budeme se bavit o tom, co se událo za těch pět let, ale skočíme rovnou do současnosti. Jak vypadá dnes Advery a Advery BI a jaký mezi nimi je vztah?
Advery je především konzultační firma a Advery BI je její součást. Není to samostatná firma, která by měla vlastní projekty a se kterou by Advery sdílelo jen jméno, rozhodně ne. A právě to je podle mě na Advery zajímavé – spolupráce a integrace těchto dvou světů.
Dnes má Advery asi 70 zaměstnanců, z toho zhruba 20 tvoří Advery BI, tedy datoví analytici, inženýři a data scientists. V Advery moc nerozlišujeme role, protože na jednom projektu jste inženýrem, na jiném analytikem – díky specifikům konzultací.
Advery je tedy konzultační společnost se silným datovým základem. Většina našich projektů je realizována společně týmy z Advery i Advery BI. Na jednom projektu jsou konzultanti a vedle nich spolupracují lidé z mého týmu a společně projekt budují. Jednou je více obchodně zaměřený, pak zase více datový a opět obchodní.
To propojení, proč jsou v projektu data potřeba a jak je obchodníci mohou využívat, je pro mě to krásné na Advery a co mě na tomto baví. Vidím, že technologické firmy čím dál více směřují k upmarketu a stávají se technologicko-konzultačními firmami. Naopak Advery přichází z velkého byznysu, do kterého vstupují data, technologie, dnes i umělá inteligence, o které se určitě budeme bavit.
Zásadní je hluboké pochopení klienta a na základě toho přichází technologicko-datové kompetence. Život Advery začal od byznysu a po roce přidali datové schopnosti. Takto fungujeme i v rámci naší metodiky při práci s klienty.
My v Advery nikdy neměli projekt, kdy by klient přišel s jednoduchou zakázkou na postavení reportingu nebo přímo „postavte nám reporty“ či „vyrobte model“. Vždy tam jdeme přes byznys případ. Pokud není byznys case, k datům se ani nedostaneme.
Výborně, a k čemu se takhle dostanete? To je jedna z věcí, která mě fascinuje. Můžeš nám dát stručný přehled klientů a segmentů, se kterými pracujete?
Dnes máme přehled klientů napříč sektory a doménami. Velkou část tvoří retail, kde jsme začínali u Rohlíku, jehož kontakty se postupně rozšířily přes německou platformu Rewe, která je v Česku známá jako Billa. Dále spolupracujeme s Albertem, který je také jedním z našich klientů.
Další velká oblast je finance – Home Credit, Tonic Banka, Security Banka. Finanční služby se Fajn daří prodávat i v Asii, o tom třeba později.
Dále pak telekomunikace – O2 Czech Republic, Vodafone –, logistika – Paketa, Zásilkovna, Paket Group. Pomáhali jsme i s Boxnow, spřízněnou službou po vzoru Zásilkovny v Maďarsku.
V oblasti médií spolupracujeme s mediální skupinou CME, která vlastní Markízu a Novu. V rámci CME jsme budovali projekt OnePlay.
To jsou pro slušné zářezy i přes relativně malý počet lidí. Těším se, až si o tom budeme povídat, jak se to vlastně dělá.
Tak tedy přehled klientů. Asi už trochu naznačuješ, že jsou různé sektory, ale nemáte jen klienty z výroby nebo financí. Jsou mezi nimi i velcí hráči z retailu a financí. Máte v rámci těchto segmentů i nějaké rozlišení v práci, kterou pro ně děláte? Jaké jsou nejčastější případové studie (use cases)?
Napříč obory máme největší know-how v oblasti CRM. Myslím, že nejtypičtější případ, kterým jsme prošli během těch let, je právě CRM – ať už v médiích, telekomunikacích, financích či retailu.
Člověk si uvědomí, že ačkoli se mluví jinde, například v médiích nebo v retailu, kde rozdíl je v podnikání online či offline a liší se obchodní model, CRM řeší hodně podobné problémy.
Když vstoupíš do nového segmentu, vidíš podobné situace, které CRM řeší. Kdybych měl vyzdvihnout jednu věc…
Přidávám, že CRM je navíc logické, protože jde z byznysu. Vždy jsou tam peníze. Zvýšit výtěžnost zákazníků, snížit jejich odchod nebo se v enterprise segmentu zaměřit na existující databáze zákazníků a udělat na tom pár procent zisku, to opravdu přináší velký přínos.
Přesně tak. My jsme se vždy bavili s relativně velkými klienty, třeba velkými korporacemi. Ve startupu je CRM spíš o produktu a akvizici, ale v takovýchto velkých firmách s desetitisíci zákazníků a velkým podílem na trhu je CRM přirozený krok, do kterého všichni chtějí nějak proniknout a který vyžaduje hluboké porozumění.
Jak říkáš, i pouhé jedno procento zlepšení může znamenat miliony.
Omlouvám se, skočil jsem ti do řeči. Takže když mluvíme o CRM, říkáš, že problémy jsou napříč sektory podobné. I když stále pracujete s různými odvětvími, třeba dál v masokombinátu, tak se setkáváte zhruba se stejnými otázkami?
Ano, věřím, že zhruba 80 % otázek je stejné. Stále tam je prodej a péče o zákazníky. V rámci CRM se snažíme přistupovat s určitým frameworkem.
I když se někomu nemusí zdát, že musí být CRM sofistikovaný „šelmstrojem“, vždy začínáme skoro od nuly. Celé Advery, když začínáme objevovat novou firmu, když nás pozvou a prodáme projekt, vždy začínáme takzvanou fází „health check“. To je fáze objevování, kdy zkoumáme, jak firma vnitřně řeší problém, jak funguje CRM, jak funguje CRM v Rohlíku nebo v CME a podobně.
První otázkou tedy je, jak CRM v dané firmě funguje. Ačkoliv je podobné a zhruba 80 % stejných věcí, má také své odchylky. Zákazníci jsou různí, kanály jsou různé, produkt se značně liší.
Proto vždy začínáme pochopením celého byznysu. Co často vidíme je, že i u velkých firem je CRM často v plenkách. Na jedné straně jsou velké pokroky v AI a digitálních technologiích, ale CRM samotné je často jen ve dvou či třech lidech a je hodně nepersonalizované a obecné.
Například posílají všem stejný e-mail. Tento týden odchází newsletter nebo leták, příští týden by mohli připomenout, že mají akci na pivo, další týden stáhnout aplikaci nebo si přidat produkt do oblíbených.
Taková masová komunikace odchází všem zákazníkům, což je typický stav CRM dnes, a to jak v Česku, tak i jinde ve světě.
Ale to asi nebude technický problém, protože už před 15 lety bylo možné segmentovat zákazníky a posílat personalizované zprávy, že?
Přesně tak. Technologie na segmentaci a odesílání individuálních e-mailů je dnes k dispozici a měří se výsledky. Problém pro mě je v obchodním zadání.
Potřebujete znát, jak s klientem komunikovat, co mu poslat, kdy a s jakým cílem. Technologii na posílání zvládnu, ale nutně potřebuji jasnou obchodní strategii, co chci komunikovat, komu a kdy.
Technologický nástroj mám, ale bez obchodní strategie je to k ničemu. Pokud nevím, co mám komunikovat, komu a proč, nástroje mi nepomohou.
Často tedy při typické spolupráci přijedeme, oni mají databáze a říkají, že na kategorii „ženy“ právě na Den matek posílají newsletter „nezapomeňte na maminku“.
Typická segmentace bývá podle životního cyklu zákazníka (life cycle). To je první krok, kde se ptáme, jestli taková segmentace existuje.
Na to bychom mohli ještě navázat…
(rozprava pokračuje)
Lepší.
Jedna věc je vědět, kdo je tvůj nový klient, mít ho někde jako zapsaného v databázi, a druhá věc je vědět, kdo je tvůj stávající klient, který u tebe je třeba deset let, a mít to někde napočítané v databázi. Třeba k tomu i vytvořit hezké reporty, jako průměrný stav nebo věk klientů, a pěkně si je segmentovat a rozdělit.
My tedy máme takzvaný lifecycle, tedy životní cyklus zákazníka v databázi. Podívejte se do našeho Power BI, máme tam údaje, ale kdo vlastně má o tento lifecycle byznysovou strategii a co chce s klienty dělat v každé fázi lifecycle typicky?
Pojďme se do toho trochu ponořit hlouběji. Rozdělme lidi do několika fází. Máme onboarding fázi pro nové klienty, fázi aktivních klientů, a pak jsou zde ti, kteří přišli, ale nejsou aktivní, nebo jsou před odchodem – tzv. černí klienti. Ti si například zrušili předplatné, přestávají objednávat a podobně.
To jsou v podstatě tři základní segmenty. Často tyto segmenty najdeš v reportech, víš, kolik těch lidí je, ale pro ně už nemáš připravenou komunikaci, nepracuješ s nimi byznysově. Proto se snažíme ve firmách prosadit osvětu, aby byl za onboarding nových klientů a také za klienty odcházející zodpovědný člověk, který to bude mít jako svoji KPI. Například sledovat, jaký podíl lidí, kteří byli v černém segmentu, se ti vrátí zpět.
Často to spadá do velkého souhrnného segmentu, na který se hází všechno dohromady, ale je potřeba nastavit strategie individuálně a mít pro každou fázi odlišné KPI.
A právě zde přicházíme k datům, která by měla být KPI. Protože například nový klient – od něj chceš, aby znovu nakoupil, prodloužil si předplatné, což je jiný cíl a jiný KPI, než klient, který u tebe nakupuje už rok, třeba dvakrát týdně. U aktivního klienta chceš zvýšit frekvenci nákupů, hodnotu nákupního košíku, případně rozšířit nabídku. A to je úplně jiná práce než s klientem, který odchází, nebo s někým, kdo přišel.
Tento mindset a vysvětlení byznysu je základem, odkud projekty často pramení.
Teď jsme tady v datovém podcastu a mluvím hodně o posílání e-mailů. Stavět to však na datech je základ. Protože i při jednoduchém onboardingu neexistuje žádné univerzální pravidlo, že onboardingový klient je ten, který je přesně tři měsíce s firmou – nezáleží na tom, zda je to retail nebo médiální klient.
I v jedné zemi může být odlišný přístup napříč odvětvími. Například v retailu může být klient onboardingový, když už má několik nákupů – třeba tři nebo pět, anebo když utratil určitou částku nad padesát korun. Nejsou to složité metriky.
Často pak dochází k tomu, že se chce zavést predikční neuronová síť na onboardingového klienta. To zní skvěle, ale když nemáš vůbec nic, začínáš se základními analýzami, které často v těch firmách ani neexistují. Cílem je určit cutoff, tedy hranici, kdy říkám, že klient už je „zaháčkovaný“ a mohu změnit komunikaci s ním tak, abych začal rozšiřovat jeho nákupní košík.
Nákupní košík nemusí být nutně jen o retailu. Původně jsme to dělali jako z doby založené na rohlících, proto uvnitř firmy stále říkáme „nákupní košík“, ale může to být i například počet produktů nebo žánrů, které zákazník sleduje – třeba u finančních produktů. Tuto analogii lze použít i v jiných odvětvích.
Princip je stále stejný: pokud člověk u tebe kupuje maso, chceš, aby si koupil i rohlíky u tebe, nikoliv u konkurence. A zde vlastně začíná skloubení datové práce s byznysem.
Segmentaci tedy potřebujeme. Obecně se však nesnažíme hned vymýšlet něco přehnaně složitého, jako jadernou elektrárnu, obzvlášť když v datech není základ, tedy „vodní kolo“. Soustředíme se spíše na rychlé výsledky, které mají byznysový dopad, například formou POC (proof of concept).
Nechci, aby tento přístup vypadal jako rychlé a nedůkladné řešení „na koleni“ – to určitě ne. Jednoduché řešení si však můžeme dovolit v onboardingu a také u „černého“ modelu klientů (údaj o klientech, kteří přestali nakupovat), kde lze vyzkoušet jednoduché metriky, jako je pohyblivý průměr (moving average) kontaktů. Pokud to funguje, můžeme začít komunikovat s těmito klienty, správně testovat pomocí A/B testů a verifikovat data.
Pokud nemám vůbec žádnou komunikaci pro odcházející (černé) klienty, nemám co nabídnout, i když mám model, zůstane to jen filtrem v reportu.
Toto je naše mantra: začít s jednoduchými řešeními, testovat, pilotovat a sledovat byznysový dopad. Pak po dvou měsících diskuze na základě naměřených výsledků. Už jednu či dvě procenta zlepšení stačí, protože při milionech zákazníků nebo statisících je i malé procento znatelný a signifikantní uplift. To je skvělé.
Tehdy může přijít diskuze o složitějších řešeních a hlubším přemýšlení. Když už to na sebe vydělalo a máme první důvěru, získáváme naději, že vývoj AI nebude skokový, ale postupný. Že zítra neztratí práci nikdo, protože implementace technologií je jedna věc, ale složité je zabránit zákazníkovi, aby to celé pochopil, zanalyzoval kontext byznysu firmy. One-size-doesn’t-fit-all.
Proto je potřeba dobře provést sizing, health check a určit, co je důležité. A vždy se vrací to samé – mít byznysový případ (business case), kde se soustředit – na churn (odchod klientů), onboarding nebo rozpad segmentu aktivních klientů.
V aktivním segmentu bývá často 70 až 80 procent báze zákazníků, a tam leží peníze. Proto jdeme často do hloubky právě tohoto segmentu. V rámci Edvedy či jiných našich hodnot hledáme potenciál, který by měl firma mít.
Je to stále propojení, consulting. Data, která děláme, musí mít výsledek, který zaujme vedení (board). Aby na to našli peníze a investice byly opodstatněné.
Kdy je to pro vás příliš pokročilé? V tom, co říkáš, jsem rád, protože je to známka zdravého střízlivého přístupu. Ne všude musí fungovat deep learning, pokud to jde jednodušeji, a máte data, kde víte, co dělat. A to je dobře.
Na druhé straně u extrémně velkých firem…
Přijdete a tam už běží „černý model“ (model identifikující odcházející klienty), na jehož vývoji strávili půl roku až dva roky, a doporučuje či automaticky odesílá komunikaci. Za prvé však často ten model neběží – člověk by byl překvapen –, často se nedaří ten model spustit.
Nebo je postavený, ale ještě není implementovaný. My často děláme první krok, byznysovou implementaci, která zahrnuje datovou implementaci, dopočítání modelu, technické ETL procesy, nasazení do CRM nástrojů a tvorbu reportingu.
To vše je potřeba prosadit, protože i zde bývá problém. Model může běžet, ale nedostane se do CRM, protože data science tým není data engineering tým a neumí byznysu vysvětlit, že je potřeba to tam dostat.
Pokud funguje uplift v základním POC, například jsme dělali hezký model klasifikace zákazníků v retailu i médiích – jednoduchou segmentaci pro aktivní segment v lifecycle. Je potřeba ho jemně rozdělit: kdo je milovník vína a drahých steaků, kdo milovník romantických komedií.
Na tomto můžeš strávit hodně času datovou vědou a klasickými metodami, například lineární regresí, klasifikací nebo K-means. Často u těchto metod končíme.
Pokud chci ukázat zvýšení výkonu (uplift), a pokud je, doporučujeme klientovi budovat vlastní core data science tým, který bude na tom dále pracovat a posouvat hranice. Zvýšení o jedno až pět procent už může být dostatečné, aby se tým vyplatil.
Často z projektu odcházíme tím, že pomáháme vybudovat interní tým, který si po nás POC převezme a bude na tom stavět dál. My už nechceme být trvale součástí klienta, nechceme být zaměstnanci firmy.
Pokud máš model, musíáš ho iterovat a zlepšovat, stavět champion-challenger modely. Primárně se tedy zaměřujeme na stavbu modelů, třeba pomocí jednoduchých průměrů (moving means), ale velmi pečlivě stavíme model byznysově, aby šel využít.
Typickým příkladem je model, který predikuje LTV – lifetime value zákazníka, chceme vidět, kdo je „cash cow“, tedy kdo přináší nejvíce peněz a o koho se starat nemusíme tolik.
Data science týmy často staví model tak, aby měla největší diskriminační sílu – tedy aby co nejlépe rozlišil skupiny. Ale byznys s modelem neumí pracovat – potřebuji ty, co jsou níže, přesunout výš.
Jedna věc je model využívat, vidět segmentaci klientů, druhá, že potřebuji u lidí měnit proměnné, aby se zvýšila jejich LTV. Toto je princip – modelář musí tuto potřebu akceptovat a propagovat napříč firmou.
Často narážíme na problém, kdy proměnné v modelu neumí byznysově využít.
Příklad? Demografie – údaje o pohlaví jsou super, ale já muže nezměním na ženu, ani mu nepošlu zprávu typu „staň se ženou, budeš nakupovat drogerii“. To je obchodně nereálné.
Může to však být cenný insight – pokud vím, že ženy jsou pro mě hodnotnější zákazníci, mohu věnovat více času a energie kampaním zaměřeným na ženy, protože identifikuji cílovou skupinu.
Velmi silným prediktorem je i délka vztahu klienta s firmou – jak dlouho je zákazníkem napříč odvětvími.
Je extrémně silnou proměnnou: pokud je klient u tebe rok, bude u tebe s vysokou pravděpodobností i další rok. Pokud je nový měsíc, je větší šance, že odejde.
Churn křivka (odpad zákazníků) má logaritmický tvar: největší odchod je na začátku a pak klesá.
Tento prediktor má každý data science tým ve svém modelu se silnou signifikancí.
Problém nastává, pokud kvůli němu do modelu nezahrnou jiné prediktory – třeba ty, které ovlivnit lze.
Tento přepis zachovává veškerý obsah původního textu, opravuje gramatiku, diakritiku, dělí do odstavců a ponechává význam beze změny.
Zase například ta tvoje jako byznysová implementace. Co ty s tím? Zůstane díl, aby zůstal díl, abys pro mě měl větší velikost, komunikuje fakt jako špatně. Moje otázka je, jak do detailu – nebo zase tady přichází ze zkušeností, že tam buď mají nějaký šelmatroj, který není ani v produkci, nebo jsou na úplném základu. Pro mě je to hrozně zajímavé, protože technologie nám dneska umožňuje hyperpersonalizaci, tedy že každému z našich 100 tisíc zákazníků přijde mail na míru. Myslím si, že i v úplném základu bych to s webkodingem postavil já sám úplně jednoduše někde u sebe na lokálním počítači.
To chápu, ale z mého pohledu do toho přichází praxe byznysu, že ty máš nějaké copywritery, kteří potřebují, aby tam nebyly chyby, proto většinou posílají jeden mail pro všechny. Když jim řekneš, že máme najednou tři segmenty, znamená to třikrát tolik práce. Předpokládám, že když tam přijde data scientist, který vůbec nemá představu o tom, jak firma funguje, udělá segmentaci: tady máte 20 skupin a na každou z nich máte tenhle mail. Ale ve skutečnosti to nedává smysl, protože nikdo to nebude dělat.
Tohle je přesně to, kde začneš narážet, když začneš stavět personalizaci pomocí AI, ať už jde o personalizaci k těm personám, které tam často používáme – jako naši strategie konboardingová a aktivní uživatelé – a podle toho, kde mají persony a jakou mají šířku nákupního košíku. Můžeš si docela jednoduše otestovat, jestli máš správně nastavené kontrolky, A/B testování a tak dále. Čím jdeš do větší hloubky, tím jsou přínosy vyšší. Čím máš personalizovanější přístup a čím lépe dokážeš asociovat, tím to funguje lépe. To není žádná složitost, je to selský rozum. Co my tam často stavíme, to ale po nějaké době začne narážet na kapacity týmu.
Ať už CRM týmu, který udržuje dnes někde SAS, Bloom Reach, Salesforce, je to vlastně jedno, v čem přesně, protože spravovat 20, 30 nebo 50 kampaní a každou z nich mít ještě rozvětvenou podle tone of voice, demografie, pohlaví… to se ti fakt nahromadí. Na tohle začneš časem narážet a hlavně je problém s mailem, ale nemusí to být jenom mail, může to být jakákoliv komunikace – třeba poubička, zavolat. Mail je však takový představitelný příklad. Musí toho někdo napsat. Typicky píše copy někdo – často nějaká externí agentura – a ti začnou obhajovat, že když jedno copy píše tým třeba týden dva a ty ho pošleš na celou svoji bázi, tedy stovky tisíc e-mailů, tak je to téměř nulový náklad.
Když pak začneš víc segmentovat, začneš si vybírat menší skupinky. To je přesně způsob, jak bys měl stavět personalizaci s AI – tak to děláme my v poradenství a v byznysu. Funguje to – každé procento se počítá. To je způsob, jak toho docílit. Začne se ti tam rojit hodně věcí a není to jenom o rozesílce, ale o celém managementu kolem toho. Musíš v rámci týdne nebo dvou mít kontrolu nad tím, že jsi zadal přes 50 copy, že jsi všechny prošel, ověřil, že jsou správné. Pak je třeba ty copy nasadit do Bloom Reach, SASu nebo jiného systému. Začne to být chaotické – věci ti utíkají a začneš na tohle narážet. S tím se potkáváme docela často. A právě teď se snažíme najít odpověď a myslím si, že se nám teď docela hezky povedlo jí alespoň částečně objevit.
Hrajeme více s odpověďmi v rámci AI. Na začátku náš velký klient na boardu zazněl názor jednoho ze stakeholderů, že přece on už dnes píše e-maily na osobní úrovni tak, že si napíše čtyři věty a hodí to do ChatGPT nebo Gemini, a zeptá se: „Udělej mi z toho lepší, hezčí e-mail.“ A může to odeslat. Tak nepochybuju, proč dnes pořád zadává copy agenturám, které mu to zanedbávají a vrací špatné výstupy. Nedej bože, že chce k textu nakreslit obrázek, to přidá dobré dva týdny navíc. To slýchám docela často. Minulý rok na konci roku jsme se rozhodli v našem malém POTčku tuto věc vyzkoušet – prostě říct: pojďme tu copywriting práci psát přes AI, pojďme nahradit ty agentury a chvilkově si zahrát, že jsme agentura uvnitř týmu.
Vyměnili jsme agenta za agenturu. Takže se z nás na tři měsíce v rámci datového týmu stali copywriteři, ale řešili jsme to od začátku přes AI – vytvořili jsme si jakéhosi agenta, který bere byznysové zadání a stavěli jsme to modulárně. Potřebuješ AI vysvětlit, pro koho píšeš, demografické údaje – kdo jsi, co nakupuješ, co máš rád, co sleduješ – prostě popsat, co by tě mohlo zajímat, na základě čeho se může e-mail personalizovat. Myslím, že se nám to docela povedlo. Celý proces máme hotový přibližně ve třetinovém čase ve srovnání s manuálním psaním.
Ukázalo se, že to ovšem není jen o sepsání promptu. Byl bys překvapen, s čím se dnes musí člověk potýkat. Zkoušeli jsme tři verze – fakt jsme bojovali s copywritingem na 50 % báze. Pak jsme zkoušeli dva přístupy – hyperpersonalizaci, kde každý člověk dostane originální e-mail, nikdo nedostane stejný obsah jako druhý. A dále jsme zkoušeli klastrovou verzi, kdy si rozdělíš lidi do klastrů – například 40 segmentů – což není jedna kopie, ale ani 100 tisíc různých e-mailů. Uděláš jednoduchý modul, jak lidi poklastrovat (to není čistě AI) a vyzkoušíš, co funguje lépe. Vyplatí se vůbec ta hyperpersonalizace, nebo stačí jen několik desítek verzí?
Vyplatilo se zkoušet obojí. Hyperpersonalizace přinášela lehce lepší výsledky – asi o zhruba procento – ale je potřeba vzít v úvahu, že jsme to stavěli jako proof of concept (POC), ne interní model, a využívali jsme AI skrze API do veřejných služeb. Cena za generování e-mailů stoupá. Interně by se to dalo optimalizovat, ale zatím jsme to neimplementovali. Cena může být i 50 haléřů za mail, což při 30 e-mailech není problém, ale při 100 tisících už to stojí za zvážení, zvláště když se posílá každý týden. Výsledkem je, že interní copywriter to možné náklady relativně vyrovná.
Toto je rozhodně směrem, kterým se teď začínáme ubírat, spíše se s tím hrajeme a líbí se nám ta implementace přímo u klientů. Když bychom šli ještě dál před AI, k tzv. agentním systémům, tak co bys jako pravidlo měl ohledně segmentace? Kolik segmentů je hodně, kolik málo? Máš zkušenost z korporátní sféry, takže poměrně objektivně řeknu: bez zkušeností bych řekl, že více než deset segmentů nedává absolutně smysl. Tři segmenty jsou hezké pro jakoukoliv firmu, vyšší jednotky už pouze tehdy, když jsou dobře udržitelné a existuje jasný fokus na každou jednotlivou personu či segment.
Samozřejmě záleží na velikosti CRM týmu, ale obecně stavíme někde mezi šesti až osmi skupinami. Pokud to má obsluhovat manuálně CRM tým, pak přílišné členění nefunguje. Vymýšlet 20 skupin není praktické, obvykle to člověk nestíhá týdenně obsluhovat.
Důležitější je pak frekvence kampaní než jednou měsíčně obsloužit dvacet různých segmentů. Když obsloužíš šest skupin týdně a jsou trochu propojené, je to lepší. U segmentace hodně mluvíme s byznysem, jak segment vnímá, protože byznys musí rozumět, koho má oslovovat. Proto je potřeba, aby data scientist vytvořil scénář pro byznys s vysvětlením, kdo je v jednotlivých skupinách a co by je mohlo oslovit. Obvykle končíme mezi šesti až osmi segmenty, více už je komplikované.
Persona je dobrý pojem, protože je to konkrétní člověk a tím pádem srozumitelná reprezentace. Myslím, že s příchodem AI se to může trochu změnit, protože matematicky už je možné jít do větší hloubky v segmentaci a mít pro ně specializovanější nabídky. Problém ale je, že tým to nemusí zvládnout obsloužit. Myslím, že AI v korporátním využití v tomto směru bude hrát velkou roli.
Když o tom mluvíš, říkal jsi, že to bude trochu jednodušší, co tedy byly bariéry, na co nebyla AI infrastruktura připravena? Nejvíc jsme bojovali s aktuálními informacemi. To, co je čerstvé, často není v modelech obsaženo, protože jsou založené na starších datech z internetu.
Nejhorší je to, když se už něco podobného v historii stalo, ale situace je nyní jiná – například přestupy v týmech, hráči a podobně. Tam AI nefunguje moc dobře, protože jsou zmatené fakta. Dá se to ale řešit. Nemůžeš házet na AI všechny úkoly, je třeba zkombinovat to s nějakým news webem, který pravidelně skraipuje aktuální data a vkládáš je do modelu jako dodatečná fakta.
Je to podobné jako najmout lidi, kteří by sledovali události, vytahovali metadata a cpali je do modelu. Toto byly opravdu věci, na které jsme narazili – často se mění i názvy produktů, termínů a podobně, takže je potřeba informace neustále aktualizovat.
Také jsme bojovali s tím, že firmy často mají nastavenou komunikaci v rámci tykání, vykání, zda je velké T apod., a AI to občas nezvládne přesně dodržet, což může být problém. Velmi překvapila i technická připravenost modelů. Při generování milionů e-mailů máš v šablonách oddělené části – hlavičky, hlavní texty a další. Volání AI přes API se dělají milionkrát a AI často padají.
Stávalo se nám, že přes víkendy, kdy jsme připravovali pondělní newsletter, AI padala. V pondělí ráno totiž mnoho lidí čte nepracovní e-maily místo pracovních. Ty to musíš stihnout na pondělí ráno.
Často docházelo k “time-outům” u API volání, protože všežto běží přes API. Generování mailů pro 120 tisíc lidí může trvat i tři až čtyři hodiny, protože běží v cyklech s databázemi a podobně. Nikdo většinou u toho nemusí sedět, prostě to pustíš přes noc. Nicméně, když to padá třikrát až čtyřikrát, musíš udělat inženýrskou práci – ošetřit chyby a restartování procesu. To člověk také musí čekat.
Byl jsem překvapený, jak velký je nápor dotazů a kolik to zvládne zatím AI. Předpokládal jsem, že zvládne tisíce dotazů najednou, ale padání bylo časté. To byly největší problémy, které jsme při začátku nečekali.
Baví mě, že u toho záleží na aktuálnosti. To asi nepředpovídáš na rok dopředu, aby ses tím mohl zabývat v dávce. Behaviorální prediktory musí být co nejčerstvější, to je základ personalizace.
Současně musíš myslet na byznysový pohled, jestli vůbec ten e-mail poslat, závisí na kampani – třeba churn prevention kampaně mají svou strategii, jestli je vhodné klienta kontaktovat.
Jsi profesionální editor českých podcastů.
Úkol:
Přepiš text do spisovné češtiny.
KRITICKÉ:
- Zachovej 100 % obsahu
- NIC nevynechávej
- NIC nezkracuj
- Význam musí zůstat stejný
Pravidla:
- oprav gramatiku
- oprav diakritiku
- rozděl do odstavců
- zachovej všechny informace
TEXT:
Bo jestli mu máš poslat nějakou absolovou, co můžeš rozhodnout až jako vlastně v neděli, to znamená, to jako jaký model generuješ, jako to je vlastně čerstvá informace, protože když tě zmáčkne jako unsubscribe, tak mu nebudu posílat, jako tak se budu snažit jako zachránit a ne mu tady rozšiřovat nákupní kaši. Takže ty to potřebuješ jako počítat vlastně relativně, jako nepotřebuješ to rejltajmově. Proto tady už teď máš tak moc neviděmo, co se možná vymyslíme, ale zase jako počítat to jako týden dopředu spálíš zbytečné tokeny a naopak nevygeneruješ to, co bys měl, a ztratíš tu relevanci a ten uplift.
Já jsem celou dobu hrozně zaběhnul do vlastně CRM nějakého problem solvingu u pár klientů a teď to asi hrozně vypadá, že řešíme jen CRM Edvery a že jsme tady CRM agentura, ale pravdou je, že dneska CRM tvoří velkou část, ale pořád je to třeba 30–40 % našich projektů, takže ani ne. Je to vlastně většina toho, co v rámci Edvery děláme? Je to asi nějaká mantra. Takže asi na tom umíme hezky navázat, ty modely propojit, už to má takový flow, takže to je fajn.
Mně se líbí ten přístup oproti zbytku trhu, že to není jen připojit Blue Mage na jedné straně nebo udělat šalmastroja nejlepší černý model na světě, ale že tam cítím ten váš consulting přístup. Je to propojení tohohle, ale rozhodně to není to jediné, čím se zabýváme.
Když bych zkusil vytáhnout něco úplně z jiného soudku, tak jen narychlo, nakonec fakt, když se podívám, tak takový industry vlastně Rumunsko, Premier Energy Energetica projekt, který vůbec nic nemá společného s CRM, a přesto jsou lidé, kteří pracovali na obou dvou projektech. Ne teda současně, ale vlastně v rámci CRM Premier Energy a fakt se tam bavíš o desítkách milionů korun měsíčně. Když to netrefíš dobře, tak prostě… Rumunský trh toto nikdy moc historicky netrápilo, protože ty penále byly často i třeba pomalu levnější než nákupka té elektřiny, takže to byly víceméně drobné. Ten trh se tam hodně změnil, celý rumunský trh, a my jsme se nějakým způsobem dostali do Premier Energy, kteří to začali řešit – jak lépe predikovat spotřebu svých zákazníků.
Vlastně pokud energetická krize, Ukrajina a tak dále, tak ten se trochu změnil. A tam jsme se dostali k tomu, že pojďme vytvořit lepší model. Už se tam nebavíme o business konsultaci, to je plnohodnotná neurónka, ne? V Premier Energy jsme začínali nějakým měsíčním health checkem, abychom se posvítili na to, v čem je hlavní problém. Je to problém v nákupu elektřiny, problém v tradingu elektřiny, problém v predikcích, problém v reportingu, že tam třeba není feedback, jednoduše nevíš.
Pro nás to bylo hodně nové, hodně nový industry, což je ta klasika — jedeš tam a víš o tom třikrát méně než ten, kdo sedí naproti tobě, a ten sedí naproti tobě a dělá to posledních 30 let. To je pro energetiku hodně typické — jak jednou člověk „spadne“ do té branže, tak tam jsou lidi 20–30 let.
Ale i tady zjistit problém, protože zadání bylo: platíme hodně peněz za balanční vyrovnání, za settlement costy, prostě na balancing marketu platíme hodně. Pojďte nám s tím pomoci, pojďte se na to podívat.
I tam jsme si poprvé mysleli, že stavíme modely od day one. Ukázalo se, že není moc na čem stavět, protože to nebyla priorita, protože tam ten problém na trhu nebyl, tak všechno bylo velice manuální, plné copy-pastů a úprav. Než jsme mohli začít stavět model, potřebovali jsme stavět databáze. Projekt s modely se tak stal.
A oběhat paní, ať vám představím, jak jsem… Ano, psát pythoní skripty na načítání desetileté historie uložené v Excelech do formátu, ve kterém se dá pracovat v Azure, BigQuery a tak dále. Vznikl takový projekt „před tím“, protože stavět model na Excelu nechceš.
Mám radost, že ať jste hardcore data scientisti, nebo high-endoví konzultanti, ty ruce si těmi daty ušpiníte vždycky. Vymyslíš jeden formát a formáty Excelu se mění, protože máš deset let a data z různých zdrojů. Napsal jsi skript, co to automaticky načítá a po roce začal padat, protože se změnila tečka na čárku nebo přidal sloupec – to bylo super.
Od tohohle chceme jít i do implementací, nechceme končit jen u „máte lepší model, toto je problém, najděte firmu, co vám ho udělá.“ Nebo „najděte firmu, co vám postaví databázi, a zavolejte nám potom“. Nebojíme se vyhrnout si rukávy a jít do toho.
V tomhle tedy stavba databáze a postupné modelování. I tam máme neurónku, ale primární model pro ně je linární regrese, protože je interpretovatelná. Když nemáš nic, tak můžeš mít dva modely: jeden, do kterého vidíš a rozumíš mu, když něco nastane, a druhý, který je možná lepší, ale je to black box, nerozumíš, co se děje.
Tak jsme stavěli oba typy modelů. Měl to být tříměsíční projekt, ale jsme tam rok a půl. Hiringujeme jejich data science tým, aby to převzali, protože už tam dlouho nejsme. To není ten sweet spot, kde chceme být dlouhodobě. Chceme předat projekt a jít dál — lidi u nás totiž mají drive dělat nové věci, kvůli tomu si do Edvery přicházejí.
Myslím si, že už tam je verze, která se povedla. Ne všechno je sluníčkové, ale dneska model je asi o 20 % lepší a šetří miliony.
Byla to docela rough road.
K půlce development cyklu modelu se úplně změnila regulace v Rumunsku, která tam nikdy nebyla — deregulovaly ceny a reálně cena elektřiny v Rumunsku někde v červenci minulého roku téměř vzrostla na dvojnásobek, což v datech nebylo, nikdy se to nestalo.
Lidé samozřejmě reagovali, všude v novinách apod. A model ten šok nezachytil. Tady jsme využili náš přístup — nemusí být všechno komplikovaný.
Když ten šok nebyl historicky v datech, jak ho dát do modelu? Nemáš data, kdyby se zaznamenal jako šok.
Vyplatilo se, že běžela lineární regrese, do které můžeš šahat, hrát si s baseline, nastavovat úspory, které držíš mimo model jako manuální vstup.
Byl to hezký příběh, bohužel jsme model předali v okamžiku, kdy přišla regulace, takže klient přišel, že model nefunguje, je rozbitý.
Začali jsme znovu vyvíjet, přemýšlet, jak ten efekt dostat dovnitř, když nejsou data.
Dívali jsme se, jak na podobné šoky reagovaly jiné trhy — úplně jiný přístup.
Byl to náš největší core data science projekt.
Pro mě je zajímavá energetika v Rumunsku.
Jak moc máte zahraničních klientů?
Záleží, co počítáš za zahraniční, často jsou to centrály a my jsme hodně cestovali do zemí.
Dneska je asi 60 % klientů českých, zbytek zahraničních.
Primárně východní Evropa, jako Maďarsko, Bulharsko, a tak dále — blízké země.
Máme také specialitku — tři kanceláře, Praha, Brno, Manila.
Než půjdeme k Manile, co jsou další use cases, co máte v CEE nebo východní Evropě?
Určitě pěkný use case je logistika.
BoxNow — v Česku neznámá firma, která ale má české vlastníky a působí v Řecku.
V Řecku před třemi čtyřmi lety žádná taková služba nebyla, a my jsme s Advery Group stavěli vše od základů — od najímání skladů a řidičů.
Je to biznisová stránka přes datovou ještěce — kdy data, datový sklad, napojení na aplikaci, co řidiči používají k odklikávání balíčků v depech.
Je super, že jste dělali předtím Paketu — díky tomu máme know-how.
U BoxNow jsme řešili rozmístění boxů, aby pokryly síť, jak optimalizovat trasy, jak mají být velká auta, aby se nevešla do ATN atd.
Logistika je hrozně zajímavé téma i z datového hlediska.
Je to jedno z nejfascinujících témat a hodně tam je jednotková ekonomika, podobná e-shopům.
Správně spočítaná jednotková ekonomika je interní číslo, které ovlivňuje všechno.
Tady je to cena doručení balíčku — průměrná cena.
Je to něco, co tě drží na trhu, umožňuje nastavovat finanční podmínky vůči partnerům, e-shopům i konkurenci.
To je ta korovintu, která zahrnuje všechno ostatní.
Rychlost a cena jdou dohromady — když čekáš čtyři dny, je auto plnější, cost per delivery klesá.
Není to jediná metrika, ale hlavní.
Omlouvám se, dostal jsem tě z Manily.
Dostal jsem tě z Manily do Řecka.
Přeskočili jsme hodně.
Praha, Brno, Manila.
V Manile jsme se dostali přes finanční sektor a moji zkušenost z Home Creditu.
Filipíny jsou kousek od Indonésie.
Primárně tam máme finanční sektor — například Home Credit, Unobanka, Security Bank, Tonic Bank.
Tam máme venture — FinPro v rámci skupiny Advery, na trhu rok, řeší collections.
Zase je to finance, ale jiný pohled.
Tak jak řešíme u Pakety last mile delivery, tu kolegium collections děláme tam — door-to-door collections.
V Česku nebo Evropě to moc nefunguje, ale v Asii hodně.
To je, když na skútru přijde někdo vybírat dlužné peníze a jde s dlužníkem komunikovat.
Nejde o „baseballku“, jak si často představujeme, ale je to péče o zákazníka — přijdeš si sednout ke stolu k tomu dlužníkovi, kde ostatní instituce přijet nechtějí.
Je to spíš finanční poradenství.
Z datového hlediska je ten byznys zajímavý.
Stavíš to na zelené louce — kolektuješ jednotlivé lídy, což jsou kontakty, kde lze vymoci peníze.
Potřebuješ v aplikaci zaznamenávat výsledky collection, stavět reporting, abys věděl, kde co běží.
Řešíš data inženýrství, protože signál tam není všude, takže jsme například fyzicky chodili.
Otevíráme novou kategorii.
V Edvery děláme data inženýrské služby, až po data science.
(Tady text končí v původním záznamu.)
Převedený text kopíruje originální obsah se všemi informacemi a významem, opravil jsem gramatiku, diakritiku a rozdělil text do odstavců pro lepší čitelnost.
Bavíš se zase o přeřazování těch případů (case) k těm jako kolektorům. Mám dneska jít vybrat peníze od Honzy nebo od Pepíka. Ono totiž platí křivka – čím dřív tam dojedu, čím blíže jsem tomu místu, kde měl ten člověk zaplatit, tím je větší pravděpodobnost, že se mi nějaké peníze z něj podaří dostat. Křivka je prostě neúprosná, vlastně vypadá velmi podobně jako nějaká černová křivka černého dlužníka. Přesně tak, spíš jejich peníze černou.
Takže i tam vlastně řešíš, že nevybereš všechny, nebo nestavíš se ten den u všech, protože logicky nemáš neomezený počet lidí jako kolektorů. Tam ta rovnice prostě nevychází úplně. Takže řešit vůbec, koho kdy vybrat, kdy se za kým zastavit, přeprioritizovat podle výsledků těch koleček, jednotlivých návštěv, a vlastně každý den tohle přepočítávat.
Dneska a tento týden nasazujeme nějaký jednoduchý POC (proof of concept) tohoto modelu, protože teď to bylo fakt hodně jako dump roof [pozn. nejasné], spíš to bylo jako demo než dump roof, prostě fakt jednoduché – kolektor přeřadí všechno a řadí to podle více méně jako výše, fakt jednoduchá metrika. Ale i ta vlastně funguje lépe, než když to bereme nějak náhodně, zase hned od začátku. Náhodný jsme dělali A/B test, protože má smysl stavět ten model, i přestože je to interní firma nebo v rámci skupiny. I tam si pokládáme otázku, zda má smysl stavět nějaký škálovatelný model.
O to víc, když jde o tvoje peníze. To pro mě není paradox, to pro mě trvá – neprodám ti nic, co bych si sám nekoupil. Takže i tady prostě ano, vyplatí se to, než náhodně řadit, prostě mít na tom jednoduchou logiku.
Teď jdeme zase trochu víc stavět něco sofistikovanějšího, nějaký prioritizační model. Opět asi nebudeme rovnou stavět real time systém, kdy mi přijde lead a okamžitě s ním jedu. Ne, nejdřív to chceme dělat třeba na týdenní či třídenní bázi. Když to bude fungovat, začneme uvažovat o real time řešení, protože to je zase úplně jiný technický problém – prioritizovat přes den, kam má kolektor jet, což bude mít jistou souvislost i s trasou, tedy kam má řidič jet, a nejenom jaké případy má ten den vybrat.
Myslím, že je to super zajímavý problém. Spojuje se tam ta znalost z ekologistiky. Pro mě s ADHD to zní fascinujícím způsobem – nové věci, různé trhy, různé země, globální působení. Ale zase to asi není pro každého, je nutno říct. A předpokládám, že i v tom technickém stacku to bude asi hodně rozmanité, že někdy to je neuronová síť, jindy bílá tabule, tak že vlastně…
Jo, jo, určitě. Všechno to, o čem spolu tady mluvíme, nejsou projekty, které jsme viděli ve firmách, kde se o ně starají zaměstnanci, jsou to projekty, u kterých jsme byli s necelými 20 lidmi já, ty a další, kteří na tom pracovali v rámci firmy. Technický stack jako paketový systém a CRM v rámci RV je úplně jiný.
Bývá to častá otázka, třeba na pohovorech. Snažím se to lidem vysvětlit. Otázka bývá, jaký je technický stack, s čím pracujete, co bych měl umět, abych u vás mohl pracovat. Na to není jednoznačná odpověď, vždy se snažím odpovědět šalamounsky, protože záleží na projektu. Obecně to bude vždy nějaké SQL, protože potřebujeme pracovat s daty.
Ale jestli budeš psát dotazy v BigQuery, Azure, nebo lokální Oracle databázi, to neumím říct, to je určité zjednodušení. Takže pořád jde o SQL, ale liší se prostředí, ve kterém se to používá. Tak nechci zabíhat do detailu.
Může se stát, že budeš na projektu, kde se ke SQL ani nedostaneš, protože jsi v úvodní fázi, v health checku, a klient tě k datům nepustí. Proč by měl, když nevíme, jestli bude následovat další měsíc nebo jestli vůbec bude pokračování – nejdřív se čte business case, reporty, tahají se data, které ti dodají v nějakých balíčcích atd.
Pak se dostaneš k implementaci. Já jsem spíše na začátku, přesně v konzultační části, ale i to děláme analyticky, takže to často dělá někdo v mém týmu, protože musí být ta práce dobře koordinovaná.
A pak dojde na implementační část. Když jde o reporting v online prostředí, potřebuješ se vyznat, jak měří Google Analytics (GA) data nebo Adobe Experience, jaký je tok klienta, protože pak data z online prostředí přecházejí do call centra, kde se prodej dokončuje.
Pokud dostanu zadání „postav report“, tak v pořádku – Power BI, Tableau, Looker, podle toho, co klient používá. Když mají reporty v Lookeru, tak jim nebudu říkat: „Postavím to v Power BI, kup si licenci,“ to nedává smysl. Aby projekt nepropadl kvůli návrhu jiného tech stacku než který klient používá.
Musíme se proto přizpůsobit. Reportovací nástroj lze změnit, ale abych do něj data vůbec dostal, musím nastudovat, jak dostat data z online prostředí, z Adobe, BigQuery do databáze, kterou má klient – může být centrální v Azure.
A také jak získat data z call centra, které sedí v nějaké interní aplikaci call centra, proto je třeba napsat ETL procesy, které zajistí přenos dat.
Takže i taková zdánlivě jednoduchá věc jako „pojďme postavit report“ není jen Power BI, ale bývá za tím často tři, čtyři různé technologie. A to nemluvím o samotném vytvoření modelu.
Jsem rád, že kandidáty takto odrazuješ, protože jak jsi popsal, rozšiřoval jsem své zkušenosti o reportování, které na první pohled vypadá jednoduše. Ale najednou potřebuješ znát BigQuery a interní call centrum s custom řešením.
U nás třeba na projektu mnohokrát nepracuje šest lidí odděleně na těchto částech. Jeden umí dělat reporty, druhý je v BigQuery, třetí dotahuje data z Adobe. U nás to není tak, že by to dělalo šest lidí. Nevím jak bude v budoucnosti, třeba pokud nás bude tři sta, možná si budeme moci dovolit větší specializaci.
Ale dnes si zaměstnat specialistu na Snowflake je těžké. Rád ho zaměstnám, ale zároveň mu říkám: „Snad se může stát, že Snowflake tři roky neuvidíš.“ To mi přijde fér.
Myslím, že člověk, který chápe průběh této změny, ať už průmyslové, nebo technologické, bere to spíš jako výhodu. Nejde o to mít svoje datové teplíčko, chodit na konference, učit se detailně každý nový release.
Je to spíše o tom naučit se technologie do určité úrovně napříč tech stackem a pracovat s nimi, a být připraven během půl roku až roku opustit projekt, firmu a jít dělat něco úplně jiného v jiném oboru s jiným tech stackem.
Tento trend vnímám i na úrovni obsahu DataTalku. Na jedné straně máme více produktové téma, datovou transformaci a jak provést změnu nejen s pomocí datových technologií, ale i ostatních aspektů.
Na druhé straně je tu AI, kde konzultační schopnosti a pochopení byznysu získávají na významu.
Já, který jsem více z IT, vidím bruslení BI jako super, protože tam je více žen a je to více zaměřené na byznys.
Už to není stereotyp ve sklepě typu „co po nás chcete, centrum?“, ale byznys je mnohem blíž. V poslední době se ta oblast moc otevírá a překvapivě cennější část je v opravdovém poznání klienta.
Platformy se platformizují, takže už je menší rozdíl, jestli si vybereš Fabrics, Databricks nebo Snowflake. Stejně tam jsou rozdíly a různé use case, ale jsou si komplementární a konkurenční.
Technologie se stávají komoditou. Hodnota je tedy ve pochopení zákazníka a mentalitě, jakým způsobem s ním jednáš.
Cítím, že sázíte na dobrou kartu, máte štěstí, že to jde tímto směrem.
Jak jsem říkal na začátku, technologické firmy se mění na technologicko-konzultační. Směr konzultačně-technologický je paradoxně v roce 2026 jednodušší než před pěti lety.
Technologie se demokratizují, odemykají.
S tímto se mohu plně podepsat.
Co vás čeká do konce roku? Zní to, že máte našlápnuto a nevěřím, že víš, co dřív. Jaké jsou další kroky, milníky?
Určitě v rámci současných klientů řešíme pokračování a zároveň se snažíme klientelu dál rozšiřovat.
V rámci Edvery se snažíme budovat Edvery Group, pod kterou spadá Edvery, Edvery Ventures.
Některé věci se snažíme oddělovat, například FinPro, což vzniká jako inkasní agentura, vedle Edvery pak vznikají IT divize, jako G-Tix.
Bavíme se i o AI, které jsme v Edvery testovali na několika POC projektech, a tento směr se nám líbí, proto chceme AI produkty oddělit.
Vzniká vedle Edvery Skygen, která by měla více produktů v oblasti AI vyvíjet. Čistě AI pozice.
Bude to více zaměření na produktovou část, oddělenou od consultingu, více R&D.
Také vzniká start-up se zaměřením na rizikovou oblast.
Edvery se v tomto směru rozrůstá, už to není jen Edvery, ale spíš Edvery Group.
Uvidíme, která část bude úspěšná. Já se na to těším, těším se, kde bude Edvery za dva, tři nebo deset let.
Já se také těším, držím palce a děkuji, že jste nás pustili dovnitř Edvery, povídali jste o zkušenostech s CRM a neomezuje se to jen na ně.
Hlavně děkuji za otevřenost – není to všechno růžové, jsou tam kompromisy a není to pro každého, ale pokud ano, tak se Martinovi ozvěte.
Jsem zvědavý, jakým směrem se posunete. Děkuji za ten vhled a držím palce.
Děkujeme vám, že jste doposlouchali až sem, a děkujeme i našim stálým partnerům a členům Data Talk klubu.
Těmi jsou Saska, TV Nova, Direct Technologies, GoodData, Myton, Colors of Data, BeStreet, Flo, Karlové.
Díky moc za podporu a nechť vás provází data.