Data Talk #116: Jakub Šiler (Carl Data Company)

V tomto díle Data Talku moderátoři Jirka a Bára ve studiu přivítali Kubu Šilera, aby probrali nejnovější vývoj nástroje Carl for Social. Dozvíte se, jak jeho tým implementuje multimodální AI modely Gemini pro analýzu influencerských kampaní a proč nestačí předpřipravené ML modely z GCP. Jakub také sdílí, jak se jim daří propojovat technologie s reálnými potřebami marketingových týmů a co obnáší validace AI modelů v praxi.

Strojový přepis

Zde je opravený text s úpravami interpunkce, pravopisu a čitelnosti:

Dobrý den, moje jméno je Jirka Vicherek.
Ahoj všem, moje jméno je Barbara Hinerová.
A vítáme vás u dalšího dílu podcastu Data Talk.
Naším dnešním hostem je už po druhé Jakub Šiler, CEO Karl Data Company. Ahoj všem.

Druhá část je ta, že si uživatel navolí trendy v kategoriích, které ho zajímají, například sport, a my mu tam dáváme aktuální trendy ze sociálních sítí – z YouTube, Instagramu, TikToku – co zrovna běží v dané kategorii.

Třetí důležitou částí jsou právě obsahové spolupráce. Vše, co říkám, vychází z uživatelského testování. Měli jsme třeba víc než stovku uživatelských testů s tvůrci a všechno, co teď vyjmenovávám, směřovalo k tomu, že to zefektivňuje jejich práci, respektive jim šetří čas na věcech, které nechtějí dělat.

Jedna z těch věcí, která mi přijde trochu bizarní a není dobře vyřešená, je reportování obsahových spoluprací značkám. Ve většině případů to totiž funguje tak, že influencer musí udělat screenshot obrazovky a poslat ho agentuře nebo klientovi, že úkol splnil.

U nás to funguje tak, že když si uživatel napojí všechny své sítě, označí si jednotlivý post spoluprací s konkrétním klientem – například klientem A. Takhle si označí příspěvek napříč sociálními sítěmi a systém mu vygeneruje report.

V uživatelské aplikaci vytvoříme automaticky PDF, které obsahuje seznam videí, postů a základní metriky k nim. To může uživatel rovnou přes telefon sdílet, komu chce.

Druhá část, která je teď hodně aktuální, je zaměřená na byznys, tedy B2B segment. Firmy, které spolupracují na kampaních s jednotlivými tvůrci, je zasmluvní a do smluv vloží požadavek na využívání ekosystému Carrefour Social. Tvůrci v kampani si stáhnou naši aplikaci, v ní jim předdefinujeme název kampaně jako tag, napojí své sítě, znova si je stejným způsobem označí, ale PDF už neposílají – tím proces nekončí.

Protože napojujeme všechna data, mají klienti vlastní webovou aplikaci s klasickým reportem, kde sledují, jak kampaň funguje. Takže odstraňujeme nutnost posílání screenshotů.

Další výhodou je, že dosavadní reporting byl většinou založený jen na základních metrikách, jako je počet zhlédnutí, lajků, komentářů apod., ale my jdeme mnohem do hloubky obsahu.

Těm klientům reportujeme, jak jednotliví tvůrci hovořili o značce a co se ve videu dělo – například jestli se značka vůbec objevila. Dále sledujeme, zda byly ve videu zmíněny konkrétní sdělení, které firma chtěla u kampaně zdůraznit. Používáme speech-to-text technologii, abychom přesně zaznamenali, co se o značce říká a v jakém kontextu.

Některé značky zase chtějí sledovat brand kódy – například logo, barvu loga nebo další symboly...

Pokud si přejete, mohu text připravit i formátovaně pro lepší přehlednost nebo upravit styl.

Jistě, tady je opravená verze textu s lepší srozumitelností a úpravou stylistiky:

Nebo ten konkrétní produkt třeba? Nebo konkrétní produkt — lahev, půl litru, taška nákupní, dodávka, cokoliv. My jsme schopni trackovat i takové věci. Zároveň umíme sledovat všechno „přes sebe“. Tomu teď říkáme „speech about“, což je kombinace detekce loga, převodu řeči na text a detekce objektů.

Navíc, pokud máme připojené analytické nástroje, známe i retenční křivky daných videí. To znamená, že víme například, že na YouTube je uvedeno 2 miliony zhlédnutí, ale 30–40 % lidí odpadne během prvních dvou sekund. My tak přesně víme, že značka se poprvé objevila v 30. sekundě, ale v tu chvíli už bylo video viděno jen jedním milionem uživatelů.

Sekvence „speech about“ trvala 20 sekund, ale dokoukalo ji jen 500 tisíc lidí. Vytváříme pak jakýsi funnel: video začalo, viditelná impresivita značky byla taková a taková a dokoukalo to určité množství lidí. Mezitím ještě počítáme minuty nebo sekundy, které uživatel strávil se značkou nebo s produktem, který klient chce sledovat. Přepočítáváme to třeba na standardních 30 sekund, aby si klienti mohli výsledky porovnat s klasickými formáty, které znají.

A ještě jedno kouzlo — pak vás už nechám klást otázky, promiňte. Když klienti nebo agentury chtějí, mohou nám nahrát svůj rozpočet na jednotlivého influencera. Tím si pak přepočítají návratnost investice založenou na kterékoli metrice, kterou jsem zmínil: viditelná impresivita, dokončená impresivita, čas strávený se značkou apod. To jim dává úplně jiný vhled do toho, jak se jejich značka prezentuje.

Tato práce má za cíl vyhodnocovat efektivitu různých kanálů. Nedávno jsme například analyzovali velkou kampaň jednoho klienta z léta. Šlo o analýzu ex post, ne v reálném čase. Největší influenceři měli k jednomu videu třeba 400 000 zhlédnutí, což podle původních metrik vypadalo velmi dobře. Ale když jsme se podívali detailně, zjistili jsme, že daný tvůrce začal značku zmiňovat až v druhé polovině videa a věnoval jí jen čtyři sekundy.

V původním klientském reportu to vypadalo, že byl tvůrce drahý, ale přinesl dvojnásobek impresí než ostatní. Po přepočtu na viditelnou impresi ale výkon výrazně klesl. Ukázalo se tedy, že spolupráce s tímto konkrétním tvůrcem byla velmi neefektivní.

Z mého pohledu, nebo jak to teď vnímám po tom, co jsme si řekli, kdybych byl tvůrce, možná bych primárně nedodával klientovi takový detailní reporting. Možná je lepší jít přímo přes značky, které pak dané informace poskytují tvůrcům.

Je to tak, že tvůrce, který si sám stáhne naši aplikaci, má úplnou kontrolu nad tím, jaký příspěvek označí a co klientovi pošle. Pokud ale nemá smlouvu přes agenturu nebo přímo s klientem, že musí náš nástroj používat, může si vybrat, jestli to využije nebo ne.

Pokud chcete, můžu pomoci i s dalšími úpravami nebo vysvětlením.

Tady je opravená verze textu:

Vygenerovat ten report, ale ten report má úplně základní metriky, které jsou vidět na tom screenshotu. Takže my těm tvůrcům šetříme čas tím, že nemusí dělat screenshoty a nemusí se k tomu zpětně vracet nebo to někde dohledávat na svém Instagramu. Mohou to jednoduše otagovat třeba po týdnu u nás a vygenerovat si ten report. Takže jim to šetří čas. Když to dělá klient, tak to má tvůrce zasmluvněné ve smlouvě. A to se normálně děje i v jiných nástrojích, akorát že značky prostě řeknou, že je to podmínkou spolupráce, ale tvůrci za to nedostávají nic navíc, žádnou přidanou hodnotu.

My, když jim to nabídneme, tak všechny influencery onboardujeme, což znamená, že s nimi máme call a procházíme s nimi, jak se mají přihlásit do aplikace, aby to bylo pod kontrolou. Feedback od nich je velmi dobrý. Říkají, že jsou zvyklí na to, že kampaň se musí měřit, ale že je cool, že jim my dáváme něco navíc. Ta aplikace jim neslouží jen k reportování spolupráce, klidně si tam můžou napojit i jiné svoje sítě, kde nic nereportují. Dáváme jim tam tipy a trendy. Například agregujeme na jedno místo asi 20 newsletterů, takže pokaždé, když se změní algoritmus na Instagramu, TikToku nebo jinde, my to za ně sledujeme a píšeme jim přehled, co se stalo. Takže tohle je „nice to have“ pro tvůrce, protože u velkých značek by nějaké trackování měli mít zasmluvněné.

Možná co vidím jako výzvu, je, že máte dvě cílové skupiny, dva typy uživatelů — jedna jsou značky, respektive agentury a ta část marketplace, co pracuje s influencery, a druhá jsou sami influenceři. A přitom máte jeden produkt s nějakým modulem, pravděpodobně webovým pro agentury. Když se vrátím zpět, spustili jste aplikaci někdy teď v květnu nebo červnu? V App Store lze aplikaci najít, stáhnout a začít napojovat svoje sítě, třeba jako Jirka Vycherek?

Ano, červen jsme vlastně dělali jako tichý launch, že se to někde napsalo, ale nedělali jsme žádnou větší kampaň. Kampaně na stažení aplikace jsme začali dělat až v polovině října, nedávno. Influenceri si ji začali stahovat a jak se do toho dostaly značky? Cítím, že váš fokus je spíš na modul a na značky. Můžete vysvětlit, jestli bude Karl Forsowl aplikace B2B2C nebo B2B2Influencer do budoucna, nebo jestli je stále vize, že to bude pro influencery a tvůrce, jen s tím, že se k nim dostanete přes komerční spolupráce?

V aplikaci pro B2C máme na začátku ten modul „collaboration“ se značkami. Pořád máme v hlavě, že chceme usnadnit reporting těch spoluprací, takže to není nic nového, že s firmami dělají spolupráce. A minimálně já pořád tlačím na to, abychom udrželi tu aplikaci...

Pokud chcete, mohu pokračovat v opravě nebo upravit celý text podle potřeby.

Tady je opravený text:

Byla pro ty tvůrce užitečná, jenom tak ji budou chtít používat. Takže přestože jsme teď trochu upozadili nebo oddálili vývoj paywallu a placených funkcí, mám pořád ambici, aby za to uživatel chtěl zaplatit. Když za to bude chtít zaplatit, je to jediná indikace, že je aplikace dobrá a že jim v něčem pomáhá. Proto z této myšlenky nechci ustoupit, protože věřím tomu, že ekosystém může fungovat jen takhle. Nebude to tak, že si tvůrce řekne: „Ok, další opruzný nástroj, kterým musím jako nutné zlo reportovat svoji spolupráci.“ Ale že řekne: „Super, tak reportuju spolupráci, ale nějakým příjemnějším způsobem.“

A tohle je teprve začátek. Samozřejmě se dá dělat víc. Teď musí tvůrci ručně klikat, že spolupráci mají, ale my tím, že dokážeme detekovat značky, hashtagy a podobně, jim časem prostě řekneme: „Hele, tady to asi byla spolupráce se značkou XY.“ Tvůrce bude mít stále kontrolu, zda potvrdí, že spolupráce byla, nebo nebyla. To už je jenom technikálie, ale naše mise je co nejvíce zjednodušit spolupráci a její reporting.

Upřímně řečeno jsem říkal minule, že tyto lidi nebaví zabývat se takovými věcmi navíc. Plus je zajímavé určení cílové skupiny – pokud jsem profesionální tvůrce, který se tím živí nebo to myslí vážně, například mám komerční spolupráce se značkami, což je hlavní zdroj příjmů influencerů, tak tam vidím dobré zacelení. Vaše primární cílová skupina tohle skutečně řeší.

Samozřejmě lepší influenceři mívají své vlastní produkty, které pak tlačí, což je úplně jiná disciplína, ale většinou to funguje tak, že se chceš dostat do možnosti mít spolupráce, začneš se tím živit a pak to rozjedeš dál.

Jedna z vizí je také dostat co nejvíce uživatelů do aplikace. Už teď běží kampaň na její stažení a protože jsme na začátku, fungujeme v režimu early adopters – aplikace je zatím zdarma, monetizační model ještě nemáme. Díky tomu, že uvidíme tvůrce, můžeme dělat lepší segmentaci a určit, pro které značky jsou vhodní. Nemusíme se tedy spoléhat jen na veřejně známé seznamy tvůrců. Teď agentury často mají své ověřené tvůrce – například 100 tvůrců – do kterých neustále investují a snaží se je uplatnit u různých značek.

My díky tomu, že budeme umět analyzovat spolupráce a obsah, umožníme lepší práci se segmentací tvůrců podle různých kategorií – makroinfluencer, mikroinfluencer, nanoinfluencer. Tvrdí se, a myslím, že je to pravda, že nejvíc funguje doporučení od skutečného kamaráda, což znamená, že když například na svém Instagramu napíšu, že jsem byl na dobrém glampingu, tak je pravděpodobné, že...

Pokud chcete, mohu i pokračovat v opravě další části textu.

Zde je opravený a upravený text, aby byl srozumitelnější a plynulejší:

Existuje větší důvěra v to, co říkají kamarádi, než když to řekne nějaký velký influencer. My proto můžeme, když dokážeme analyzovat obsah a značky, sestavit skupinu tvůrců jakékoliv velikosti a dáme je dohromady. Možná ses tedy ponořil do trhu a jeho vývoje. Proč je pro vás trh s influencery tak zajímavý? Jsi z mediálního domu, máte tam jeden produkt pro mediální domy a novináře, druhý pro influencery, a evidentně do toho influencerského segmentu hodně investujete. Pro někoho, kdo není z médií, proč je to tak atraktivní? Máš pocit, že značky do influencer marketingu dávají stále větší část svých rozpočtů?

Určitě, to je na delší diskuzi, ale primárně se to týká obsahu a posunu trhu směrem k němu. Má to několik úrovní. Za prvé, pocházíme z mediálního světa, kde trošku drhne business model – původního čtení tisku nahradil digitál. Není žádné tajemství, že mediální domy bojují s otázkou, zda by za obsah na internetu mělo být placeno, nebo jestli má být obsah zdarma, ale se zobrazenou reklamou. Tento model přestává fungovat. Všichni víme, že spousta novinářů odchází „na vlastní nohu“ – na sociální sítě nebo na platformy jako Hero Hero či Patron.

To znamená, že část našeho přechodu na sociální sítě byla přirozená, protože to je místo, kam uživatelé směřují svou konzumaci obsahu. Také víme, jak se mění způsob konzumace jednotlivých mediálních typů. Televize není na takovém útlumu – sleduje se stále podobně, nebo tak rychle neklesá. Nicméně mediální rozpočty velkých firem se začínají výrazně přesouvat do influencer marketingu. Některé firmy mají nyní výdaje na influencery srovnatelné s jejich investicemi do televize. Problém ale dlouho byl v neexistenci efektivního reportingu a měření těchto spoluprací – firmy musely obhajovat, že influencer marketing dává smysl, ale neměly metriku, kterou by mohly porovnat s televizními nebo klasickými online metrikami (např. PPC, bannery).

Pokud tomu správně rozumím, vaší misí nyní je udělat to, co jsi dříve dělal pro Kantar – tedy rozložit videoreklamy do detailů podle účinku v 30sekundových reklamních blocích – a to samé aplikovat, ale ve velkém rozsahu, na influencery a jejich příspěvky?

Ano, ale je tu ještě jeden zajímavý posun. V době Kantaru byly běžné 30- a 45sekundové reklamy, a pozornost diváků trvala desítky sekund. Pak se začalo mluvit o tzv. bumperech – nepřeskočitelných 5- nebo 6-sekundových reklamách. Klientům bylo řečeno, že musí hlavní sdělení vměstnat do těch několika sekund. A teď už se hovoří o 1,4 sekundách – což je doba, po kterou uživatelé scrollují po sociálních sítích. Prostě čas pohybu palcem po obrazovce.

Ano, v podstatě je to pohyb palce a mozek za tu dobu do...

Pokud chceš, mohu pomoci i s pokračováním nebo další úpravou textu.

Opravený text:

Káže udělat to rozhodnutí. To znamená, že v té úplně první chvíli – ať už je to náledový obrázek, první sekunda videa nebo první milisekunda videa – první, co rozpoznáte, je to, jestli znáte tu věc, toho člověka, nebo něco, co vám podvědomě připomene, že se na to chcete podívat. Pokud to není reklama s vyplývajícím zvukem, tak je to hudba. Hudba je velmi důležitá, protože ve vás vyvolává euforii. Známá hudba funguje lépe, neznámá hůř, ale stále lépe než žádná hudba. Pokud je tam neznámá hudba nebo žádná hudba, jste podvědomě rovnou zklamaní, aniž byste si to uvědomovali. Pak se v prvních 1,4 sekundách vytvoří nějaký předpoklad v hlavě, o čem video bude, a maximálně do 8. sekundy se to potvrdí. V tomhle čase se člověk rozhodne, zda se bude koukat dál nebo ne.

Takže ten rozdíl je v tom, že ano, snažíme se automatizovat to, co se dříve dělalo manuálně, ale asi pro televizní reklamy to pořád nějak platí. O tom nemám tolik informací, ale čas se koncentruje úplně do těch milisekund na začátku. To je skvělé. Vysvětluješ můj oblíbený trend, že filmové trailery mají na začátku teaser na samotný trailer – že 30vteřinové trailery na nové filmy mají první 3 vteřiny jako shrnutí toho 30vteřinového videa. Mě to opravdu zaujalo.

Ještě jedna věc – to, co vyprávíš, rád opakuji, protože jsem byl u předchozích dvou podcastů. Hrozně se mi líbilo, že spoustu těch věcí v těchto doporučeních máte algoritmicky, tedy pravidly. Tohle know-how, které hezky ukazuješ, nějakým způsobem propisujete do pravidel a doporučení v té aplikaci – protože máte větší zkušenosti, než jaké by vyplývaly jen z nějakého machine learningu na malém vzorku dat. V tomto předpokladu tedy pokračujete, protože máte hluboké znalosti mediálního trhu.

Ano, když se vrátím ke Kanteru, tak už při vyhodnocení reklamy se ručně zaznamenávalo, zda se tam objevil člověk, pes, hudba a jak rychlá byla hudba. Pak se ex post vyhodnocovalo, co co ovlivňuje. My to teď dokážeme automaticky díky všem modelům. V současnosti u videí i u fotek automaticky sledujeme zhruba 30 kategorií. To znamená, že u videa v podstatě každou sekundu sledujeme, co se tam dělo. Výhodou je, že to je multimodální – zároveň sledujeme, co se říká, jaká hraje hudba a co se zobrazuje – ať už je to přesně logo, nějaký objekt nebo prakticky cokoliv, co si klient nebo my sami nadefinujeme.

Co teď neděláme, ale chceme dělat, je dávat tvůrcům doporučení, co mají dělat anebo co funguje na konkrétním postu. Momentálně ještě nemáme tak propracovaný obsahový element. Tagy, které máme k těm videím, teprve vložíme do modelu. Ale princip je takový, že to pak zkřížíme s hrubými metrikami, vytvoříme regresní modely a řek... (text končí).

Tady je opravený text s úpravami pro lepší srozumitelnost a gramatiku:

Něco ve smyslu, že když dáš na úvodní obrázek kočičku, máš dvakrát větší pravděpodobnost, že na to uživatel klikne. Ale to, co si myslím, že je důležité z předchozích zkušeností, je, že ty základní věci se nikdy nemění. Kočička prostě vždycky funguje. Ale nevíme díky tomu, jaké kategorie máme sledovat. Není to náhodné, protože model může sednout na cokoliv. Takže je důležité si jasně nadefinovat kategorie. Klasicky jedeme reklamní věci, které fungovaly – například veselá hudba funguje lépe než pohřební hudba. To je asi jasné. Ale kategorie máme striktně dané podle toho reklamního modelu.

A ty kategorie myslíš věci jako logo, nějaký objekt, zvířátko? Jo, myslel jsem, že třeba sledujeme, jestli je tam člověk, jestli je sníh. A takhle to promptujeme – jedeme podle toho, jestli je člověk ano/ne, zvíře ano/ne, hudba ano/ne, barvy takové a takové, kontrast takový a takový. Takže to jsou kategorie, třeba reklama na wellness, reklama na food and beverage, tohle něco? Jsou to věci, co popisuju, těch 30 kategorií, které máme automaticky. Ty prostě trackujeme, protože z našich zkušeností dávají smysl a dávají smysl i v kontextu těch metrik, jak to funguje.

To, co říkáš, trackujeme pro klienty podle jejich požadavků. Obvykle mají tři požadavky. Za prvé chtějí sledovat zprávu, která byla doručená od značky. To je speech-to-text, hledáme, jestli se komunikovalo od značky tak, jak klient chtěl. Druhá věc jsou právě ty kategorie. Mě teď napadají konkrétní klienti, ale spíše se snažím vymyslet nějaké, které zatím nemáme.

Kdyby to byl třeba automobilový průmysl, tak sledujeme, jestli reklama pojednává o leasingu aut nebo o elektroautech – jaká je hlavní kategorie či podkategorie tématu. Některé klienty to zajímá. Nebo u beauty segmentu, který je obecnější, sledují, jestli jde o hair care, nail care, body care a podobně. To jsou také kategorie. Reklamy jako wellness, food and beverage ano, ale to už samozřejmě neanalyzujeme z videí, protože by to nedávalo smysl.

Když máme kategorie klienta, řekneme si, že je ještě detailně rozdělíme, protože například pro beauty segment jsou tyto podkategorie klíčové – takto totiž prodávají přes segmenty. Proto tam doppromptujeme ty kategorie.

Nebo ty brand kódy – každá značka má svůj brand kód, logo, barvu a nějaké objekty, třeba Coca-Cola má svoji lahev, Pilsner Urquell třeba půl litru. To také doplňujeme. Nesledujeme samozřejmě v každém videu třeba půl litr, protože to nedává smysl.

Jasně, takže je tam velká míra customizace a promptování na míru každé kampani a každému zákazníkovi. Není to ale úplně složité, protože to jsou pořád ty věci – brand kód, logo a tak dále. Teď nám klient ty brand kódy ještě píše do e-mailu, ale později je už vyplní přímo v platformě, kde jednoduše zadá, jaké jsou jeho brand kódy.

Pokud chceš, můžu text ještě více zjednodušit nebo rozčlenit na menší pasáže.

Tady je opravený a upravený text:

On tam například nahraje obrázky nebo logo konkrétní značky. Teď nám to prostě pošle a my to přidáme do promptu, ale ty prompty jsou už takto připravené, takže to není klasická kastomizace. Funguje to tak, že do promptu napíšeš něco jako „modrá barva, auto, přechod, sluníčko“ – takže si nepředstavuji, že tam přidáváme spoustu dalších dní nebo dalších parametrů. Je tam zpráva – řekneš například: „OK, sleduj tři hlavní vlastnosti značky – nejhezčí, nejkulatější, nejvulkánovitější.“ Hezky. Takže jak to vlastně funguje pod kapotou?

Minule jsme se bavili o tom, že nemáte tolik vlastních vývojářů, a že dodáváte převážně know-how – především datové know-how – ale samotný kód nebo základní část berete z komoditních řešení, která jsou volně dostupná. Jak se ta dostupná řešení posouvají, zlepšuje se i kvalita vašeho výstupu. Ty předpřipravené „krabičky“ skládáte dohromady tak, aby sloužily velmi konkrétním segmentům klientů. Můžeš nám tedy popsat, jak vypadá vaše infrastruktura a kde co běží?

Používáme primárně Google Cloud Platform (GCP) a celý ekosystém Google, což nám dlouhodobě nejvíc vyhovuje pro naše potřeby. Máme zkušenosti i s dalšími platformami, ale GCP podle nás poskytuje nejlepší multimodální modely a možnosti na trhu. To znamená, že v jednom modelu můžeme pracovat zároveň s různými typy dat, například se zvukem, obrazem a jazykem.

Původně jsme používali předdefinované machine learningové modely, ty „krabičky“, jak jsi říkal, například pro rozpoznávání značek (brand detection). U poslední verze, kterou znám, bylo předdefinováno až 100 000 značek/log, takže jsme v první fázi produktu využívali třeba jen jednoduchý příkaz: „Najdi Adidas“ – a systém našel všechna videa, kde se logo Adidas objevilo.

To nám ale přestalo stačit, protože i když 100 000 značek na první pohled zní hodně, jednalo se hlavně o globální značky. Na českém trhu tam chybělo spousta menších či lokálních značek. Proto jsme tento přístup opustili, abychom nemuseli dělat specifické úpravy. Pro velké značky používáme předdefinovaný model, pro menší si detekci vytváříme sami. Vše si píšeme a promptujeme sami.

Modely jsou už natolik chytré, že většina log obsahuje v sobě i textový název, takže když do promptu zadáme název značky, systém je dokáže najít. Navíc je možné nahrát i grafické logo – například když děláme kampaň pro klienta a on nám dodá osm značek, které chceme kontrolovat, tak zajistíme, aby byly ty značky detekované buď pomocí textu, nebo nahraného loga.

Používáme také předdefinované modely na Speech to Text, detekci objektů a podobně, ale jak jsem říkal, potřebujeme, aby vše fungovalo dohromady efektivně. Proto si vše programujeme sami, konkrétně kolega Kuba Šved. Je důležité mít pod kontrolou jednak to, zda to spolu jednotlivé části správně komunikují, a jednak je pro nás složité všechny ty předdefinované „krabičky“ plně integrovat, aby ...

Pokud potřebuješ, mohu pokračovat nebo upravit ještě víc.

Jasně, tady je opravený text s lepší srozumitelností a gramatikou:

Jedno 30sekundové video se v jeden moment skládalo do stejných sekund nebo milisekund, které my potřebujeme. Když se na to podívám, opravdu jsem velký influencer a Bára mě zaplatila, abych na svých sítích zpropagoval Clever Maps. Samozřejmě používám Karl for Social, nahraju super video o důležitosti mapových podkladů a v aplikaci ho označím, že to je právě Clever Maps.

Co se s tím děje potom? Vy tím pádem automaticky získáte přístup k mému účtu, stáhnete si video v nějakém raw formátu, tak, jak ho mám na síti. Můžeš mi prosím vysvětlit, co se pak děje s těmi daty?

Ano, důležité je říct, že ty máš pořád plnou kontrolu nad tím, jestli video vůbec nahraješ, když jsi tvůrce. To znamená, že ty musíš schválit, že toto video patří do spolupráce a může se sdílet. Žádný jiný obsah se nesdílí, funguje to právě takto.

Já jsem to video udělal kvůli Báře, takže chci, aby ho mohla použít a analyzovat. V tom případě ano – my to video pak vezmeme, máme povolení s ním pracovat v rámci smluvených podmínek a promítneme ho do všech potřebných modelů.

Video se stáhne do GCP, kde jeden model provede všechny tři akce. Stáhne se, je tam... to už nemá cenu dále rozebírat. My ale neukládáme všechny videa trvale v databázi – znamená to, že se video stáhne jen na dobu analýzy a potom se zase smaže. Video je tedy dokument, do kterého běžný uživatel nijak nezasahuje. Samozřejmě si ale uchováváme nějaké náhledové obrázky, které potřebujeme. Takže klíčové momenty – ne, myslím tyto thumbnaily, aby se uživatel v aplikaci dobře orientoval a aby celý report vypadal přehledně.

Já jsem si myslela, že když se budu chtít podívat na věci, které mi fungovaly nejvíc, že tam třeba najdu nějaké klíčové tikety.

Může to být, různé nástroje to mají různě. Moje zkušenost je taková, že to vypadá hezky, ale klienti to většinou moc nepoužívají. Jsou spíš na vysoké úrovni a jsou rádi za nějakou abstrakci, kterou si mohou snadno prohlédnout.

Ano, tak my třeba řekneme, že značka Clevermaps byla poprvé zobrazena ve třetí sekundě videa. V tu dobu to mělo tolik sledovaností, sdělení trvalo pět sekund a na konci této zprávy bylo další tolik sledovaností. Pak jsem o tom mluvil v třicáté vteřině, ale logo už tam nebylo, a na konci se logo objevilo a já o tom ještě mluvil.

My pak vše porovnáváme dohromady, protože jinak by to byl opravdu chaos, co říkáš? Primární cílem v případě loga je získat první impresi – tj. kdo alespoň jednou viděl dané sdělení, když to zjednoduším. Aspoň jednou tedy viděl logo a trvání jeho zobrazení.

Teď nevím, jestli to dokážu jednoduše vysvětlit na tabuli, ale když logo začne v momentu A a skončí v momentu B, my spočítáme každou časovou jednotku, kdy uživatel logo viděl. Pak, když logo pokračuje v bodu C až D, ten čas přičteme. Ale viditelná impresie se počítá z prvního momentu, kdy uživatel logo viděl.

Jasně, super. Výsledkem tedy je, že v GCP analyzujete video a získáte metriky, jako kolik lidí video vidělo, jak velká část diváků se zhlédnutím pokračovala a tak dále.

Pokud chceš, můžu ještě text upravit, aby byl stručnější nebo naopak víc rozvedený. Stačí říct.

de do nějakého zobrazení pro klienta nebo do té webové aplikace? Ano, tady malinká odbočka: poprvé v životě jsem v našem týmu viděl několik druhů lidí, jak se rozplývají nad jednou tabulkou. To myslím jakože Vojta Říha, náš data scientist, takový guru, který prostě leží celé dny v těch tabulkách a spojuje tam ty modely, seděl u počítače a nad ním stála Johanka, která má na starosti business strategii, sales a marketing, a oba se prostě rozplývali a skoro zářili nad tou jednou tabulkou. Johanka říkala: „Kluci, vy jste geniální,“ a Vojta se tetelil a říkal: „Ty jo, fakt skvělý.“ A přitom to byla prostě jedna tabulka, která ale obsahovala v datech videa každou sekundu, a k tý každé sekundě bylo přiřazené: „Teď začalo logo, teď tam je zobrazený psík, teď skončilo logo,“ a takhle to šlo dál. Tady ta strukturovaná tabulka se pak ano, dělá do reportu pro klienta. Teď to děláme tak, protože jsme na začátku vývoje tohoto produktu a požadavky klientů jsou různorodé, takže ty první reporty embedujeme z Power BI nebo jiného nástroje, abychom byli rychle schopní kustomizovat potřeby. Až se nám ustálí požadavky od co nejvíce klientů na základní reporting, tak to uděláme nativně a asi budeme mít pořád možnost přidat, embedovat tam nějaký custom report, který bude chtít mít někdo vlastní pohled, ale teď to děláme tak, abychom byli schopní v podstatě ze dne na den reagovat rychle. Výhledově velmi brzo to předěláme, aby jsme měli nativní svůj tool s vlastními grafy a ne embedovaným nástrojem třetí strany.

Mně se líbí, že tak, jak to popisuješ, vlastně ta magie, to co by před pěti lety bylo nejtěžší a hlavní IP celé firmy, máte na spuštění v tom GCP. Jak vás to ovlivňuje, co tam vlastně používáte za modely a jak se to vyvíjí? Děláte na tom už delší dobu?

Jo, potřeba je říct, že to určitě není na jeden klik, jakože to není tak, že si tam zapnete v GCP krabičku a vyplivne vám tu magickou tabulku, o které jsem mluvil. To jsou fakt desítky hodin práce a validování. Co používáme konkrétně za modely: pro videa používáme Gemini 1.5 — počkej, já mám tahák, protože to nepoužívám na denní bázi. Ne, přesněji je to Gemini Pro, a pro fotky používáme Gemini Flash, což jsou nejnovější verze těch modelů. Gemini Pro je sofistikovanější, protože video je složitější sledovat frame po framu, abychom zanalyzovali, co se kde objevuje, kdežto fotka je statická, takže tam stačí jednodušší, levnější model.

Když teď přijde nová verze modelu, co všechno musíte změnit? Nebo je to v tu chvíli jenom lepší, rychlejší, levnější?

Z pravidla to funguje tak, že je to lepší, rychlejší a levnější. Což teď není náš případ, ale před půl rokem bylo poměrně složité analyzovat třeba hodinu a půl dlouhé video. Představte si, že by se to mělo analyzovat frame po framu. Pak najednou existuje model, který...

Vlastně to funguje trochu jinak a analyzuje se to jako celek. V době, kdy jsem to naposledy sledoval, stálo například jedno video multimodálně zanalyzovat kolem 8 dolarů. Takže pak je otázka, jestli se to vyplatí, nebo ne. Ale chci říct, že se celý proces zjednodušil. Google přidal nový model, který je natrénovaný na dlouhá videa. V takovém případě ho použijeme a zefektivníme tím naši práci.

Co se týče kontroly promptů nebo rychlých změn, podle mě je to nekončící proces, alespoň v téhle době. Já osobně bych si netroufl spoléhat na to, že prompt analyzuje všechno správně. My dnes děláme to, že nějakých procent z výsledků kontrolujeme znovu - jako v dřívějších dobách streamů to prostě prohlédneme ručně, očima, jestli to sedí.

Zajímavé je, že můj kolega Kuba Švec mi říkal, že máme automatické validace, kdy model kontroluje model. Říkal jsem, že na fotky stačí jednodušší model – třeba Fleshe (pozn. dle kontextu). Zanalizujeme dvě stě příspěvků s fotkami pomocí Fleshe, ale 5–10 % z nich zpracujeme i pomocí lepšího modelu. Pak ověříme, jestli dávají shodné výsledky. Pokud ano, prohlásíme celý model za relevantní. To znamená, že máme modely na kontrolu modelů a navíc to ještě občas kontrolujeme ručně.

Takže většina té vaší práce, vlastně celá ta „chytristika“, která s tím stojí, je ve finále prompt engineering. Někteří kolegové by si možná mohli myslet, že to má menší hodnotu, ale já si myslím, že to je celý systém.

Například u konkrétních lidí to začíná u konkrétního byznys požadavku – vygenerování určitého pocitu. Přijde požadavek z byznysu, že chceme změřit efektivitu influencerské kampaně, zajímá nás message delivery a dosah influencerů. Pak odpovíme: „OK, máme raw data o metrikách – kolik bylo zhlédnutí, lajků, jaká byla křivka dosledování, teď musíme naroubovat obsahové věci.“

Je to tedy spolupráce celého týmu – byznysu a Kuby Švece, který dělá prompt engineering. Ten dostane zadání: „Potřebuji na téhle úrovni zmapovat ty tři zprávy.“ Pak se musí domluvit s Vojtou Říhou, který zajišťuje GCP nebo BigQuery – dohromady vytvoří finální tabulku, respektive jednu z tabulek, kterou teprve vyvalidujeme. Musí se dohodnout, jak na to všechno zobrazit, jak je správně propojit, aby to bylo efektivní i nákladově a co nejrychleji v čase.

Klientům pak dáváme tzv. near real-time reporty. Samozřejmě jsme omezení tím, že sociální sítě a jejich API někdy poskytují data s jednodenním nebo dvoudenním zpožděním, ale samotná analýza probíhá okamžitě, jak máme data dostupná.

Některé věci lze analyzovat předem. Teď nechci kolegům moc zasahovat, takže nevím přesně, jestli když se vypustí post, tak my… (text končí)

Tady je opravený text s lepší gramatikou, interpunkcí a stylizací:

Už jakoby zmapujeme ten obsah a potom teprve tam přilepíme ty tvrdé metriky, ale každopádně v prvním okamžiku, kdy to můžeme reportovat, tak to reportujeme klientům. Takže je to fakt spolupráce celého týmu. No, ale jak jsem mluvil o tom, kde je to IP, tak chápu, že na jedné straně v chápání byznysu, toho, co je důležité, a propsání do těch nástrojů, vy ale nefinetunujete ty modely, vy používáte to, co tam je, nebo je tam nějaký finetuning a nějaká datascience práce? Nebo typicky, když tam přidáváte nová loga, tak image recognition zase je nějaká krabička, která už tam běží a kterou k tomu přihodíte, ne?

My to přihodíme, ty krabičky, ten prompt píšeme fakt celý vlastní, abychom ho měli jako jeden prompt pod kontrolou, který odbavuje všechny ty věci. A aby nám neklesalo, že právě spoléháme na pozadí víc věcí dohromady. No a jak děláte image recognition?

Tým pádem, on už to rozpoznává v základu? No, ten multimodální model dokáže, když to napromptuješ – teď to řeknu jednoduše – najdi mi prostě modré logo týhle značky, tak ono ho najde. A řekni mi, v jaké sekundě je. Ale samozřejmě právě proto to jsou desítky hodin práce, protože to takhle nefunguje. Ty musíš napsat ten prompt tak, aby ti to udělalo strukturovanou tabulku. Aby se spojila práce těch datových vědců, kteří tam mají název videa, retenční křivku, sekundu a nějaké příznaky, ty je musíš napárovat na tu stejnou sekundu – na tyhle příznaky. Takže musíš, tady kolegy oblíbené slovo, operacionalizovat to, co tam budeš posílat. Proto třeba říkáš „kategorie člověk“ – tam je ano/ne. Takže v té sekundě víš ano/ne. Ale v těch finálních datech si taky neděláme to, aby nebylo špatně pochopené, že bychom měli v každém videu po sekundách všechno napsané. My v těch finálních datech vybereme jen relevantní části.

To znamená, že například opačný přístup máš u videa, kde najednou vidíš – a to už je, řekl bych, fine tuning nebo domodelování – že automaticky sledujeme v retenční křivce, kde je propad sledovanosti. Zaznamenáme automaticky, že je pod nějakou hladinou 10–20 %, což je neobvyklé. Řekneme, že tady ten propad se stal třeba v páté minutě, a jdeš zpátky a koukáš, co se dělo zhruba 130 sekund předtím. A tam zjistíme, že byl nějaký obsah. A ten obsah... Ne, bohoho, což... Nebo se tam dělají nějaké vložené reklamy – nemyslím klasickou reklamu, ale že tvůrce řekne: „A teď tady odpromu restauraci.“ Hodně lidí to přeskakuje samozřejmě. Takže my můžeme sledovat i tohle – že sice tam bylo mluveno o té značce, ale 20 % lidí v daný moment přetáhlo třeba na korovej obsah.

No a ještě druhá věc, řekněme toho fine tuningu, jsou regresní analýzy. To, co je sice relativně primitivní, ale to, že máš video ohodnocené hromadou obsahových příznaků, ti samo o sobě nedává žádnou informaci. Teď to stejně musíš domodelovat, co má jaký vliv na celkovou sledovanost, uděláš...

Pokud bys chtěl, mohu pokračovat v opravě zbytku textu.

Jasně, tady je opravený text:

Abychom mohli dělat regresní analýzu a zjistit, co má vliv na reach, co má vliv na monetizaci a tak dále. Takže s tím máš nekonečné množství možností, jak to zkoumat. Jak mám teda udělat tu reklamu pro Báru co nejlíp? Vycházejí z toho nějaké insighty? To obecné doporučení je vlastně poměrně jednoduché. Existuje možnost co nejdřív a co nejlépe „narvat“ značku do obsahu, ale samozřejmě existují i tvůrci, kteří to umí udělat přirozeně dobře. Když si vezmeme třeba Mikýře, který prostě — jak to říct — má jinou podobu reklamy, je to forma umění nebo specifický druh obsahu, který lidi baví. Tak to není prostě hloupá reklama, která jenom zastaví video a řekne „teď dělám reklamu na Clevermouse, mám komerční přestávku“, ale je to něco, co lidi baví. A pak je otázka, že sice asi neexistuje univerzální doporučení „dělej reklamu jako Mikýř“, ale jsou i tvůrci, kteří to třeba autenticky zvládnou udělat. Ti vytvoří scénku, všichni vědí, že je to reklama, ale zároveň tě obsah baví, sleduješ ho a víš, že je to přiznaná reklama, ale není hloupá nebo tupá. Je prostě autentická.

Představuju si to tak, že doporučení by mohla být třeba ve formě: mám tu nějakou kategorii, myslím tím kategorii obsahu, například business intelligence nástroje, a v kategorii reklamy pro business intelligence nástroje fungují věci A, B, C, D. Podle mě jsme daleko níž, jsme hodně závislí na lidské pozornosti. Když je reklama moc reklamní, když přijdu na video někoho, koho sleduju, a v momentě, kdy obsah přestává odpovídat tomu, proč jsem tam přišel, přeskakuju reklamu nebo odcházím. To už se nedá považovat za impresi pro značku, protože vlastně reklamu nikdo pořádně neviděl, i když platforma říká, že to vidělo hodně lidí.

Například v KANTARu se říká, že značka musí být v centru reklamy. Což znamená, že když byla třeba ta zakázaná reklama na Fidorku, kde šla holčička a bouchnula panenkou do auta, pak byl airbag a člověk, který jedl Fidorku, ji měl v ruce kvůli tomu airbagu — lidé si zapamatovali, že to je reklama na Fidorku. Stejně tak platí i u influencerů: produkt by měl být přirozenou součástí děje. Pak to funguje dobře. Například krém — když je to nějakým přirozeným způsobem zařazeno…

Bude denní hraní rutina? Ne, ale opravdu — pokud to není zásadní předěl, prostě pěst na oko, tak ten princip funguje vždycky. Otázka je, jak to správně dostat do promptu. To zjistíš právě analýzou, o které jsem mluvil. Když tam nemáš ten drop, kdy člověk mentálně pochopí, že tam je jen reklama a nechce ji vidět, tak je to podle mě dobré, minimálně datově — sleduje video dál, což je super.

A když se vrátíme k tomu prompt engineeringu — co jsou pro vás lessons learned? Ty jsi říkal, že je to nikdy nekončící práce… Cítím tam ten IP, že prompt se pořád zlepšuje a vy pořád přicházíte na nové možnosti.

Pokud chceš, můžu i text upravit, aby byl ještě formálnější nebo stručnější.

Jasně, tady je opravený text, aby byl srozumitelnější a plynulejší:

Co platí a neplatí je to, že to není nový kód, kterým řídíš ten model. Tak jaké věci tam vylepšujete, co jste opustili? Pokud má někdo z našich posluchačů teď podobnou úlohu, může muš s tím pomoci, aby se posunul o něco dál, trochu rychleji. Nevím, jestli tohle konkrétně urychlí proces, ale určitě je důležité nespoléhat na to, že modely to samy udělají vždycky dobře. Je dobré mít u jakéhokoliv promptu v chatu GPT jasnou představu o tom, co chcete docílit, a ne jen náhodně zkoušet různé varianty.

Já bych řekl, že je to vlastně neustálé ověřování hypotéz. Mám nějakou hypotézu, ověřím jí promptem a zjistím, jestli dává dobrý výsledek — ano, ne — a tím se učím. Ale musím vědět, co chci, a pak to pečlivě zkontrolovat. To je základ.

Když byl před dvěma lety začátek AI boomu, tak jsme se možná trochu báli, jestli jsme nevymysleli něco, co nás nakonec nahradí. Ale vůbec to tak nevidím. Teď to vidím spíš jako velkou symbiózu. Doporučuji lidem, aby pomocí AI dělali primárně věci, které umějí nebo uměli dřív dělat ručně, protože jen tak poznají, jestli výstupy dávají smysl.

Například když děláme nějakou naši studii a chceme napsat shrnutí kapitol, je důležité vědět, co je v těch kapitolách, abychom mohli posoudit, jestli shrnutí je relevantní. V takovém případě si můžu pomoct modely a ušetřit čas, ale pokud nemám doménovou znalost toho, co chci udělat, model za mě jednoduše nefunguje.

Další věc, která s tím souvisí, je kontrola — ať už automatická, nebo další lidská — aspoň v nějakém procentu na té škále. Protože nikdo by si asi nedovolil klientovi předložit report, kde je tvrzení, že nějaký tvůrce byl nejhorší, ale pak by řekli: „Ehm, to logo nám ten model zrovna nezkontroloval, tak se omlouváme.“ To není přijatelné.

Je to tedy spíš úspora času ve větším měřítku, protože nemusíme sledovat tisícovku videí, ale zároveň zde funguje statistická metoda — výběrový vzorek — který určuje, kolik musíme zkontrolovat, abychom si byli jistí platností výsledku.

Jak dlouhý prompt je teď? Jsou to třeba tři stránky? Nebo je to po úsecích? Nevím. Je to váš recept na Coca-Colu? Určitě má prompt několik verzí. Ty, které jsem viděl před třemi měsíci, měly minimálně jednu stránku A4. Nicméně celý ten model v rámci GCP, který není jenom ten prompt, ale celý systém, má třeba přes 7000 řádků kódu. Je to kombinace toho, jak mají části na sebe navazovat, jak se mají spojit data do retenční křivky, pak zavolat daný prompt, poskládat k sobě informace o brandu, objektu, převodu řeči na text, vyhodnocení sentimentu (pozitivní, negativní), a tak dále. To všechno dohromady teď zahrnuje třeba 7000 řádků.

Takže nevím, jestli existují lidé, kteří vytvořili byznys díky AI v oblasti, které vůbec nerozuměli, ale to bych spíš nedoporučoval.

Pokud chceš, můžu pokračovat, zdá se, že text uprostřed končí. Mám pokračovat od „Potřeba říct, že do t...“?

Opravený text:

O jednoho promptu nejde zase nasekat třeba sto věcí, které kontrolovat dohromady, protože ten prompt pak přestane fungovat. Už jsem se poučil, že to není tak, jak se dřív říkalo, že by to halucinovalo. To znamená, že to není tak, že by si ten prompt vymýšlel, ale spíš na něco zapomene, třeba na nějaké věci. Nebo třeba když chceme konkrétní příklad sledovat nějaké logo banky, tak ono pak dá jenom třeba „bank“ místo „Lifehazen Bank“ nebo „Moneta Money Bank“, tedy jenom jako část toho loga.

Teď máme vyzkoušené, že bezpečně funguje v této době třeba 30 automaticky sledovaných příznaků, jak na video, tak i na fotku. I tak tam ale děláme validace, jak jsem už říkal, že model kontroluje model, aby jsme si byli jistí, že to sedí.

Je to tedy maximální počet věcí, které tam sledujete? Nebo když potřebujete sledovat třeba 60 věcí, tak máte dva prompty a analyzujete to dvakrát?

V podstatě ano, ale na druhou stranu jsme teď v fázi, kdy budeme čím dál tím víc vyhodnocovat, které věci jsou relevantní. Přestože jsem říkal, že ten první balíček jsou věci, které přirozeně známe, že mají mít vliv – kočička, zvíře, jaké zvíře, člověk – tak stejně to potom předpokládám, že zkrátíme. Teď máme nějaký balíček, k tomu přidáváme custom požadavky klienta, ale časem třeba zjistíme, že ostrost fotky nehraje tak velkou roli, jak jsme si mysleli, takže to prostě zahodíme a zjednodušíme prompt tak, aby byl efektivní.

To je správný přístup – když si někdo něco jednou tam nechá, řekne ti všechno, takže je to jasné. To už známe.

Kdo teď tedy z brandů nebo klientů je u vás zazmluvněný, jaký typy máte v portfoliu? A předpokládám, že nemůžeš říkat konkrétní značky, ale typologicky koho řešíte a co u nich řešíte?

Teď řešíme typicky třeba vánoční kampaně klientů z různých oblastí, ať už je to mobilní operátor, beauty segment, nebo mléčné výrobky.

Mléčné výrobky na Vánoce? Nebo mobilní aplikace?

Ano, mobilní aplikace také řešíme. Vlastně nám je to jedno. Nevím, možná jsou dva typy klientů, které teď řešíme. Jedni jsou přímé značky – máme klienty, kteří jsou přímo zadavatelé značky, a pak máme agentury. U agentur to funguje tak, že si chtějí testovat a zkoušet s námi, vyberou si z deseti klientů jednoho a když se jim to bude líbit, pokračují dál na dalších kampaních.

To je super, zní to, jako že chcete z toho udělat produkt. Že to bude stand-alone, že když budu agentura v Polsku, tak si můžu koupit Carl for Social B2B verzi a nasadit si ji u svých klientů a jejich influencerů.

Ano, ne tak úplně. Máme nějaký balíčkovaný pricing, ale v tomto případě, kdyby agentura chtěla nasadit deset klientů a u každého třeba tři kampaně, tak k tomu přistupujeme individuálně – enterprise pricing. V tuto chvíli stále potřebujete nějaké onboarding a customizaci, aby to správně fungovalo.

No takhle to máme... Jednodušší…

Tady je opravený text:

To nazýváme jako small, medium a large balíček spolupráce, přičemž ten small má řešit jen ten základ, který jsem na začátku zmiňoval, a to je odstranění print screenů obsahových spoluprací. Ty print screeny dávaly jen základní metriky, takže to, co nám teď přijde úplně jednoduché, je fakt jen zobrazit imprese, views a ty metriky, které jsou tam vidět. To je balíček, který je v podstatě automatizovaný už teď. A bez toho, aby to bylo rozdělené do detailů, v tuto chvíli prostě odpadlo to… Ano, každý klient zpravidla nepožaduje takový detail, ale čím je větší klient, tím víc ho chce. Navíc v mnoha brífincích na sociální sítě nebo kampaně se jako cíl uvádí brand, ale u spousty, zejména menších klientů, se ve finále dozvíte, že jde vlastně o nějaké konverze. My samozřejmě můžeme sledovat, jaký vliv má brandové vzdělání na konverze, ale obsahová analýza podle mě dává spíše smysl větším značkám, které mají například influencerskou kampaň jako doplněk hlavní kampaně nebo televizní reklamy.

Komunikace nebo jiná komunikace, kde často zdůrazňují USP konkrétních produktů – například „kupte si toto kolo, protože má nejlepší brzdy na světě“ – obvykle už nechtějí, aby podobnou větu říkal influencer. Oni chtějí spíš, aby influencer například jel z kopce, takto zabrzdil a přežil. To je vlastně skrytá message té influencerské spolupráce, která funguje jako doplněk.

A tím se vracíme zpátky na začátek – u těch velkých balíčků vlastně plníte potřebu napříč kanály dát jednotnou metriku toho, jak to funguje. Určitě se hodí nějaké srovnání. Máme feedback, že i například v interních debatách jednoho většího klienta nebyli schopni se relevantně rozhodnout a porovnat výsledky mezi sebou – ať už digitál versus televize, nebo i v rámci digitálu influencer versus PPC kampaně, programatické nákupy a podobné formáty. U těch standardních reklamních formátů znají efektivitu a cenu, ale u influencerů to nevěděli. Teď ale mají jednu metriku, kterou si mohou porovnat.

Intuitivně – a nemám to na velkém vzorku, protože jde o jednotky klientů, tak prosím, nikdo se nenamáhejte to zobecňovat – jsme si mysleli, že influencerské spolupráce budou docela drahé, ale ukázalo se, že na vizibilní impresi ve skutečnosti nejsou drahé. Jsou srovnatelné s klasickými kampaněmi. Měl jsem spíš očekávání, že to bude drahé, ale není to tak. Samozřejmě záleží na tvůrci, že ano?

Ano, jako říkám, vzorek je malý, ale výsledky byly v podstatě stejné a myslel jsem, že tam bude větší rozdíl.

To je zajímavé, protože mám taky pocit, jak jsi mluvil o influencerech, že jim tím trochu ničíme hračky – oni reportují dva miliony zhlédnutí svého videa a vy jim to snížíte. Na druhou stranu však dáváte argument těm, kteří za ně bojují ve firmách a říkají „dávejme víc peněz influencerům“.

A navíc...

Pokud chcete, mohu pomoci i s dalším pokračováním textu.

My potom vrátíme do té aplikace doporučení ohledně té značky tomu konkrétnímu tvůrci. Řekneme třeba: tady v tom videu to nefungovalo tak dobře, tak jedno z nejjednodušších doporučení je zkus popošoupnout to sdělení o pár sekund dřív do příštího videa. Takže tam budeme zároveň i radit tomu tvůrci, jak má s tou značkou nebo s tou spoluprací nakládat. Já teda vůbec nevím, jestli jdeme proti influencerům. Ano, pokud nechceš být transparentní vůbec, tak asi jo, ale to bych řekl, že existuje v každém oboru. A hlavně v datech je nekonečná debata o tom, že někdo něco nechce reportovat, protože najednou přijde na to, že to nefunguje. Takže souhlasím s tím, že tady z té diskuze asi není úplně předmětem data tolik. Narážím na některé z posledních dílů, tam to cítím. Že někdy zavést jednotné metriky je problém, protože pak se ukáže... Je to tak, ale mě ještě zajímá vlastně z pohledu té značky granularita toho reportingu, protože by mi třeba dávalo smysl vidět rozpad, když třeba spolupracuju s influencery — já jako ta jedna značka — tak jestli dokážeš z toho potom třeba i do budoucna vytáhnout nějaký přehled přes kanály, to znamená přes ty tvůrce, kteří mi dlouhodobě dělají nejlepší impresi za nejlepší peníze. Určitě jo, je tam to srovnání, ať už klasicky nějaký žebříček typu, tenhle tvůrce doručil nejvíc minut třeba se značkou, nebo i podle ROI, třeba si tady seřaď, který byl nejdražší a nejlevnější na jednu viditelnou impresi a podobně. A plánujete potom i to, že když budu značka a budu hledat influencera na můj beauty produkt nebo něco takového, tak nějaký žebříček nejúspěšnějších tvůrců v tomto segmentu nebo něco takového? No, pak to říkali, že ti to poskládají na míru nejen z těch největších, ale ze všech. Ano, to bude, třeba ve druhém kvartálu. Přesně. Ne, teď dělám srandu, ale to, co reálně uvažujeme nebo uděláme, je Discovery Tool v nějaké podobě k tomu, protože asi 9 z 10 klientů, se kterými vlastně hovořili, ten Discovery Tool poptávají, ale budeme muset...

Nahnat influencery do platformy. To je problém marketplace, no, cold start.

No ne, dá se to udělat i jinak, třeba ta databáze. To je, ano, ultimátním cílem by bylo udělat databázi tvůrců, kteří používají tu aplikaci. Ale dá se udělat i to, že vlastně zeskrajpuješ obsah a zanalyzuješ, které profily jsou relevantní. Vytvoříš si tu databázi sama.

Ale to může být dobrý call to action pro ty influencery nebo tvůrce, aby se tam vůbec zaregistrovali, aby se tam...

Prý, když to uděláte, tak Bára bude nový klient. To nevím. Nebo budu influencer spíš.

Přesně, dejme tam Báru. Já mám jinou otázku. Mě bavilo to vaše startupové produktové přemýšlení. Teď jste zase blíž těm značkám, víc v tom B2Bčku, ve kterém jste historicky silní. Kolik vás teď toho děje, jak to prioritizujete, jaký je plán na příští rok? Jak se ti daří tohle řídit?

Já jsem měl takový skvělý call s...

Zde je opravený text s úpravami pro správnou češtinu, interpunkci a styl:

Člověkem, který se jmenuje Zdenko Zvada, protože jsem byl občas sám nervózní z toho, že nedokážu předpovídat dostatečně na dlouhé období budoucnost. On je jeden z největších expertů a konzultantů na SASové produkty. Říkal, že je v pořádku, že nevíme, co se bude dít přesně za dva měsíce.

To mě uklidnilo v tom, že ti neřeknu, co bude na konci příštího roku určitě, ale i to, že jsme se teď více zorientovali na ty značky. V původním byznysplánu na tento rok jsme měli myšlenku, že ji zvalidujeme. Původní byznysmodel a monetizace počítaly s tím, že nám budou platit ti tvůrci, kteří si stáhnou aplikaci, a základ aplikace bude vždy zadarmo. Některé sítě a pár kategorií trendů bude k dispozici zdarma. Když budeš chtít využívat více sítí, více trendů a podobně, bude se to platit. To byl původní model, ale samozřejmě rychlejší způsob monetizace pro nás bylo teď reportovat kampaně pro klienty.

Tím, že jsme to měli v hlavě od začátku, ale před rokem jsme to samozřejmě nedokázali přesně spočítat, evidenci jsme získali až nyní s těmi konkrétními zakázkami. Řešíme konkrétní problém, máme rozsáhlý (x-stránkový) market research, MBA studenti z Británie s námi dva měsíce pracovali na tomto výzkumu a go-to-market strategii. Takže máme jasně stanovené cenové hladiny a víme, že jsme na trhu správně, konkurenceschopní jak cenou, tak nabídkou.

Všichni jsme se proto zaměřili na to, aby teď víc fungoval B2B produkt, aby vše klapalo, a ano — některé funkce, které jsme chtěli do aplikace vylepšit, jsme upozadili a odložili o pár měsíců, například platby (payable) posunuli o 2–3 měsíce. Teď tedy aplikaci dáváme všem zadarmo.

Děláte to tedy vlastně agilně.

Ano, přesně tak.

Mně se to líbí, protože je to startupový přístup – hledáš trakci, jsi zamilovaný do problému, ne do řešení, což je základní poučka ze startup school.

Co je na tom skvělé, je to, že máme reporting o tom, co lidé v aplikaci dělají – jestli si ji stáhnou, jestli si napojí své sítě a podobně. Mně fungovalo, že když vidím, že si někdo aplikaci stáhl, ale nenapojil sítě, oslovuji ho zprávou: "Ahoj, jsem Jakub, CEO Carl.do.ta.company, koukám, že jste si stáhli naši aplikaci, ale možná ji nepoužíváte. Zajímal by mě váš upřímný názor, proč jste ji nevyužili." Odpovídá mi zhruba 10 % lidí, což považuji za docela dobrý výsledek, ačkoliv nemám jiný benchmark.

Tím chci říct, že kromě uživatelských testů nemáme mnoho možností validovat důvody, proč se to tak děje, než tyto přímé reakce a tvrdá data. Když máme obsahové spolupráce se značkami, které mají v kampaních třeba 20 influencerů, tak každého influencera individuálně ...

Pokud chcete, mohu pomoci i s dalším pokračováním nebo úpravou textu.

Tady je opravený text s lepší strukturou a gramatikou:

Onboardujeme a sledujeme ten proces, protože potřebujeme, aby to prostě fungovalo. V praxi se tam objevují různá zákoutí, které je třeba složitě napojit.

Například Instagram – protože patří do ekosystému Meta, propojuje se přes Facebook a uživatel musí mít business nebo creator účet na Instagramu. To je jedna věc, kterou mnoho uživatelů neví. Druhá věc je, že spousta uživatelů nevyužívá dvoufázové ověření. Když se snaží onboardovat do naší aplikace, často musí čekat třeba 10 minut, než jim přijde kód, pokud nemají nainstalovanou sekundární autentifikační aplikaci. To pro nás představuje peklo v B2C segmentu, protože jsme závislí na onboardingu třetí strany. Máme k dispozici vysvětlující videa jako Bejo Support, Help Centrum a podobně.

Když ale pracujeme přímo s velkým klientem nebo tvůrcem v rámci kampaně, všechno mu vysvětlíme osobně, sledujeme, co přesně dělá, a učíme se, jak produkt dál zlepšovat. To nám krásně navazuje na rady z Y Combinator Startup School, kde doporučují „do things that don’t scale“ – tedy na začátku být co nejblíže uživateli. To pomáhá pochopit, co skutečně potřebují, zda nevytváříš zbytečnosti, a sledovat, jak produkt používají, je nesmírně přínosné.

Tohle vidím jako velkou pomoc i u B2C škálovatelné globální aplikace. Ve Figma prototypu onboarding vypadá hladce – přihlášení na Facebook, klik-klik – testy vycházejí dobře. Ale v reálu je onboarding složitý. A ten business účet na Instagramu je opravdu těžký nástroj, můžu potvrdit. A i tak vydělávají.

Co se týče týmu a financí: je nás asi 15 lidí. Máme zkrácené úvazky a stáže, ale full-time je zhruba 15 lidí. Zhruba 5 vývojářů – včetně CTO, backendového a frontendového vývojáře. Pak máme tým DataSense, taktéž asi 5 lidí, a zbytek jsou další pozice.

Co se týče break-even: náš business model stojí na čtyřech pilířích. Jsou to dva produkty – Karlo4Media a Karlo4Social – a consulting, který dělíme na marketingový a technický. Marketingový a technický consulting a Karlo4Media by měly být příští rok přibližně na nule. Největší investice pak půjdou do Karlo4Social a Karlo4Social business, zhruba od poloviny příštího roku, tedy roku 2026.

Osobně už žiji teď v roce 2025, protože jsem dělal budget, takže pro mě je rok 2025 současnost a 2026 budoucnost. Ale je otázka, jak moc plánovat dopředu – Zdeněk z Vadaný říkal, že business plán moc smysl nedává, protože všechno se může za dva měsíce změnit.

Pokud jde o cenu za akvizici uživatele do B2C aplikace, pohybuje se mezi jedním a pěti dolary. Záleží na mnoha faktorech – cílení, kreativitě, kvalitě propozice a dalších věcech.

Chceš, abych ti pomohl s pokračováním, nebo je potřeba ještě něco upravit?

Text po opravě a stylistickém vylepšení:

To, jestli se podaří stlačit cenu na jeden dolar, nebo jestli budeme platit pět dolarů, je zásadní rozdíl v celém business plánu. Pak máš další konverzní poměry. Stáhnu si tu aplikaci, ale nepodaří se mi napojit síť, protože mi Meta nepošle ověřovací kód. Řeknu si: „OK, jsem influencer, tak na to nemám teď největší náladu, blbá aplikace neposlala ověřovací kód.“ A pak jedu dál v tom farnoutu a řeknu: „OK, teď jsme podle mě třeba na dvou dolarech za download, což je dobré, ale musím vyřešit, aby konverze do napojení sítě byla mnohem vyšší.“ Takže tým bude řešit, aby si lidi sítě napojili, protože z těch, co se pak konvertují do prémiových služeb, případně... No a tím pádem se mě ptáš na break even, ale Johy tomu říká „přepínátka milionů“ – v tom business plánu máš ty konverzní poměry a když řeknu: „OK, není to pět dolarů, ale jeden dolar, a konverze z tieru jedna na tier dva není 10 %, ale 20 %,“ tak máš přepínátka milionů. Break even je podle nás na konci příštího roku. Snažili jsme se být spíš konzervativní. Totéž platí u B2B. Tam máme napočítané, že máš nějaký objem, medium, large, churn rate, a jedeš. Je to další přepínátko. Vydrží s tebou klient na dva měsíce, na dvě kampaně, nebo ne? Máme taky vlastně měsíční předplatné.

Rozumím a jsem rád za odpověď, protože mi nešlo o konkrétní slib, ale spíš o to, jak uvažujete, když jste takhle rozkročení. Už nejste malá firma, pálíte peníze, a na druhou stranu jste chytili velmi zajímavý segment klientů, kterým to slouží perfektně. Co pro tebe, když žiješ v budoucnosti 2025, představuje zásadní věci, které se rozhodnou, hypotézy, které si ověříte, a na co se těšíš?

Zdá se, že hlavní síly napneme do té nohy, o které jsem mluvil celou dobu – Karel for Social Business – s ambicí, aby nám uživatelé za aplikaci platili. To je hlavní a největší investice a fokus týmu. Karel for Media – tam jsme dostali grant, díky kterému spolupracujeme s pěti zeměmi a pěti mediálními domy. Upřímně řečeno, a možná je to logické, lead time na uzavření zakázky je mnohem delší. Už tam máme platící klienty, ale ve srovnání s marketingovým světem to není překvapivé, protože zobchodovat mediální dům v nějaké krizi je výrazně náročnější než uzavřít influencerskou spolupráci. V projektu proto budeme pokračovat s partnery v rámci grantového režimu, který je postavený na digitalizaci a edukaci mediálního světa. Věříme, že překládáme data do lidské řeči pro mediální domy. Máme tam klienty, kterým to dobře slouží, ale pojedeme to spíš v grantovém režimu, protože pro nás není teď tak důležité „vyhrát“ byznys.

Pokud chcete, můžu text upravit ještě formálnější, nebo naopak neformálnější, případně rozdělit na odstavce dle potřeby.

Opravený text:

Chceme se opravdu věnovat tomu, aby jsme těm domům pomohli a ladili to tady, než aby jsme se snažili tam narvat fíčuru, která bude komerčně konverzní. Takže můžeme jet v lehčím vývojovém tempu. Pak máme konzulting, který na sebe nějak vydělává, jinak by nemělo smysl ho dávat. A ještě Karl for Social Business — máte teď české kampaně, nebo už jste evropský, už vás používají napříč? Máme české kampaně, ale u nejmenovaných klientů se jedná o mezinárodní firmy, které mají stovky influencerů po celém světě. Takže to byl takový proof of concept, který vypadá, že jsme zvládli, a s plánovaným rozpočtem na příští rok. Teď neměříme mezinárodní kampaně, abych odpověděl na tu otázku.

Čeká vás toho opravdu hodně. Hledáte třeba nějaké šikovné datové profesionály a podobně? Musím říct, že tým teď maká na 200 %. Máme hodně předčasů, hodně lidí si to přálo, takže jsem rád, že si to splnili. Před dvěma lety říkali, že chtějí žít startupový život, spát ve spacácích nebo na krabicích od pizzy. Teď sice ve spacácích nespíme, ale tlak je pořád velký, protože jsme zaměření na marketingové firmy a marketingové rozpočty, které se utrácejí během vánočních kampaní. Teď to vypadá trochu jako na Twitteru, když přišel Elon Musk — jsme trochu pod vodou, zvládáme to, ale lidi toho mají fakt hodně. To znamená, že nabíráme nebo budeme hledat v nejbližší době dvě role. Bude to Data Engineer se specializací na datové integrace, klasický stack jako Keboola, BigQuery, GCP obecně. A potom budeme hledat frontend developera, protože chceme víc šlápnout do webové aplikace pro B2B firmy. To už bude vyžadovat, aby to někdo spravoval, protože doposud jsme primárně vyvíjeli mobilní aplikaci nebo mobilní verzi, teď potřebujeme webovou.

Držíme palce, ať najdete správné startupově nadšené lidi, a moc děkujeme, že jste tady s námi.

Vyprávěl jste o tom, jak se vám v Karlově daří, co nového jste vymysleli, a držíme palce. Na shledanou. Děkujeme, že jste doposlouchali až sem, a díky také našim partnerům a členům Data Talk klubu. Těmi jsou:
Intex, Saska, Bystrýt, Colors of Data, Revolt BI, Good Data, Keboola, E-Mark, Karl Data Company, Data Mind, Notino, A Flo.

A pokud chcete zůstat v obraze, co se týče české datové scény a globálních datových technologií, nezapomeňte se registrovat k odběru našeho týdenního newsletteru na datatalk.cz.
Nechť vás provází data.

Podcast

Data Talk #116: Jakub Šiler (Carl Data Company)

Strojový přepis

Odebírejte Data Talk