Data Talk #20: Giuliano Giannetti (Revolt.bi) & Ivan Kutil (AppSatori)

Ve speciální epizodě uzavíráme rok 2022, abychom mohli vkročit do toho letošního! Giuliano Giannetti (Revolt.bi), Ivan Kutil (AppSatori) a Jiří Vicherek (agentura Fenek) diskutují události minulého roku, zejména dopady války na Ukrajině a technologický pokrok AI. Tématy jsou #generativeAI, #ChatGPT a #Midjourney, ale taky #Google, #AutoML nebo automatizace práce a hodnota člověka ve společnosti.

Strojový přepis

Dobrý den, jmenuji se Jirka Becherek a vítám vás u speciálního vánočního dílu DataTalku. Mám tady dva kamarády, hosty a technologické odborníky. Giuliano Gianetti, známý také jako GG, je můj první host. Ahoj, GGi. Ahoj, Jirko. Přivedl jsem sem také Ivana Kutila z Upsatory. Ahoj, Ivane. Ahoj, Jirko.

Tento díl bude speciální tím, že nemáme žádné konkrétní téma. Chtěli bychom se podívat a zamyslet se, usebrat myšlenky a analyzovat uplynulý rok, hlavně z pohledu datových technologií, ale i osobní a české datové scény.

Máme tady pár připravených témat. Začnu spíš osobněji. Jaký byl pro vás ten rok, když se podíváte do svého života? Jak osobně hodnotíte tento rok?

Pro mě byl tento rok velmi zajímavý. Především kvůli tomu, co se děje v oboru, ve kterém všichni podnikáme nebo pracujeme. Máme své firmy či aktivity a zajímají nás trendy, které mnoho odborníků věnujících se například umělé inteligenci předpovídalo s předstihem dvou až pěti let. A přesto tyto trendy nastaly už letos. Typicky například pokročilé modely na generování obrazu nebo různé aplikace kolem chat GPT-3, o kterých se budu ještě zmínit. Určitě generative AI je jedním z velkých témat dneška.

Spíše mě zajímá, co se vám letos přihodilo. Ivane, byl pro tebe a tvůj svět tento rok skutečně ve znamení těchto významných technologických změn? Co vaše firma?

Letos se nám podařilo stát se Google Premier partnerem, což mě velmi těší. U Google je celosvětově asi deset tisíc partnerů, ale skutečně aktivních s Googlem je jen několik tisíc. Nám se povedlo dostat mezi tuto úzkou skupinu firem, které se specializují na prodej a konzultace kolem Google Cloudu. To mě opravdu těší.

Byla to věc, na které jste pracovali několik let, nebo je to zásadní moment, co vám tato pozice otevírá?

Pomůže nám to získávat lepší podporu od Google a mít přístup k novinkám, které Google plánuje představit v příštích dvou až třech letech. Je to takový náhled do roadmapy, budoucího vývoje. Aby se firma stala partnerem, musí splnit určitá kritéria, na kterých jsme pracovali v předchozích letech. Je to tedy splnění dosavadních výsledků a aktivit.

Vy také máte nějaké nové certifikace? Viděl jsem je na LinkedInu, GG.

My máme také. Dnes jsme vlastně na jedné lodi, protože i my jsme se letos stali partnery Googlu. Byl to běh na dlouhou trať. Zatím nejsme premier partneři a asi ještě chvíli nebudeme, ale začínáme. Navíc pocházíme trochu z jiné oblasti – chceme se více věnovat implementaci datových technologií, zejména BigQuery a AI modelům. Upsatory vnímám spíše z pohledu infrastruktury, takže věřím, že se na tomto poli hezky doplňujeme.

Pro mě byl tento rok hodně organizační. Potřebovali jsme udělat reflexi toho, jak fungujeme ve firmě. Protože nám přišli opravdu velcí klienti, museli jsme nastavit procesy. Pro mě to tedy bylo spíše o budování managementu a škálování byznysu.

Jak dlouho je Revolt BI na trhu? Ať si to dokážu představit.

Jsme na trhu pět let. Právě jsme letos slavili „dospělé narozeniny“, což byla příjemná událost. Očekáváme, že do konce roku dosáhneme obratu přibližně 55 milionů korun, což je v naší rodině konzultačních firem téměř standard. Výjimkou je DataSentix, kteří jsou už hodně daleko, ale ten příběh bychom si nechali na jindy.

Co pro vás byly největší momenty letošního roku? Ty jsi, Ivane, říkal, že novinky v generativní AI, například chat GPT a OpenGPT, byly významné?

Asi každého ovlivnila válka na Ukrajině. Nechci se příliš pouštět do podrobností, protože to slyšíme z mnoha stran, ale určitě je to událost, která nás zasáhla. Ukázalo nám to, že ani ta nejlepší umělá inteligence nebo nejlepší data nedokážou na krátkou dobu spolehlivě predikovat, co přijde příští rok. Hospodářské noviny každoročně vydávají ročenky o tom, co by se mohlo stát v příštích letech, ale nevidíme přesné předpovědi.

Podobně, jako jsme nepředpověděli pandemii covidu, i když mnoho odborníků, třeba Václav Smydr, ji dlouhodobě předpokládal díky globalizaci a historickým trendům. Něco takového lze očekávat z dlouhodobějšího hlediska, ale na krátký horizont je příliš mnoho neznámých.

Tato situace nám ukázala, že i s nejlepšími algoritmy a týmy musíme být připraveni na tzv. černé labutě, nečekané události.

Když jsem pracoval ještě v obraně, často jsem se díval na strategické materiály Spojených států, které jsou veřejně dostupné. Už tam jasně vyplývalo, že do roku 2030 vypukne velký konflikt. Čekalo se, že to bude Čína, ale realita překvapila. A i když člověk tyto věci ví, nikdy na ně není plně připraven.

Ukrajina byla osobním momentem pro nás všechny. Měli jsme tam zaměstnance, kteří měli příbuzné, rodiny nebo dokonce utrpěli ztráty. Máme i Rusy v týmu, pro které to bylo velmi těžké, protože se i oni někdy dostali do podezření, ačkoliv za to nemohli.

Pro mě to byl také zajímavý okamžik z profesního hlediska. Válka ukázala, kdo inovuje a kdo ne. Ukrajina dokázala vydržet proti přesile standardní armády díky rychlé adoptaci technických inovací. Věci, o kterých jsme dlouho mluvili, se najednou objevily v praxi.

Například aplikace podobné Uberu, které pomáhají vybrat nejlepší trasu pro dopravu dělostřelectva k cíli. Viděli jsme to celé v praxi a výsledek je strategicky významný i pro země velikosti Ruska a Ukrajiny.

Při té aplikaci Uberu – tedy jak algoritmicky chytře řešit dopravu, logistiku zbraňových systémů tak, aby byly co nejefektivnější?

Mám to z druhé ruky, takže nechci tvrdit fakta na sto procent, ale dává to smysl. Stejný algoritmus, který používáme k tomu, aby auto dorazilo co nejrychleji k pasažérovi, je aplikovatelný i na dopravu artilerie nebo protiletadlových systémů.

Tento přístup se v armádě používá delší dobu, ale jeho uplatnění v řízení pozemního vojska je poměrně novinkou.

Upřímně, pro mě se ten „break“ v technologiích stáhl dál. Byl jsem v létě na dovolené v Norsku, když přišel fenomén MidJourney. Myslím, že to byl ten okamžik, kdy jsme si uvědomili, že tyto technologie nejsou jen hračky.

Dříve šlo o technologické hračky, které bylo možné šťastně ignorovat, protože neměly vliv na byznys, kterému se věnujeme. Ale pak přišel první „wow“ okamžik, kdy jsme zjistili, že už nepotřebujeme jednoduché napodobeniny grafiky, které nemají vysokou hodnotu.

Pro nás to byla příjemná krátkodobá změna, ale v uměleckém světě je to problém, protože mnoho lidí to zasáhlo a vedlo k rozsáhlým diskuzím.

Až v září, kdy vyšel ChatGPT, jsme si uvědomili, že umělá inteligence je tu a zůstane tu s námi. Myslím, že teď všichni lidé, kteří pracují s technologiemi a mají k tomu byznys, přemýšlejí, jak to ovlivní jejich práci a jaké příležitosti to přinese.

Pro mě je to téma, nad kterým hodně přemýšlím, protože trávím mnoho času studiem sci-fi, budoucnosti, trendů, virtuální reality a metaverza.

Ale v případě umělé inteligence mi nepřijde, že jde o obrovský technologický skok. Spíše mě překvapilo nadšení a totální změna v sentimentu veřejnosti.

Co jsi cítil ty, když jsi poprvé viděl ChatGPT?

Nebo nyní, po více než měsíci, co se reálně v Revolt BI změnilo? Připravujete nové produkty a skutečně na nich pracujete? Nebo u některých klientů, u kterých jste dělali práci, najednou říkáte, že tohle bude zastaralé za rok a počkáme, než to nově nahradí komunita?

Jaký byl skutečný dopad na tvůj byznys a svět? (Protože já v tom zatím vidím jenom velký rozruch.)

Každá inovace začíná halem. Myslím, že se teď všichni učíme najít místa, kde je AI skutečně použitelná.

První věc, která mě napadá, je, že věci, co ChatGPT dělá, jsem už částečně dělal kolem roku 2017 – modely, které extrahovaly témata nebo sentiment. To všechno jsem znal.

Co je ale radikálně nové, je použitelnost – tedy existence chatovacího rozhraní, kde si mohu povídat s inteligencí a dostávám smysluplné odpovědi. To přesvědčilo veřejnost.

Zajímá mě, jak to využít v praxi. V momentě, kdy jsem to zkoušel, jsem pochopil jeho hodnotu.

Člověk je nejdříve skeptický, ale pak přijde „wow“ moment.

Například když jsme chtěli oznámit partnerství s Googlem, požádal jsem šikovnou asistentku ve firmě, aby napsala tiskovou zprávu. Neměla však zkušenost, co tisková zpráva obnáší, neznala Google a celý den se tomu věnovala, ale výsledek nebyl optimální.

Já jsem si sedl k ChatGPT a napsal prompt: „Napiš tiskovou zprávu, že dnešního dne se Revolt BI stal partnerem Google, přidej informace o Google Cloudu.“ Výsledek byl publikovatelný.

To považuji za ukázku hodnoty AI – i když nemusí být faktograficky perfektní, díky obrovskému množství dat zná, k čemu Google je užitečný, což asistentka nemohla vědět.

Znala alespoň formát tiskové zprávy a dokonce vytvořila citace za mě.

Takže místo tréninku člověka mi stačilo upravit pár řádek v rozhraní a měl jsem použitelný text.

Testoval jsem AI i jinde, například u právníků. Ukázal jsem jim, že umí psát právní smlouvy, i jednoduché mezinárodní prodejní smlouvy, a zvládá to dobře.

Existují skupiny lidí, kteří budou v některých činnostech horší než AI.

Já rozděluji úkoly do čtyř skupin.

První skupina úkolů, které AI nahradí hned, jsou úkoly, kde člověk musí znít rozumně, ale není způsob, jak si informaci ověřit. Myslím, že už nikdy nikdo nenapíše horoskop ručně.

Tuhle skupinu řadím například i kódování – už teď ChatGPT umí napsat jednoduché skripty. Samozřejmě se najdou chyby, ale jelikož je trénován i na datech z GitHubu, výkon se bude zlepšovat. Myslím, že už nikdy nepotřebujeme někoho, kdo napíše front-end stránku nebo něco jednoduše ověřitelného.

Třetí skupina jsou úkoly, kde je třeba kontrola nebo odborné hledisko, ale není nutné, aby text psal člověk sám. Typicky jednoduché právní dokumenty, kde odborník přezkoumá, jestli je to správné.

Zajímavé je, že v této oblasti už nebudeme platit lidem za provedení práce, ale za její pochopení, což má své implikace.

Čtvrtá skupina úkolů jsou projevy vůle, například definování strategie, plánování kroků nebo postupů s konkrétním dopadem.

Vyzkoušel jsem v ChatGPT zadat úkol „vytvoř marketingovou strategii pro mou firmu.“ Sám ji nevyrobí, ale vypíše kroky, které logicky dávají smysl. Porovnám-li to s člověkem bez zkušeností, získá tak kuchařku, se kterou může pracovat a postupovat strukturovaně, což je užitečné.

Jak to vidíš ty, Ivane?

Zajímavé je, že tyto dvě věci, generování obrázků a chat GPT, přišly ve velmi krátkém intervalu, maximálně za dva měsíce, což ukazuje rychlost akcelerace technologií.

U generované grafiky, například MidJourney nebo Stable Diffusion, mě vždy fascinovalo, že tři roky zpátky generovávaly obrázek velikosti ikony, třeba na sociální sítě. Obličej, který nikdy neexistoval, byl vygenerován. Postupem času se zvětšovala velikost a kvalita těchto obrázků.

Predikoval jsem, že větší a kvalitnější obrázky přijdou za dva až tři roky, ale letos mě překvapilo, že jsou tady již teď a v takové kvalitě.

To, co způsobilo velký boom, byl fakt, že se AI obrázky staly uchopitelným tématem pro lidi, kteří se dříve umělé inteligenci nevěnovali.

Dostali se k technologii přes běžná média nebo viděli příležitost vyzkoušet si ji sami.

Tomu hodně pomohla demokratizace AI a ML modelů – sdílené notebooky, jako je DeepNote (vidím, že ho používáš i ty), nebo Google Colab, kde si uživatel může vytvořit nový dokument nebo klon existujícího, který je připravený.

Stačí říct, jaká jsou vstupní data, a můžeš si natrénovat svůj model.

Pokud jsi malý nebo střední tvůrce, třeba podcaster či vydáváš knihu a potřebuješ si vytvořit obálku, nemusíš platit služby navenek, můžeš to zkusit sám nebo s týmem vytvořit třeba dva či tři promptů a pochopit, jak to funguje.

[Text končí zde.]

To vlastně funguje, protože když se doptáváš, jak to má generovat, musíš znát tu logiku, jak se správně zeptat. Už vznikají brožurky, vznikají návrhy, jestli do budoucna nebude profese typu prompt engineer – člověk, který rozumí, jak to vlastně z té lidské řeči zadat do řeči počítače, aby to vygenerovalo tak, jak je očekávaný ten výsledek.

Tohle je zajímavé, protože konečně je nástroj, který dali lidem, a kdokoliv ho může použít. Samozřejmě to může i zneužít. U chat GPT pro mě byl první model wow, když to fungovalo v češtině, protože dosud v naší malé kotlině, když vznikl nějaký pokročilý model strojového učení, vždycky jsme si říkali: „Jo, to by bylo fajn, kdyby to bylo i tady.“ Ale reálně ty modely tu v českém jazyce nebyly, protože to nebyl zajímavý trh.

Chat GPT ale udělal to, že si lidé konečně můžou ptát v češtině a ono na to v češtině odpovídá. A to byl myslím ten wow moment, který možná u nás byl mnohem větší než v Americe, kde jsou na takovéhle modely zvyklí. Když tam zavoláš na nějakou linku nebo se ptáš přes nějaký chat, chat tam odpovídá a je to už nějaký automatizovaný robot. My tady nejsme na to zvyklí, a proto to je pro nás v České republice tak velký skok.

Ty jsi taky ptal, jak to chceme implementovat u nás ve firmě. Samozřejmě nějaké nápady máme. Mně například přijde hodně užitečný obecný onboarding. Člověk přijde do firmy a musí zjistit, jaké máme interní postupy. Normálně by to hledal v nějaké dokumentaci. A to, co člověk při vstupu neví, je, že neví, co neví. Teď se ale může zeptat, jak udělat dashboard, nebo jak vykazovat hodiny například. To jsou jednoduché oblasti.

Ale tohle nikdy nepostavíš na model, protože na něj nemáš dost dat. Tvoje firma a vaše postupy jsou jiné než u někoho jiného, třeba jak se staví dashboardy v BI. Dashboardy můžou být komplikované, nevím. Ale například jak vyfakturovat hodiny nebo jak postupovat, to se dá naučit celkem jednoduše. Buď se tam dají natrénovat otázky a odpovědi, ale to je ta alogritma – víš, že při úzkém rozsahu by bylo super, kdyby tato inteligence zpracovala základní informace, třeba otvírací dobu. A ve vašem případě ty musíš pravidla stanovit, říct: „Takto děláme dashboardy,“ protože to model nemá odkud brát.

Jakmile uděláš jednu příručku, budeš mít zdroj, ze kterého model čerpá a na co se můžeš ptát. Vy ale nemáte onboardingovou příručku o 200 stránkách, kterou by model mohl čerpat. A to jsou podle mě právě ty komerční věci, na kterých tyto modely budou fungovat. Generické informace jsou dostupné, ale chceš-li něco pro svou firmu, musíš to zaplatit.

Jde tedy o to, jestli se ti vyplatí natrénovat model tak, aby měl někdo, kdo přijde do firmy, „buddyho“, kterého se může zeptat, nebo jestli raději zaplatíš, že ten standard bude učit někdo z lidí, kteří mohou odejít a budou to učit každého nováčka. Já tady vidím velký potenciál v automatizaci.

Nevidím teď nic nového, co by chat GPT přinesl, protože ta práce je spíš dát dohromady ten rozhraní, ten interface. To, co je nové, je vyhledávání. Představ si, že přijdeš do firmy a vůbec nevíš, jak tam co chodí. Téma adopce těchto věcí bude důležité. Co uděláš? Zeptáš se někoho, půjdeš na školení, z něhož něco zapomeneš a nevíš, co nevíš. A můžeš se jednoduše zeptat chat GPT: „Co mám dělat, když mám nového klienta?“

Mělo by ti odpovědět, že musíš založit v nástroji nějaký projekt, nastavit rozpočet, definovat rozsah a jít za kolegy, kteří ti dají podrobnosti. To zvládne velmi snadno a je to otázka pár hodin, aby se to natrénovalo.

Je to ale hlavně o dokumentaci. Jak do modelu dostaneš informaci, že se má ptát Františky, protože ona vede náš klientský servis? Můžeš do modelu nahrát organizační strukturu, nebo ho to naučit na základě konverzací. Mužeš natrénovat, co má odpovídat. Umí to i sám, protože si poradí s variacemi.

Teď studuju dokumentaci a příklad je takový, že vytáhneš články z Wikipedie, nahráš je do systému a on se naučí odpovídat na otázky z nich podle toho, co je v článcích. Sumarizace zvládá dobře. To je úkol, který zvládá motivně.

A pokud mám záznamy z porad, třeba z posledních tří let, a zeptám se na nejčastější témata kolem cashflow, která se řešila, na tuto úlohu to použiju. Základ je ale mít digitalizované a nějak zpracované všechny záznamy z porad.

U tvého onboardingu jsem neviděl, že by ty procesy byly zpracované. Často totiž nejsou – jsou živelně tvořené, nemají pořádnou strukturu, vyhledávání v dokumentaci je obtížné, ani nevíš, jestli něco v dokumentaci je nebo není. Proto ta dokumentace není často první místo, kam jít, protože očekáváš, že tam to nenajdeš.

Teď můžeš jít na firemní Slack, použít tam robota na chat GPT a zeptat se: „Helen, jak mám vystavit fakturu?“ A dostaneš odpověď: „Nevím, běž se zeptat tady,“ nebo „Uděláš krok 1, 2, 3 a tady máš odkaz na dokumentaci,“ a tím ušetříš hodně času.

To mě vede k otázce adopce těchto technologií. Proč je lidi nepoužívají? Protože nečekají, že to bude opravdu užitečné. A to přivádí k procesu, kdy ta loňská vlna selhala. Revoluce není v tom, že existuje chatový model, ty tu byly dříve, Ginny už na českém trhu dělá chatboty a možná také modely na porozumění a generování textu.

Proč je ale nepoužíváš? Protože nevíš, jestli jsou užitečné, máš velké překážky – nutnost domluvit se s firmou, projektem, PoC, což trvá měsíce. Teď jdeš do chatu, napíšeš „Generuj horoskop“ a on ti ho vygeneruje. Řekneš „Napiš to v rýmech,“ nebo „Napiš jich dvanáct, aby každý byl trochu jiný,“ a máš celý článek do rubriky.

To je rozdíl. Použitelnost je tedy naprosto zásadní, protože ty věci se dají reálně používat a může je používat každý.

Jireno, jak to vidíš ty?
Já vidím, že před třemi lety byl velký boom s chatboty. Každý chtěl chatboty vyvíjet, ale pak přišlo vystřízlivění, protože nesplnily očekávání. Lidi neuměli správně chatbot při dotazech používat a chatboti neuměli odpovědět. Bylo to způsobeno tím, že modely nebyly dostatečně velké, technologie pro český jazyk také ne. V angličtině to bylo jiné.

Proto se používaly rozhodovací stromy, kdy chatbot uživateli nabízí nápovědy, na co se může ptát, například tlačítka. Uživatel raději kliknul na nápovědu, protože kdyby se ptal „jak chce“, chatbot to nemusel pochopit a nevrátil by uživateli žádnou hodnotu. To vedlo k nespokojenosti.

Nové modely by mohly toto řešit, vyplnit to rozčarování z předchozích chatbotů.

Navíc velké platformy jako Amazon a Google zjistily, že jejich asistenti nesplňují očekávání. Amazon oznámil několikamiliardovou ztrátu za Alexu, Google osekává funkce Google asistenta. Předpokládalo se, že lidé budou asistenty využívat častěji, ale ve skutečnosti se ptají pořád na stejné věci.

Mluvím z vlastní zkušenosti – mám doma Google Nest (dříve Google Home). Přestože mám přístup k encyklopedii vědění, ptám se pořád na stejné věci: jaké je počasí, nastavit časovač, přehrát hudbu. Moje nejoblíbenější funkce je najít telefon – protože ho často ztratím, tak Google Nest zazvoní a telefon najdu.

Tyto čtyři funkce používá většina lidí. Už to není o tom, jako v reklamě: „Potřebuji toaletní papír, řeknu to Amazonu.“ Lidi to takto nepoužívají, proto bylo zklamání. Ale chat GPT to může nakopnout a konečně možná jsme tam, kde jsme chtěli být.

Velké modely s mnoha parametry nyní umí pochopit, na co se uživatel ptá, a poskytnout relevantní odpověď. Na to se těším.

Siri například používám jako stopky, abych nepřelouhoval čaj. To je moje nejčastější funkce Siri. Na druhou stranu jsem prošel situace…

Možná proto mám tam trochu pachuť na jazyku, protože chatovací forma není úplně použitelná. V botech potřebujete přesnou odpověď. Použití je hlavně pro zákaznický servis. Tam nejde o to, jestli odpověď bude v básničce, ale jestli je pravdivá, třeba jestli balík je opravdu tam, kde má být.

Trh tedy prošel vystřízlivěním z chatbotů, ale možná nastane jejich renesance. Vidím tam šanci.

Model OpenGPT nebo GPT-3 v tomto použití prozatím nepomůže. Interface a forma jsou to, co dělá rozdíl – jednoduchost použití, přístupnost přes gmailový login umožňuje kolegům hned začít.

To samé s Midjourney. Pamatujete Petru Ludwiga a výstavu Midjourney nebo generativní AI obrázků? Bude tu velká výstava v artovém světě. Zatím ale trh s uměním nezměnila natolik, jako trh s obsahem, což už se mění – například platformy pro blogování.

Když se ale dívám na budoucnost, zejména v médiích, vidím, že se generuje obrovské množství obsahu. Digitální stopa roste rychleji než počet lidí, kteří jej čtou, což snižuje jeho význam.

To je důvod, proč už nebudou nové Beatles – protože bude 12 milionů kapel pro různé skupiny a nebude jedna televize, není proto jedna megakapela pro všechny.

Tento trend už vidím i v obsahu. Hodnota obsahu klesá, protože je přemíra „balastu“. To povede k lepší kvalitě „balastu“, ale zároveň bude obsah moc.

Možná tu bude potřeba „štítek“ – třeba aby člověk mohl říct: „Přečetl jsem, že to měl human touch.“

Právě to může být trend. Beatles byly populární, protože byly jedna kapela pro celý svět. S rozšířením médií jako kazety bylo 10 kapel, na CDčka 100 kapel, na sociální sítě tisíce.

Dnes na TikToku může zpívat kdokoliv a v budoucnu může být osm miliard kapel pro celý svět – každá personalizovaná na základě vkusu posluchače. Pokud jsi třeba historicky poslouchal Beatles, obsah bude trošku podobný.

Bude to nekonečný přísun personalizovaného obsahu jen pro tebe. A to, za co se dříve platilo, třeba za hudbu, se možná zcela změní a bude to zdarma.

Budeš mít personalizovanou hudbu a obsah šitý přímo tobě.

Problém jsou obecně distribuční a obchodní modely těchto věcí.

Například já vím, že existuje Copilot a občas píšu kód, ale nikdy jsem to nepoužil. Proč? Protože vyžaduje snahu – najít, nainstalovat, použít.

Je to malá snaha, ale když mám něco udělat a mám udělat úsilí, abych otevřel konzoli chat GPT, nebo se zeptal člověka stojícího přede mnou, tak se raději zeptám toho člověka.

Myslím, že úspěch těchto technologií závisí na tom, jak se integrují do nástrojů, které lidé už používají a umí používat.

Například o Midjourney, Ludvík udělal výstavu, ale já na ni nešel – vyžadovala snahu. Proč nepoužívám teď?

Jít na Discord nebo psát do nějakého chatu vyžaduje úsilí.

Ale představ si, že příště budu dělat prezentaci a na základě mého textu mi automaticky nabídne pět návrhů obrázků generovaných tímto skriptem. Stačí kliknout „ Přidat jako ilustraci“ a mám to.

Podobně, když píšu kód v editoru VS Code, začne mi Copilot automaticky doplňovat kód. To začnu používat hned.

Myslím, že teď uvidíme skutečný přelom, jakmile skončí letošní hype a zjistí se, …

Kde jsou ty oblasti, kde je to skutečně užitečné, a kde nikoli? Bude to prostě o tom, jak se firmám podaří umělou inteligenci integrovat a tím pádem poskytovat lepší služby než konkurence. A to je ten rozdíl v inovaci.

Myslím si, že vlastně ta nejlepší umělá inteligence nebo strojové učení v těch aplikacích bude něco jako filmový trik. Ten nejlepší trik nepoznáš, že to vlastně je trik. Buď můžeš mít filmový trik, který až vybuchuje, takže to na první pohled poznáš, nebo můžeš mít někoho omládnutého o dvacet let, aniž bys poznal, že to bylo vytvořeno počítačem. Stejně tak to bude v technologiích.

Už to například vidíme v Google Workspace, kde máš spoustu malých věcí, které ti usnadňují práci, ale už si nepřipouštíš, že jsou nějakým způsobem natrénované. To znamená, že se můžeš třeba v Google Spreadsheets ptát na data, aby ti to generovalo odpovědi. Máš historická data o prodejích a v angličtině, když klikneš vpravo dole na „Explore“, můžeš se zeptat, v kterém roce jsme prodali nejvíce výrobků. On to vlastně proskenuje, pochopí kontext těch dat – co jsou prodeje, co je rok – a rovnou ti odpoví. Tato funkce už funguje 2–3 roky, funguje sice zatím jen v angličtině, ale postupně se tam přidávají tyto malé vychytávky.

Až toto bude k dispozici i v češtině, tak si řekneme: „Wow, to je opravdu skvělé, že to umí tyhle věci.“ Google na poslední konferenci, která se konala tento říjen, představil několik novinek a řekl, že do roku 2025 by jedním z trendů vedoucích k čtyřdennímu pracovnímu týdnu mohla být právě AI. Jde o to, že se do nástrojů, které lidé již používají, postupně přidávají tyto malé pomocné funkce.

Například v Google dokumentech už v angličtině funguje schopnost shrnout celý dokument. To je přesně to, co popisuješ – nemusíš nikam jinam, kopírovat dokument, přihlašovat se někam jinam, protože shrnutí máte přímo v dokumentu. Tyto drobnosti se přidávají postupně.

Na konferenci Google Next byla ukázána i vize, kam chce Google směřovat. Ukázali demo uživatele, který zadal příkaz: „Potřebuji vytvořit prezentaci, vlož do ní čtyři fotografie, přidej nějakou zprávu.“ Uživatel to popsal podobně, jako by komunikoval s asistentem. Robot to pochopil a připravil prezentaci společně s požadovaným obsahem. Tohle bude jeden z důvodů, proč budeme mít v budoucnu více času, protože tyto věci, které jsme dosud dělali my, zjednoduší práci.

Podobně v BigQuery byla integrována funkce nazvaná „Data Q&A“, kdy jsi schopen se ptát v přirozeném jazyce na data uložená v BigQuery. Například: „Potřebuji zjistit, v kterém roce se něco stalo.“ Systém přeloží tuto otázku na SQL dotaz (ten je psán pro lidi, nikoli pro počítače, protože SQL je jazyk bližší lidskému uvažování), provede dotaz a vrátí výsledek. Takto bude stále více technologií vytvářeno, aby bylo pro lidi přirozenější je ovládat.

Pokud někdo říká, že potřebuje detailní znalosti nebo je programátor a chce jít do detailu, tak to není důležité, protože stejně jako se dnes neučíme programovat v assembleru (protože je to nízká úroveň abstrakce), ale používáme jazyky, které jsou pro nás přirozenější, tak i programování by mělo být psáno pro lidi a ne pro počítač.

Pokud se psaní programů má dít v přirozeném jazyce – tedy mluvím a program se vytvoří – samotné psaní, rychlost a správnost už neřeším, protože to bude za mě zpracovávat kompilátor, algoritmus, nebo nějaký e-hub. Myslím si, že samotný kód ani neuvidíme – stačí říct: „Chci webovou stránku,“ a dostanu hotovou stránku.

Co se týče adopce, na to také nahlížíme trochu optikou našeho věku – již máme své návyky, je nám přes třicet, takže se zásadně nezměníme. Mladá generace, která s těmito technologiemi vyroste, bude k nim přistupovat jako k něčemu přirozenému. A myslím si, že se nebudeme stačit divit, jak rychle to půjde.

Co mi však přijde zajímavé, je, že první věc, kterou si všimnou i školou povinné děti, je, že OpenAI GPT umí krásně psát referáty.

K tomu máme jednu poznámku – jak jsem říkal dříve, budeme spíše placeni za to, že těm věcem rozumíme. Tito asistenti udělají spoustu práce za nás, ale my si musíme zkontrolovat, jestli jsou výsledky správné, což vychází z naší zkušenosti.

Uvedu příklad z právních oborů. Právní koncipienti mají nějaké vzdělání, ale nejsou plně kvalifikováni. Tyto osoby mohou služby strojů kontrolovat, protože vlastně mají magisterské právní vzdělání. Pokud někdo není dokončený právník, potřebuji podpořit své kolegy.

Jak ale zkontroluji, že smlouva je správná? Jak získám jistotu? Jednak musím být obeznámen s příslušnými zákony, které se mezitím mohou změnit, ale především musím mít zkušenost s tím, jak tyto smlouvy soudy vykládají. A to je dlouhá cesta, která začíná u asistenta seniorovi, kde dělám opakující se práce a učím se kontext, než začnu samostatně pracovat.

Pravděpodobně budou tyto asistenční pozice nahrazeny stroji, ale lidé potřebují získat zkušenost, aby byli schopni validovat výsledky – například tiskové zprávy od AI. Jak poznám, že výsledek asistenta je kvalitní a ne chybný?

Dnes, když jsou dvě strany, tak smlouvu obvykle řeší dvě právnické části, které mají každá své připomínky. V budoucnu by firmy mohly mít své vlastní modely trénované na historických smlouvách a kontextech. Už se nebude říkat: „Naše právní oddělení na to koukne,“ ale „náš ML model to prostuduje.“ Výsledkem bude smlouva vytvořená ML modelem dle pravidel, zvyklostí a návyků dané firmy, na kterou ji pak model i zkontroluje.

Každá firma tak může mít jiný model i jinou historickou zkušenost, přičemž lidé už jen budou dohlížet a budou modelu důvěřovat, protože čerpá z jejich vlastních dat a zkušeností.

Samozřejmě k tomu nedojdeme hned, bude to vývoj, kdy AI i strojové učení právníkům pomohou.

Právníci mají totiž práci založenou na čtení obrovského množství textů – desetitisíce stran dokumentů, které musí zpracovat. Člověk nabírá zkušenost řadu let a vytváří si mentální model v mozku, což není efektivní, protože ten mozek využívá pouze on sám jako jedinec.

Z mého pohledu jsou právníci podobní softwarovým inženýrům. Oba pracují s textem – právníci s textovým dokumentem, vývojáři s kódem. Kvalitu dokumentu však dostupnost poznáš až v produkci, když se objeví chyby.

Analogicky je na jednoho softwarového inženýra tisíc kodérů, kteří mají specifikaci a podle ní „bouchají“ kód. Podobně právní koncipienti píší stovky zaměstnaneckých smluv, mění jen malé detaily.

Moje myšlenka je, že když přeskočíme ten krok, kdy tupě píšeš kód nebo právní dokumenty a tím si trénuješ svůj model, jak budeme v budoucnu produkovat lidi, kteří tomu rozumí a dokáží zvalidovat AI modely, které jsou natrénované správně?

Tam se nebojím, protože to je otázka, jak dostat lidi ke zkušenosti, která umožní poslušnost výsledkům.

Vidím to i v hudbě nebo u aut. Ivan říkal, že neřešíme nízkoúrovňové záležitosti, podobně jako já neumím opravit své auto, ale vím, kam se lije olej a kapalina do ostřikovačů, a jsem rád, že si tyhle dvě trubky nespletou příliš často. A k tomu není potřeba více, abych auto dokázal používat.

Podobně je to u elektronické hudby. Beck například neumí hrát na nástroje jako kytaru nebo klavír, ani neovládá noty. Všechno dělá v počítači, najde správnou kytaru, správný zvuk a tak dále. Nepotřebuje tedy fyzickou znalost nástrojů.

Nemyslím si, že zmizí kytaristé. Budou existovat vynikající kytaristé, kteří dokáží vytvořit řadu riffů s charakteristickým citem. Hudba naživo bude dál existovat – velké opery, každé představení bude jiné, s vlastní hloubkou a osobitostí.

Nebojím se ztráty velkého světového know-how a schopnosti tyto věci hodnotit – spíše se posuneme na vyšší úroveň.

Dnes weboví vývojáři často neřeší hardware nebo výkon, protože vše běží na JavaScriptu. Ti starší programátoři se tomu diví, jak neefektivní kód vzniká, a musí to řešit. Myslím, že podobný vývoj bude pokračovat, že na jedné straně půjde technologie do šířky, a na druhé straně pár lidí bude řešit hloubku, aby to dávalo smysl.

Může to vést i ke zvýšení ceny onboardingu – lidé budou platit, aby mohli dělat asistentskou práci, protože musí získat zkušenosti, aby dosáhli seniorní úrovně, i když mnoho z práce už zvládne AI model lépe.

Ale to je otázka asi na deset let, když vezmeme v úvahu dnešní tempo vývoje.

Stojíme na ramenech obrů a využíváme historické zkušenosti – stejně jako když nejchytřejší lidé jako Newton nebo Leibniz vyvíjeli integrální počet, což pro ostatní bylo složité a nikdy by to nepochopili. Dnes se derivace a integrace učí plošně na střední škole a mladší generace to řeší běžně.

Je to proto, že jsme schopni více abstrahovat a díky těmto modelům budeme schopni abstrahovat ještě více. Neříkáme, že jsme přišli o znalost, co je integrální počet – naopak ji více rozšiřujeme.

Směřujeme k tomu, že naše znalosti budou postupně narůstat spolu s externími modely, kterými budeme disponovat.

Vidím tam dvě možné cesty. Jednak dystopickou verzi, kde se lidská hodnota rozpojí od ekonomické hodnoty. Demokratická hodnota jednotlivce ve společnosti rostla s jeho ekonomickým přínosem, ale očekávám, že minimální část obyvatel ekonomický přínos ztratí. To je pro mě zásadní společensko-právní téma.

Na druhou stranu vidím pravděpodobnější antiutopii typu „Brave New World“ – bude se nám žít dobře, většina lidí nebude nic řešit, podobně jako Pixarův robůtek na Zemi. Prostě budou existovat a vše bude možné v metaversu bez velkého úsilí.

Už teď vidím, jak lidé bez privilegovaného přístupu technologiím a vzdělání mají mnohem těžší start a jak díky nástrojům, které mají privilegovaní, jim tyto skupiny utečou – nůžky se rozevírají.

Nemyslím si však, že nastane úplná demokratizace, protože velká data a datasetty jsou potřeba a ty velké projekty budou dál základem platformního byznysu.

Takže asi existují dvě různé věci.

Pokud se podíváme na startupy, myslím, že generativní AI to bude mít těžké. Zmínili jsme si OpenAI – české platformy, které by chtěly něco podobného dělat, budou mít inherentní problém s přístupem k datům, protože nebudou mít k dispozici GitHub, Google data a podobně. Bude to extrémně drahé.

Nicméně otevře se obrovský trh implementace těchto technologií.

V reportu McKinsey z roku 2018 se mluvilo o tom, že tyto trendy vygenerují trilion nového světového HDP a samozřejmě o tento koláč se budeme dělit i my, kteří jsme z agentur a vnímáme to jako byznys.

Byznys tedy bude, ale máš pravdu, že ovoce z těchto technologií mohou sklízet pouze ti, kteří mají technologickou znalost.

Což vede k otázce vlastně hodnoty, že? Nebo jak jsi říkal, že někteří lidé ztrácí ekonomickou užitečnost, nebo tak? Je jejich růst společenské hodnoty, respektive hodnoty lidského života, napojen na ekonomickou hodnotu jednotlivce?

Volby a demokracie jsou tak spojené s industrializací a s potřebou dostat lidi do měst a k výrobnímu pásu. Vzdělání můžeme řešit dlouhodobě. Mě na tom přitom zaujala jedna věc. Když se podívám na člověka a na výsledek lidské práce, jakýkoliv stroj, člověk měl vždycky jednu výhodu v tom, že se dokázal učit.

Ty mluvíš o ekonomické hodnotě, ale já si můžu představit nějakou abstraktní hodnotu, kterou bychom mohli nazývat třeba „mocí, jak dobře je člověk natrénovaný“. Ty jsi natrénovaný v právních záležitostech a v PR, my dva umíme něco jiného. Kdybychom toto abstraktní číslo vložili do grafu, pravděpodobně by nám vypadla normální distribuce.

Cokoli člověk vyrobil ještě donedávna, bylo mimo tento graf, protože stroj se nic nového nenaučí. Když se ale podívám na model ChatGPT, když se ho na cokoliv zeptáš, odpoví pravděpodobně správně. Zkoušel jsem opravdu nestandardní věci, například čas od času si zahraju nějakou počítačovou hru, tak jsem se ptal na dotazy týkající se hry v nějakém kompetitivním režimu – co se vyplatí a co nevyplatí.

Odpovědi dávaly smysl. Předpokládám, že pokud bych se zeptal na elektronickou hudbu, ve které se vůbec nevyznám, model by pravděpodobně věděl více než já. A co mi přijde na tom zajímavé, je to, že teď nevím, kde ta hranice bude, ale pokud se podíváme na normální distribuci toho, jak lidé rozumějí různým tématům, tak je tam nějaká hranice, kde je právě tento model.

A tato hranice se bude v průběhu let posouvat nahoru. To mě vede k otázce, jaká je hodnota lidí, kteří jsou pod touto hranicí.

Všichni tam spadneme v některých oblastech. Myslím si, že to musí zásadně změnit model, jak přemýšlíme o hodnotě lidí. Už to nebude o tom, čemu rozumíme, jak se učíme a co vyděláváme, i když to pravděpodobně pořád bude nějaká deregulovaná metrika, ale my jako společnost se nad tím budeme muset zamyslet, protože to reálně bude problém. Bojím se toho možná víc, než říkám, ale vidím, že nemáme diskuzi o řešeních, což mi připadá dystopické.

A teď zpátky k hezčím věcem. Když jsi říkal o Gartner Hype Cycle, myslíš, že nějakou formu ChatGPT dáte do produkce svým klientům? Myslíš, že je to technologie připravená do ostrého provozu, nebo nám dej časové měřítko? Teď jsme nadšení, ale do žádného systému to vlastně nezavádíme, protože s tím momentálně jen experimentujeme bez reálných případů použití.

Myslíš, že to bude připravené do produkce, nebo naopak vznikne dalších mnoho alternativ, které budou připraveny do produkce, ale pro úzké segmenty?

Momentálně je to ve fázi, kdy je to zdarma a lidé to testují. Když se podíváme na křivku adopce aplikací jako Google nebo Apple, které získaly miliony uživatelů, ChatGPT to získal v rekordně rychlém čase, což ukazuje, že nové technologie akcelerují a zajímají lidi daleko více v kratším čase.

ChatGPT se totiž učí na základě těch promptů, takže využívá spoustu dotazů k tomu, aby se dále zlepšoval. Otázkou je, jaký bude obchodní model, protože určitě nebude dostupný donekonečna zdarma. Předpokládá se, že bude existovat cenový model založený na nějakých tokenech, které OpenAI má i pro jiné služby.

Musí to dávat smysl tak, aby firmy, které do toho investují, dokázaly vydělat na své investici plus něco navíc. My implementujeme věci primárně přes Google Cloud Platformu, protože tu technologii známe a používáme. Nevím si představit, že bychom v tuto chvíli nasadili do produkce OpenAI, protože je to úplně jiný technologický stack. Jsou tam jiné věci, například právní záležitosti nebo smlouvy, pokud data přicházejí z jiné platformy.

Můžeme si však představit, že pokud by Google zpřístupnil svůj model Palm ve své cloudové platformě, dokázal bych si představit dva, tři projekty, na které máme poptávku, které bychom mohli udělat již v příštím roce. Z naší strany tedy čekáme, až budou takové modely dostupné v rámci GCP.

Když jsi zmiňoval poptávky a use case, klidně i abstraktní, kde vidíte potenciál napojení – například do médií, článků? To je u nás podobné. Mám několik proof of concept, které bych chtěl začít realizovat už v lednu. Samozřejmě obchodní cykly trvají nějakou dobu, ale předpokládám, že investiční společnosti a firmy začnou více uvažovat, jak to implementovat do různých startupů a produktů.

Vidím tu potenciál a myslím si, že příští rok se tyto případové využití začnou objevovat.

Slovo „produkce“ bych ale bral s rezervou, protože si myslím, že spíše půjde o demonstrátory proof of concept, než o věci s jasným dopadem a škálovatelností.

Pak je také otázka, zda obchodní model, který nyní OpenAI deklaruje, zůstane stejný, to uvidíme.

Co se týče těch případových využití, jak jsme se bavili, očekávám například autodokumentaci různých kódů. Dokážu si představit, že by se model využil k vytvoření lidsky čitelné dokumentace datasetů – například aplikace kolem datových katalogů.

Obecně jsou zajímavé aplikace typu vyhledávání a kategorizace. Můj aktuální případ je velmi zajímavý – mám klienta, který potřebuje kvůli právním důvodům najít v dlouhodobé komunikaci a výměně dokumentů určité informace.

Tyto dokumenty jsou psané rukou, nestrukturované, mohou to být PDF, e-maily, státní zákony a podobně.

Alternativou by bylo, že by koncipient pročítal tyto dokumenty jeden po druhém. My jsme využili službu Google Document AI, kterou jsme převedli dokumenty do digitální podoby a teď přemýšlíme, jak to zpracovat ve čitelnější formě.

Nabízí se pak rozhraní, kde může člověk jednoduše zadat dotaz typu: „Kdy jsme se bavili tady o této věci XYZ?“ a model vyhledá seznam dokumentů nebo dokonce výňatky relevantních částí konverzace.

Myslím si, že tato implementace přijde dřív, než čekáme.

Jestli je tedy skok mezi Document AI a ChatGPT jen v čistém uživatelském rozhraní a pokročilejším algoritmu, mě to velmi zajímá.

Document AI vezme nestrukturovaná data a dokáže je rámcově rozdělit, už není nutné vyvíjet samostatný model nebo řešit skenování ručně psaného písma oproti tištěnému – v oblasti nestrukturovaných dat vidím velké pokroky.

Ale právě proto, že vidím, co dokáže Document AI, tak pořád nevidím ChatGPT jako úplný průlom těchto minulých roků.

Konkrétně u Document AI se vezmou dokumenty a uloží se. Google má pak Document Warehouse, který umí slušně vyhledávat, ale nedává kontext – například komunikaci tam nezaznamenali, možná existuje nějaký způsob, ale není to přímočaré jako v samotném produktu.

Nakonec jsme museli vytvořit vlastní datový model, který říká, na kterých stranách co bylo, co se tam vyměnilo, kde se dokument vyskytl a v jakém kontextu.

To už je něco komplexnějšího, co nespadá do krabicového řešení, a je potřeba vytvořit uživatelské rozhraní.

Momentálně to rozhraní tvoří nějaká databáze. Já se v databázi vyznám, ale představ si, že to má používat právník, který v databázích příliš znalý není.

Právě v takovém okamžiku má smysl postavit nad tímto modelem uživatelské rozhraní.

Pokud bych měl programovat aplikaci, která danému uživateli usnadní práci v konkrétním use case, mohu využít generické chatovací rozhraní.

Rozumím tomu, co říkáš, a daří se mi být přesvědčen, že jsem možná lehce podcenil ChatGPT a byl nefér vůči Filipu Dřímalkovi, kterému jsem se smál, že v tom vidí pokroky, ačkoli všechny ty technologie byly možné už dávno před tím.

A teď ať utečeme od generativní AI a pobavme se o dalších věcech, které se staly v minulém roce.

Tento rok, možná když to posloucháte později, už bude minulý – což je rok 2022. Vidíš, já také mám COVID dva roky, které jako kdyby nebyly.

Byly to roky, které nám vzaly čas.

Co pro vás byly další zajímavé věci z minulých let? To byly ty velké technologické trendy na českém trhu?

Sledovali jste nějaké trendy, například pád technologického trhu, investic, pozdní fáze (late stage), propad akcií, technologičtí giganti šli dolů, všichni se obávají přísnější legislativy, vysokých pokut Evropské unie.

Například Fortnite dostal pokutu přes 500 milionů dolarů.

Byly tam i další věci, například vztahy mezi Čínou a Amerikou?

Bude generativní AI jediné, o čem se za 5 či 10 let bude mluvit? Samozřejmě je tu i válka na Ukrajině, ale kromě toho?

Mám zajímavé téma, které jsem čekal, že bude problém, ale nakonec jím nebyl.

Všichni jsme si všimli, jak vyletěly ceny energií a logistiky.

My působíme převážně v retailu, takže jsme to zažívali právě přes covid.

Samozřejmě žádná firma nepřijde ke konzultantům, nemá-li problém, takže z určitého úhlu je to možná někdy i výhodné.

Čekali jsme, že zdražení energií nějak zasáhne cloudové systémy a stane se problémem, protože i když využíváme Snowflake nebo BigQuery kredity, na konci dne to všechno znamená spotřebu elektřiny.

Ukázalo se však, že to v praxi vůbec problém nebyl.

Například Google má své datacentra napájená z obnovitelných zdrojů a je soběstačný v oblasti energie, takže nás to vůbec nezasáhlo.

Jsou údajně uhlíkově neutrální od roku 2007, nebo něco podobného.

Někdy jsem vnímal jako korporátní marketing, když tuto informaci firmy uvádějí, ale teď jsem si ověřoval aktuální data z roku 2022 – 2027, a překvapilo mě, že Google to skutečně řeší reálně a dříve než například v Praze.

Není to pouhý právní požadavek, ale něco, co dává smysl.

To mě přivedlo k vtipné situaci, když jsem se objevoval v kontextu firem, které stavěly, že datacentrum musí být ve sklepě z bezpečnostních důvodů.

Ale úřady přiznaly, že na elektřinu nemají peníze.

To mi v několika konverzacích pomohlo, například když jsem seděl v korporátu proti IT specialistovi.

Ten trval na tom, aby bylo datacentrum na místě, a já se ho zeptal: „A vy budete odpovědní za účet za elektřinu? Opravdu nechcete mít IT infrastrukturu v cloudu?“

Takže to pro mě byla překvapivá zkušenost, že to není problém.

Samozřejmě nějaké problémy existují, zejména kurz dolaru výrazně sledujeme.

Na českém IT trhu pracuje většina lidí pro zahraniční firmy.

My máme zákazníky v Americe, takže aktuální kurz dolaru nás přímo ovlivňuje, protože to má dopad na naši konkurenceschopnost.

Toto nás tlačí k tomu, abychom se věnovali činnostem s vysokou přidanou hodnotou, kde desetiprocentní amortizace není problém – tomu se věnujeme.

To jsou dvě věci, které mě napadají.

Ještě jsme nezmínili evropský zákon EU AI Act, který omezuje nebo dává pravidla evropským firmám, nebo firmám podnikajícím v EU.

Je to něco jako GDPR, ale týká se dat tak, aby byl chráněn jednotlivý uživatel a jeho data nebyla využívána bez jeho souhlasu, například biometrické sledování.

Na druhou stranu v jiných regionech, například v Číně, je role jednotlivce méně výrazná, spíše se upřednostňuje společnost a data se využívají k tréninku lepších modelů.

Proto si říkám, že pokud evropská a čínská firma budou soutěžit o stejného zákazníka, asi více omezená evropská firma nebude mít tak volné ruce jako ta čínská, která může nabídnout lepší modely a více dat.

Uvidíme, kam se to nakonec vyvine.

Další věc, která mě napadá, je Čína, kde i když u nás je pandemie covid již za námi, v Číně dosahuje nejvyšších přírůstků.

To zase může ovlivnit dodavatelské řetězce.

Pokud jsme zvyklí nakupovat grafické karty do firemních serveroven, nebo počítače do datových center, může nastat výpadek a dodání se může prodloužit o několik měsíců.

To může pozastavit růst firem, které nechtějí mít data v cloudu, ale zároveň jsou tlačeny kvůli cenám elektřiny a potřebě tréninku modelů na to, že budou na grafické karty čekat dlouho.

Tuto situaci proto vidím jako další příležitost.

Co jsi popisoval před chvílí, jsem viděl naživo, kdy nás oslovilo město, které potřebovalo udělat průzkum dopravní obslužnosti.

Potřebovali vědět odkud lidé jezdí, aby mohli upravit jízdní řády.

My jsme byli jen subdodavatelé v této akci.

Zajímavé bylo, že dříve se to před covidem dělalo tak, že se lidi prostě na ulici oslovili a posílali několik studentů, kteří dělali statistický vzorek.

Významní lidé, kteří mu odpověděli, kam se tak vlastně dojezdí, a na základě toho pak udělali analýzu. Pro mě to byla novinka, protože já jsem nikdy nic takového dlouhodobě nedělal, ale přišlo mi fascinující, jak je to vlastně jednoduché. Oni totiž řídí celou dopravu ve městě na základě toho, že pošlou člověka s dotazníkem a zeptají se tady Jirky: „Hele, Jirko, kam jsi jel dneska?“ Já už teď to přesně nevím, nebo: „Dobře, teď vím, protože jsem jel právě sem, ale kdyby se mě někdo zeptal večer, tak ty cesty jsou chaotické, a kdybych měl zpětně sledovat, co jsem dělal celý minulý měsíc a kam normálně jezdím, tak naprosto netuším.“

Tenkrát ten dodavatel měl ovšem skvělou myšlenku. Řekl si: „Dobrý, protože kvůli covidu to nemůžeme dělat tradičním způsobem, tak pojďme zkusit nějakou inovaci.“ Chtěli jsme se dohodnout s jedním mobilním operátorem, zda nám nedá nějaká agregovaná data. A teď opravdu nešlo o to, že bych chtěl vědět číslo mobilního telefonu a jeho pohyb, ale doslova jde o polygony na mapě, z nichž lze prostřednictvím nějakého trackingu zjistit, kolik lidí jde z polygonu A do polygonu B, a tím pádem vytáhnout trasy.

A tady jsme narazili ne na tzv. AI Act, ale už dříve na to, jak se musí všude na weby odklikávat odhlédní formuláře, díky kterým de facto jakákoliv data o uživatelích přestala od roku 2019 fungovat. My jsme tak dostali nějaká data z roku 2019, ale byla natolik nepoužitelná z legislativních důvodů, že jsme se museli vrátit k tradičním dotazníkům.

Zajímavé bylo, že firma, která ten případ zpracovávala, mi přišla dobrá, a uvažovali jsme, jestli bychom to někde nemohli zopakovat. Firma říkala, že v Evropě to bohužel nejde, ale že v Kazachstánu nebo v Číně to jde úplně v pohodě, stejně jako v Africe nebo v Americe. Používají to všude. Toto mi přijde jako důsledek toho, že nemáme potřebná data a města je nemají k dispozici, proto děláme neefektivní rozhodnutí a v důsledku máme dražší a horší dopravu a zbytečné investice. To jsou typické neefektivity, které se nás týkají. A jsem tedy docela zvědavý, kam nás to v Evropě povede.

V tomto směru pro mě bylo velmi zajímavé řešit Brexit. Méně šlo o data, ale více o to, jak bude vypadat život mých dětí a taková sci-fi budoucnost. Zajímavé jsou genetické modifikace – typicky lidí. Pokud nás posloucháte, je to věc, kterou rád vyprávím při setkáních a vždy překvapím, jak moc lidi to šokuje. Víme totiž naprosto přesně, že v Číně chodí tři geneticky modifikované děti, o kterých je známo oficiálně. Jsou to děti, které vznikly jako tzv. ovce Dolly, tedy uměle vytvořené s jiným DNA. To jsou tři oficiální případy v Číně. Problém je, že nevíme, jestli tam není tajná fabrika na další – to lze předpokládat, že ano.

DNA je v okamžiku, kdy provedete CRISPR nebo jinou genetickou modifikaci, nerozeznatelná. Nelze ji „vytřítkovat“ zpět a říct, že vaši rodiče byli geneticky modifikovaní, až na pár výjimek. Budoucnost je tedy už zde a to v Evropě, abych to trochu zkrátil.

Evropská legislativa je velmi přísná vůči genetické modifikaci čehokoliv, nejen lidí, ale i jakýchkoli živých organismů. Současné standardní metody pro mutaci a vytváření nových plodin jsou například ozáření. Můžete tedy vzít semena, ozářit je radiací a poté z milionů semen vybrat několik, která náhodně změní vlastnosti podle vašich představ. Ale nemůžete vzít jedno semeno a cíleně ho modifikovat na molekulární úrovni, protože to legislativa nepovoluje. Takže lze použít metodu „brute force“ s radiací, ale nikoli precizní úpravu. A srandovní je, že to nelze rozpoznat. Například v Británii po Brexitu tato pravidla povolili, a tím pádem mají pokročilejší genetický výzkum ohledně GMO.

Dovolte mi na závěr této části s vánoční tématikou říct, jak nás tyto věci mohou dohnat. Pro mě to je super téma, protože první věc, kterou si uvědomíte, když pracujete v ministerstvu obrany, je, že protivník se vašimi zákony řídit nemusí. Například by nás mohli vyřešit tím, že by pustili genetickou mutaci do populace komárů, aby do čtvrté generace přestali být potentní. Malárie je již řešena tím, že víme, jak vyhubit třeba komáry cecé, kteří ji přenášejí, a chceme změnit celou populaci komárů díky této jediné funkci. U genetiky není něco dobré nebo špatné, ale jsou to jen změny a každý v sobě nosí nějakou negativní látku. Je to zajímavé téma.

Ale já jsem se nechtěl tolik věnovat genetice a spíše tomu, co nás čeká příští rok. Domnívám se, že u nás v Česku se geneticky modifikovat partnery nebudeme, ani neočekávám nástup tzv. general artificial intelligence či podobných skoků.

Co tedy nás čeká? Na začátku jste říkali, že svět je stále komplexnější, hůře předvídatelný a rychlejší. Jak tedy prodloužit tento trend? Co můžeme očekávat příští rok? Jak plánujete a na co se zaměřujete? Vidím snahu o snížení komplexity, protože všechny systémy a technologie jsou tak složité, že to není dlouhodobě udržitelné. Vidím velký trend v no-code a low-code, tedy jak vytvářet aplikace pro uživatele, kteří nemusí mít programátorské zkušenosti. Google předpovídá, že do tří let bude více než polovina aplikací vytvořena lidmi, kteří se dnes netají jako programátoři, protože technologie budou tak jednoduché, že uživatel definuje, co chce, systém vygeneruje uživatelské rozhraní a aplikaci.

Momentálně je situace taková, že pokud si firma chce vytvořit interní aplikaci, bývá to složité, zpravidla psané v PHP, provozované někde a velmi složité. No-code a low-code platformy, například Microsoft Power Apps či Google AppSheet, tento trend zásadně mění. Dává příležitost vzniknout tzv. citizen developerům – lidem bez historických programátorských zkušeností, kteří si dokáží „naklikat“ aplikaci sami. To ušetří IT čas, protože interně čekáte 3 až 12 měsíců, než na aplikaci najdou čas. Používání no-code či low-code umožní vytvářet formuláře, schvalovací procesy či workflow snadněji a rychleji, což ušetří spoustu času i práce.

To nás přivádí k diskusi o významných českých transakcích a investicích. Zmiňovali jsme, i když ne v této epizodě, firmu Integrovat Make, která se také prezentuje jako low-code nebo no-code platforma. Nicméně není úplným no-code řešením, je to spíš pokročilý nástroj.

Gigi, co ty? Co si myslíš, že nás čeká dál? Co vidíš v příštím roce?

My jako agentura jsme stále dost malí, abychom se dokázali plně přizpůsobit změnám, které nás čekají. Ale příležitosti tu budou. To, co nám trh nyní přinesl, je větší potřeba dat, protože veškeré AI modely a technologie stále vyžadují kvalitní data. Předpokládám tedy, že náš byznys v oblasti stavby datových skladů a reportingu pro byznys a retail nadále poroste.

Příští rok přinese různé zvraty, a proto firmy více potřebují analyzovat své podnikání, což nám poskytne práci i v budoucnu. Jsem také jedním ze spoluinvestorů ve firmě Kebuda, která právě získala investici zhruba 4 miliony dolarů na růst. Mé očekávání je, že makrotrendy zůstanou zajímavé a příležitosti v datech se objeví, otázkou je, jak dobře vybudujeme organizaci, abychom je mohli zachytit.

Velkým posunem je pro nás spolupráce s Googlem. Díky technologickým partnerům jsme schopni nad cloudem dělat velmi zajímavé věci. Dříve jsme uměli pracovat s daty, ale nyní jsme doslova vylepšení – „supercharged“. Umožnilo nám to například vyřešit během několika týdnů dokumentový use case, který jsme nikdy předtím nedělali, protože máme k dispozici hotové aplikace a řešení, která stačí pouze použít jako samoobslužný nástroj a aplikovat je na klientské případy.

Tento přístup nám umožňuje převést poptávku, kterou minulý rok vytvořil trh, do byznysu a příjmů. Vidím obrovské množství „krabiček“ a chytrých nástrojů, které můžeme využít, a jejich použitelnost roste. Současně však roste komplexita – aplikace v sobě samy nic neudělají, musí být napojeny na celý ekosystém uživatelských služeb, aby přinášely hodnotu. Proto vidím velký význam v oblastech jako engineering a machine learning operations.

V posledních dvou letech tento trend výrazně vystupu,“ říkáme tomu „machine learning ops“, což jsou oblasti, kde je potřeba „slepit“ dohromady jednotlivé součásti. Když jsem začal s data science v roce 2016, myslel jsem si, že budu psát modely, ale ve skutečnosti jakmile se daný use case vyřeší, vznikne aplikace, která ho za vás vyřídí.

Myslím, že tento trend bude pokračovat a čím dál méně budeme programovat modely sami. Data scientisté samozřejmě stále budou trénovat modely, ale pro běžný byznys budou důležitější lidé, kteří znají tyto nástroje a umí je použít, často prostřednictvím jednoduchých skriptů nebo no-code řešení k aplikaci na reálné problémy.

V naší firmě třeba nepotřebujeme tolik data scientistů, kolik máme – stačí jich asi jen deset procent, protože většina práce je v přípravě dat, aby modely mohly správně fungovat. Zmínil jsi ML Ops, kde hodně pomáhá automatizovaný machine learning – AutoML, který sám natrénuje modely a optimalizuje architekturu. Data scientisté tedy tráví většinu času úpravou a úklidem dat a laděním modelů.

Celý tento proces se postupně abstrahuje do automatizace a umělá inteligence řeší většinu práce za uživatele, který se může soustředit pouze na obchodní přínos. Vedle ML Ops vidím velký nárůst v „FinOps“, tedy optimalizaci nákladů na cloudovou infrastrukturu.

Mnoho firem má nasazeno několik instancí bez centrálního řízení a auditů. My díky zkušenostem a analýzám umíme například ušetřit i 20–30 % nákladů správnou konfigurací, sjednáním slev a závazků. To vidím jako další příležitost příští rok, protože firmy tak mohou stále šetřit i náklady na cloud.

Mám pocit, že po dřívější době, kdy vše rostlo a nepotřeboval se efektivně optimalizovat provoz, teď nastoupí období konsolidace a zavádění best practices s novými frameworky pro dlouhodobé udržení efektivity. Máme za sebou fázi explorace, kdy bylo možné cokoliv, a růst nastával každoročně ve velkých číslech. Teď je potřeba tomu dát smysl a řád, a to je pro mě téma optimalizace.

Firmy se začnou ptát, co vlastně dostaly za své peníze a budou muset vyhodnocovat dopad investic. My se teď zaměřujeme hlavně na retail, kde řešíme optimalizaci nákupu a prodeje, tedy které marketingové či nákupní akce přinesly peníze. Z tohoto hlediska řešíme podobné úkoly jako Ivan, ale spíše z hlediska obecné optimalizace obratu firem.

S ohledem na současné propouštění i na straně IT firem mám pocit, že trh začíná přemýšlet tímto způsobem.

Na závěr se vás tedy zeptám, co byste přáli našim fanouškům a posluchačům podcastu DataTalk do příštího roku? Je něco, co byste si sami chtěli připomenout nebo držet?

Ivan: „Přeji hlavně čistá data, ať neskončí v lokálním minimu, a ať nové hrozby proměníme v příležitosti. Ve všem lze nalézt příležitost. A pokud se to dobře propojí, technologie mohou být radost. To je hlavní – když lidi baví práce s nimi, komplexita klesá a přidává se hodnota ostatním, aby jednotlivec nebo firma byli užiteční i pro ostatní.“

Gigi: „Myslím, že minulý covidový a současný přísnější režim nám připomněly, jaké hodnoty jsou důležité – že zdraví není samozřejmostí a bezpečnost také ne. Nicméně myslím si, že už to stačilo, a rád bych přeji všem, abychom se mohli vrátit k normálnímu režimu a vytvářeli hodnoty, aniž bychom museli riskovat své blízké.“

To je moc hezký závěr. Děkuji vám oběma a přeji krásné svátky a všechno nejlepší do nového roku. Věřím, že se v našem studiu s vámi uvidím ještě několikrát.

Děkuji moc, mějte se hezky!

Díky, čau! Ahoj!

Děkujeme, že jste doposlouchali DataTalk až sem. Jak se vám tato epizoda líbila? Co byste na našem podcastu zlepšili? Koho byste chtěli pozvat příště? Dejte nám prosím vědět, co si myslíte. A to můžete udělat osobně na příštím Datamesh Meetupu, nebo rovnou teď na mail jirka.zavinac@datatalk.cz. A pokud se vám tato epizoda líbila…

Epizoda se vám líbila, prosím, doporučte ji dál. Klikněte na srdíčka, na hvězdičky, dejte odběry, aby nám svítily dashboardy zeleně, aby křivky dělaly hokejku a aby všichni stakeholdeři schvalovali extra rozpočet.

Ještě jednou vám děkuji. Poděkování patří také mým kolegům, Nikovi a Iris, stejně jako členům našeho partnerského klubu BigHubu, DeepNote, Atakamě a Manitě.

Pokud máte návrhy, nějaké tipy na hosty nebo témata, pořádáte vlastní akce, nebo byste chtěli datovou komunitu podpořit jinak, určitě mi dejte vědět. Děkuji.

Nechť vás provázejí data.

Podcast

Data Talk #20: Giuliano Giannetti (Revolt.bi) & Ivan Kutil (AppSatori)

Strojový přepis

Odebírejte Data Talk