Data Talk #62: Ivan Kutil (Appsatori)

Do dalšího Data Talku zavítal Ivan Kutil, CTO z Appsatori a jediný český Google Cloud Innovators Champion. S Ivanem probral Jirka Vicherek, Ivanovu cestu ke Googlu, roli cloudu, i tom, proč Google nepřišel s něčím jako ChatGPT dřív. Také se podíváme do budoucnosti a proč možná budou knihy přežitek.

Strojový přepis

Dobrý den, jmenuji se Jirka Vechrek a vítám vás u dalšího dílu DataTalku. Dnes zde máme Ivana Kutěla. Ahoj, Ivane. Ahoj, Jirko.

Ivan je CTO a Apsatory, a ti z vás, kteří nás posloucháte pravidelně, už jste Ivana mohli slyšet v rámci vánočního speciálu, našeho prvního speciálu. Dnes jsme si Ivana pozvali znovu, abychom si povídali jen s ním o Google, o tom, jak je to s Googlem a datovou analitikou, jak je to s Googlem a umělou inteligencí a také o vztahu Ivana k Googlu. To je téma dnešního DataTalku.

Ivane, začneme od začátku. Už jsi několikrát svůj příběh vyprávěl, ale pro shrnutí: jaká byla tvoje cesta do technologií, k datům a k Googlu?

Moje cesta byla vlastně netradiční, protože na střední škole jsem studoval filmový průmysl. Měl jsem tendenci stát se filmařem, učil jsem se stříhat, natáčet s kamerou a létat. Pak jsem ale zjistil, že kreativita je sice fajn, ale baví mě víc IT, které mě fascinovalo už od pěti, šesti let. Proto jsem šel na vysokou školu na ČVUT, a posléze na VŠE. Právě na VŠE to všechno začalo, protože tehdy se zde formovaly komunity kolem Google User Group s Danem Francem. Přišel jsem s myšlenkou, proč Google nemá na vysokých školách studenty, nebo zájemce o technologie, a proč neorganizuje aktivity pro ně.

Byl jsi v té době sám studentem, že?

Ano, byl jsem sám student a bylo to trochu sebestředně motivované. Viděl jsem, že Microsoft má podobnou studentskou organizaci, a tak nás napadlo, že bychom na VŠE mohli vytvořit studentskou organizaci zaměřenou na technologie. Po večerech jsme zvali odborníky na přednášky nebo jsme je pořádali sami.

V jakém roce se to dělo? Ivan Kutěl byl studentem VŠE v roce?

V době kolem 2008, 2009. To znamená, že cloud byl v té době ještě v plenkách. Když jsem přišel z ČVUT, kde jsme se učili programování na nižší úrovni, optimalizaci kódu, na VŠE jsem získal větší přehled o big picture a pochopil, kam se technologie směřují a jak bude nutné vytvářet firmy v této oblasti.

Kromě toho, že jsme založili studentskou organizaci, jsme ji s dvěma kamarády přetavili ve firmu. Řekli jsme si, že existují velké konzultační firmy zaměřené na tradiční technologie jako Oracle nebo Microsoft, a že určitě bude potřeba společnost, která bude konzultovat cloudové technologie, zejména od Googlu.

Bylo to tak, že jsi vždy chtěl podnikat, a ten nápad vznikl přímo ze studentské organizace, nebo jaký byl tvůj původní plán po vysoké škole? Být programátor nebo zaměstnanec?

Byly to obě varianty, ale neuměl jsem si představit, že budu pouze programátorem, jehož úkolem je zvýšit počet řádků kódu a snížit počet chyb. Podnikání, vytváření studentských organizací a firem jsem měl vždycky v sobě. Někteří tomu říkají vnitřní kompas – buď ho máte, nebo nemáte. Už na základní škole jsem vytvářel noviny, které jsem pak prodával, nebo jsme si v páté třídě založili bazar s hračkami. Takže nějaké záblesky podnikatelského ducha tam byly a bral jsem to automaticky. Ani jsem neuvažoval, proč bych neměl mít vlastní firmu.

Proč zrovna Apsatory? Jak vznikl název?

Když jsme vymýšleli název, chtěli jsme být takoví gladiátoři, „apsátoři“, takže to znělo dobře. Později jsme zjistili, že „satory“ pochází ze zenového budhismu a znamená osvobození, probuzení. Ačkoliv to nebylo prvoplánové, chtěli jsme firmy „osvětlit,“ ukázat jim jinou cestu v IT. Takže to do sebe pěkně zapadlo. Název bych určitě neměnil.

Co jste v té době vlastně reálně dělali a jak se to za ty roky posunulo?

Ten začátek, o kterém teď mluvíme, byl o cloudové firmě – ale co konkrétně jste prodávali? Proč mám pocit, že prodej cloudu paradoxně začal až teď?

Na začátku jsme se zaměřovali na implementaci Google Workspace. V té době to byla Google Apps – základní aplikace pro firmy, které se používaly na doméně s přístupem přes internet a sdílení dokumentů. Některé klienty si ponecháváme dodnes. Primárně jsme firmám ukazovali, že mohou používat cloudové nástroje.

Není divu, že mnoho lidí mělo ke cloudovým technologiím předsudky. Když jsem s cloudem začínal já, myslel jsem, že Google Apps jsou vhodné maximálně pro firmy s 5–10 lidmi. Když jsem viděl klienta s 1000 zaměstnanci, zdálo se mi to moc velké. Dnes vím, že na tom může běžet firma s až 100 000 lidmi. Musel jsem si tu cestu sám projít a vybudovat si důvěru v cloud.

Věděli jste od začátku, že budete zaměření jen na Google, že nepřidáte například Salesforce nebo jiné technologie? Apsatory je Google partner a specializuje se pouze na Google technologie. Prozraďte, zda jste někdy uvažovali o rozšíření portfolia.

Určitě to byla otázka, kterou jsme řešili i před pěti nebo deseti lety. Ale naše hlavní odlišení je, že se zaměřujeme pouze na jednu cloudovou platformu – Google. Když k nám klient přijde, ví přesně, co Google umí, co neumí. Nechceme tvrdit, že Google je nejlepší na vše. Ale také si u nás může být jistý, že ho nepřevedeme k Azure nebo AWS jen kvůli lepší marži nebo znalostem. Ví, co od nás očekávat – pracujeme jen s Googlem do hloubky.

A jak je to u tebe samotného? Jsi jediný Čech s titulem Google Cloud Champion Innovator a oficiálně tě celá profesní komunita Googlu vnímá jako jednu z nejvýraznějších osobností vývojářské scény Google. Nelákalo tě někdy rozšířit své portfolio o jiné technologie?

To je velmi dobrá otázka a zároveň bych na ni chtěl odpovědět i jako doporučení. Kdybych kdysi rozhodl přidat například strojové učení od jiné platformy, nebo kdybych šel za zajímavými feature od konkurence, třeba AWS, znamenalo by to, že bych se rozptýlil a rozstřelil svou pozornost. Technologie se na nás totiž valí akcelerovaným tempem.

Pro mě je mentálně náročné držet fokus. Když to není Google, moc mě to nezajímá, i když tam vznikají zajímavé věci, například aktuálně kolem ChatGPT. Sleduji to ale vzdáleně a vím, že tyto technologie se časem objeví také v Google systému, takže je pak mohu aplikovat a jít do větší hloubky.

Tím si pomáhám udržet soustředění. Kdybych se měl rozdělovat mezi různé technologie, dělal bych šest měsíců jednu a pak druhou, a vlastně se v nich dál nezlepšil. I když Google možná není ve všech oblastech nejdále, síla platformy a její provázanost to kompenzují a pomáhají mi držet fokus.

Co pro tebe znamenají ocenění a jak ovlivňují tvůj kariérní růst?

Myslím si, že jsou známější a uznávanější v zahraničí. Například lidé často vnímají Microsoft MVP program jako velmi známý a otevřený. Google programy nejsou u nás tolik známé. Můžeš nám říct, proč se těchto programů účastníš, co pro tebe znamenají, co ti dávají a proč nemáme v Česku více Google Cloud Innovator Champions?

U nás lidé hlavně řeší AWS a Microsoft, což je první důvod. Druhý důvod je, že Google programy nejsou u nás tolik rozšířené a známé.

V zahraničí, například ve Velké Británii nebo v USA, jsou Google Developer Expert nebo Google Cloud Champion Innovator vnímáni na jiné úrovni a jsou tam více adaptováni. Když se na konferencích bavím s lidmi ze zahraničí, vědí, co přibližně dělám, znají mé demo projekty. U nás je to hodně o povědomí, zda ten či onen ví, co dělám.

Proto je hlavním benefitem těchto programů globální uznání. Také mám díky nim přednostní přístup k novým technologiím.

Jaké další výhody ti přináší?

Mám možnost testovat nové služby dříve, než přijdou na trh, některé testy trvají déle. Nedávno mě pozvali do speciální skupiny Google Developer Expert zaměřené na AI, kde jsou pouze vybraní lidé.

Tady mám možnost posílat první zpětnou vazbu o budoucnosti technologií. Výsledky jsou prezentovány top managementu. Nevím, zda předkládáním svého názoru přímo ovlivním produkty, ale mám cestu, jak tyto podněty dostat dále.

Pomáhá mi to v prezentacích na zahraničních konferencích a zvyšuje to mou viditelnost. Například když jsem napsal specializovaný článek, začal se šířit na japonských webech a zmínili tam moji práci, což bylo příjemné.

To mi ukázalo, že to, co dělám, je konkurenceschopné celosvětově. Člověk si často říká, že v malém rybníčku jeho názory nikoho nezajímají, ale když to přepnete do celosvětového měřítka, zjistíte, že my Češi jsme velmi šikovní.

Co znamená udržovat si takovou pozici? Předpokládám, že jsou nějaká kritéria a povinnosti.

Určitě, nejen u Google. Firma je řízená daty, proto moje aktivity zaznamenávám v systému. Když přednáším nebo píšu článek, zadávám počet zhlédnutí a čtenářů.

Kdybych byl dlouho neaktivní, vyřadili by mě – to se stalo i jiným. Když jste aktivní, můžete z programu výrazně profitovat, třeba mít možnost mluvit na velkých konferencích. Ale na takovou úroveň já ještě úplně nedosáhl.

A co ve firmě Apsatory? Máte také několik špičkových certifikací na světové úrovni. Je to spíše byznysové nebo co pro vás znamená mít nejvyšší partnerská ocenění?

Trh se posunul a podmínky pro získání partnerského statusu se zpřísnily oproti před dvěma nebo pěti lety. Apsatory je dnes dvojnásobným Google Cloud Premier partnerem – jak na Google Cloud, tak Google Workspace. Musíte splnit podmínky jako počet certifikovaných lidí, obrat a inovativní projekty.

Já sám přináším unikátní kombinaci developerů a innovátorů, kterou v kombinaci s firmou využíváme v byznysu. Programy však nejsou příliš známé, takže lidé často vnímají certifikace jako věc, kterou si jednoduše „naklikáte“, a neuvědomují si náročnost získání a udržení.

Co vám získání a udržení těchto certifikací znamená?

Pro nás je to prestiž. Na trhu existují různí partneři – od jednočlenných firem až po menší lokální společnosti. Pro nás je to odlišení a viditelnost vůči zákazníkům, partnerům i Googlu. Cloudová certifikace je zase potvrzením, že danou oblast opravdu děláme a bereme vážně.

A co vás to stojí? Co je potřeba k udržení?

Je to kombinace byrokracie – zadávání dat do systémů, identifikace nových příležitostí, prodej novým zákazníkům, péče o stávající. Je to o číslech – musíte splnit kritéria a pak získáváte nebo udržujete certifikaci.

Mně na Apsatory vždy přišlo zajímavé, že nejste jen reseller nebo poskytovatel konzultačních služeb, ale že velkou část obratu tvoří produktová činnost. Jak k tomu došlo, jak se vám to daří udržet?

U nás je to hezky propojené. Začali jsme poskytovat služby a postupně jsme vyvinuli produkty. Deviza je, že část týmu je vyčleněná výhradně na produkt, aby se specializovala jen na něj. Klientská část firmy má jiný fokus a obvykle je „důležitější“, takže by pak produkt trpěl.

Postavili jsme mezi konzultační služby, školení, prodej licencí a produkt, který nyní tvoří významnou část obratu. Produkt nám zároveň pomáhá získávat zkušenosti s tvorbou a integrací na Google Cloud, které pak můžeme využívat a předávat dál.

Můžete být konkrétnější ohledně produktů? Máte dva – Signature Satory a Auditory. Oba jsou postavené na Google platformě, což vám pravděpodobně ulehčuje práci.

Ano, oba produkty jsou čistě googlovské, což nám určitě pomáhá a usnadňuje integraci s Google Cloudem.

Všechno nás to naučilo, můžeš být konkrétnější? Jakoby tohle opravdu platí, že pokud si na to nesáhneš, tak ty věci nevidíš, a my díky tomu, že jsme si na to sáhli, je vidíme? Určitě jde o to vůbec projít tím procesem, dostat se do toho marketplace, být tam a vlastně vědět, jaké parametry je potřeba splnit, aby tam aplikace mohla být. To znamená, jsou to nějaké bezpečnostní věci, ochrana soukromí, mít správně pojmenované věci na stránkách a tak dále. A tím, že jsme tímto procesem prošli a obecně rozumíme tomu, co to znamená, když chceš aplikaci nainstalovat jako administrátor versus jako uživatel a co je k tomu potřeba, zda je nutné si zaplatit drahý audit v řádu tisíců dolarů, anebo ne, tak tomu všemu rozumíme. A teďka k nám třeba z trhu chodí firmy, které jsou třeba částečně integrované na Google a potřebují pomoc s tím zrychlením. Tak nám to řekněte, než nám to Google po pár dnech řekne, takže jsme schopni s tím pomoci.

Případně když přijde firma a potřebuje udělat nějaké jednoduché rozšíření, například do Google kalendáře, což byl případ Aroundu, tak jsme takové rozšíření vytvořili na míru a přesně jsme jim pomohli, aby se to dostalo rychle na ten marketplace. Z pohledu toho, jak dostat produkt do integrovaného Google marketplace, a potom je to vlastně o komunikaci a integraci s jednotlivými API. V případě signature story využíváme Gmail API pro centrální správu e-mailových podpisů. Máme firmu o deseti lidech, ale máme i firmy, které mají tisíce lidí. Potřebuješ mít stejný e-mailový podpis, aby všichni měli stejnou patičku, tak k tomu využíváme právě to API.

Když trošku odskočím, přidali jsme tam funkci, že to je jakoby marketingový nástroj – nastavíš si v e-mailu, že je tam nějaká nová nabídka, a rovnou tam nasadíš UTM parametry z e-mailu. Takže to je pro tebe další kanál, jak dostat lidi do soutěže, na web nebo na blog, protože lidé píší e-maily a podpis je dost viditelný. To je tedy to, co ten produkt dělá. Potom jsme naintegrovaní na Google a řešíme všechny věci s tím spojené. Toto většinou máme technicky pokryté, takže takto pomáháme i českým startupům.

Mně přijde zajímavé, jak je to podobné jako například mobilní marketplaces, App Store a tak dále. Protože jsi specializovaná firma a už i na Google marketplace potřebuješ určité know-how, abys svoji pozici v globální konkurenci využil a prošel všemi těmi požadavky. To je pro mě zajímavé.

Na druhou stranu vy nenabízíte vývoj „jako vývoj“. Pomáháte firmám prototypovat. Když něco potřebují ověřit a zjistit, jak by to mohlo fungovat v řádu týdnů, jste schopni to dělat na nějakých no-code nebo low-code platformách. Takže s tímto jsme schopni pomoci.

Typicky třeba pro Rohlík jsme integrovali IoT čidla, kdy se dali čidla teploty do aut nebo mrazáků a potom jsme to měli integrované tak, že se data posílala někam, a pak do nějaké Google tabulky, kde si je oni vyhodnocovali, jak potřebují. Jakmile to splnilo očekávání, přepsali si řešení a udělali tak, aby jim to vyhovovalo. Výhodou bylo, že jsme takto nahradili externí třetí ruku – vyvinuli to, uživatelé viděli data, posílali jsme to do BigQuery, data pak viděli v Google tabulkách. Pro uživatele je to jednoduché – vidí, zda je tam správná teplota, nebo není, přichází oznámení e-mailem nebo jiná notifikace. Na základě toho si pak řekli, jak to zhruba chtějí, a následně si to udělali interně sami. Takže i taková základní BI prototypace.

Pokud se podíváme do současnosti, jak to teď vypadá s Google v Česku. Říkal jsi, že je v tuto chvíli nejmenší z těch tří hráčů, jak vnímáš trend a trh jako takový? My jsme si udělali interní průzkum, kolik firem vlastně používá Google nebo jaká je situace v Česku. Z hlediska startupů nám vyšlo, že přibližně 50 % firem funguje na Google Workspace. Je to běžná věc – zakládáš firmu, zřídíš si to na Google, protože pravděpodobně jsi to používal v nějakém startupu, kde to bylo. Takže vůbec nepřemýšlíš o jiné variantě.

Takže co se týče digitálních rodilých uživatelů (digital natives), Google má přibližně 50% zastoupení a je mnohem snazší dostat tyto firmy do Google Cloudu, protože mají provázané služby. Dále pokud firma potřebuje infrastrukturu, historicky ji postaví na tom, co zná, třeba na AWS, protože tam to zná z předchozí práce.

Z hlediska Google Cloudu je Google druhý nebo třetí, ale teď se to hodně mění díky generativní AI. Google na konferenci Cloud Next, což je jeho největší konference, oznámil, že 70 % generativních AI startupů nebo firem spojených s generativní AI běží právě na Google Cloudu. Využívají tedy Google infrastrukturu.

To mi nahrává na další otázku. Přitom mediálně to v posledním roce vypadalo tak, že Google dostával hodně kritiky. Když přišla ChatGPT, některé titulky hlásily konec vyhledávání na Google a podobně. Akcie Google také utrpěly. Celkově to ze strany Google působilo nešťastně a špatně zvládnutě. Jak jsi sledoval poslední rok, respektive poslední půlrok, v souvislosti s generativní AI a partnerstvím Microsoftu s OpenAI?

Sledoval jsem to se zájmem, protože jsem viděl, že technologicky některé služby Google má, ale podle všeho nechtěl být prvním, kdo to tady prosadí. To, co se trošku omluvilo OpenAI nebo přehlédlo jako problém, to by Google asi zvládl razantněji. Oni si vyhodnotili, že budou, ale nebudou první. Naopak se poučí z chyb a postaví produkt tak, aby byl ready pro podnikové nasazení.

ChatGPT přidal podporu pro podniky až po roce – ChatGPT Enterprise umožňuje firmám řídit, jaká data se mohou používat, trénování atd. Za ten rok spousta firem tento nástroj používá, často neoficiálně (jako shadow IT), ačkoliv to může být zakázáno či povolené.

Kdyby Google byl prvním, dostal by mnohem větší ránu. Google tedy počkal, jak se trh vyvine, a ví, že technologie má. Velké oznámení přišlo v lednu, kdy interní týmy pravděpodobně měli hackathony. Výsledky pak ukázal na Google I/O, kde každý tým prezentoval řešení s generativní AI – shrnutí článků v Chromu, speciální aplikace v Drive, doplňování Gmailu a další. Všichni týmy se snažili AI nějak do svých produktů začlenit.

Uživatelé však byli částí těchto novinek přehlceni, protože jedna služba se dala použít několika způsoby, protože na ní pracovaly různé týmy a každá služba měla jiný fokus (některé na vývojáře, jiné na koncové uživatele či firmy). Uživatele to trochu zmátlo, proč jsou dvě podobné věci místo jedné, ale vysvětlení je, že každá cílová skupina potřebuje něco jiného.

V lednu tedy začal závod. Myslíš, že to Google čekal trochu později, jako když mobilní operátoři najednou dali data zdarma a trh explodoval, nebo to byla situace, že OpenAI všem vypálil rybník a teď to všichni dohánějí?

Google ty technologie velkých jazykových modelů má, což je veřejně známo, protože na Google I/O prezentoval výsledky formou demo aplikací a AI kitchen, kde mohli uživatelé z USA a schválení lidé zkoušet technologie. To však nedosáhlo masové pozornosti.

Technologicky byl velký jazykový model PaLM představen už v letech 2021–2023, ale nikdy nebyl veřejně dostupný. Boom způsobil až OpenAI s uvedením ChatGPT, kdy se to dostalo k stovkám milionů uživatelů, mnohem více než těch asi 200 lidí v Google, kteří modely znali a používali je vnitřně.

Až uživatelé přišli s různými prompty a využitím, ukázali potenciál těchto modelů. V tu chvíli Google pochopil cenu a přetavil to do podoby API a služeb pro veřejnost.

Toto není poprvé, že Google má technologii, ale neumí ji zmonetizovat a dát na trh. Vždy se musel přizpůsobit trhu.

Hezkým příkladem je MapReduce – technologie, která umožňuje pracovat s velkými objemy dat, vymyšlená Googlem v roce 2003 kvůli vyhledávání a škálování. Z ní vznikl open source projekt Hadoop, který Google musel později přetavit, aby ho mohl nabízet na své cloudové platformě.

Podobně u zpracování dat formou Dataflow – Google vymyslel službu Dataflow a publikoval k tomu paper. Na základě toho vznikl Apache Beam, který Google zavedl do své cloudové platformy zvenčí.

Historicky Google je dobrý v inovacích, ale monetezace a doručení zákazníkům bývá složitější. Někdy proces trochu „drhne“. Nyní to zvládla externí firma, ale není jiná cesta než uvolnit tyto technologie uživatelům formou služeb, API apod.

Když se podíváme na současný Google stack datový a generativní AI, jaký je stav?

Poslední dva roky jsou pro mě překvapivé – BigQuery získalo na významu díky tomu, že data z Google Healthcare a dalších služeb končí v BigQuery. Mám pocit, že BigQuery je společný jmenovatel, který spojuje původní marketingové trhy s tradičním enterprise data warehousingem.

Můžeš popsat, co se děje v BigQuery, datové analýze a jak to souvisí s cloudovým a generativním AI stackem?

BigQuery je něco jako vlajková loď Google Cloudu. Lidé často říkají, že nejdůležitější služby Google Cloudu jsou BigQuery a Cloud Run (serverless platforma pro spuštění kontejnerizovaných aplikací).

Firmy by mohly přidat další AI nástroje, kde je Google také silný.

BigQuery je typ databáze, která je sloupcově orientovaná – data jsou uložena ve sloupcích, což usnadňuje analytické zpracování. Koncept využívá MapReduce. Data jsou uložena levně a pro jejich zpracování se přidělují tzv. sloty, což jsou virtualizované instance výpočetních jednotek. Například můžeš dostat dva tisíce „počítačů“, které paralelně zpracovávají části dotazu a nakonec se výsledky spojí dohromady.

Tento koncept přidělení úložiště a výkonu byl revoluční, protože změnil tradiční přístup, kdy databáze běžela na jednom serveru.

Google k tomu přidal chytré funkce, například pokud pracuješ s geoprostorovými daty, má BigQuery geofunkce, které umožňují agregace podle místa, geografické operace apod.

Dále je zde BigQuery ML, které umožňuje strojové učení přímo v BigQuery bez nutnosti programování v Pythonu. Analytik využívající SQL může vytvořit model, který se vyhodnotí a s daty lze pracovat.

Tato doplňující vylepšení jsou unikátní a umožňují přístup k datům, která jsou i jinde uložená – například v AWS nebo Azure. Pomocí BigQuery Omni je možné dotazovat externí zdroje dat přes připojení externě.

Google tedy vidí BigQuery jako svou vlajkovou loď a do této služby hodně investuje.

Příklad: s Google Analytics 4 Google říká, že pokud firmy chtějí velké analýzy, nebudou stavět další aplikace typu Analytics, ale umožní firmám exportovat data do BigQuery, čímž si firmy přiblíží Google platformu ke svým datům. To považuji za chytré řešení.

V souvislosti s vázáním klientů – jak vnímáš Looker, Looker Pro a celou vizualizační vrstvu integrovanou do BigQuery?

Looker je akvírovaná firma, její kompletní integrace chvíli trvá. Nyní má Looker tři základní varianty. Google přejmenoval Data Studio na Looker Studio, takže jsou dostupné: Looker Studio, Looker Studio Pro a velký Looker.

Velký Looker v Česku používá jen několik firem a nabízí nejpokročilejší funkce. Cena tomu odpovídá a odpovídá i pozicování produktu.

Vedle toho je Looker napojený přímo na BigQuery, a můžeš s ním vytvářet pokročilé dashboardy.

Protože umíš do BigQuery připojit jakýkoliv datový zdroj, můžeš BigQuery využít jako mezivrstvu, která umožňuje i cachování pomocí BigQuery Engine.

Celý tento stack lze takto integrovat dohromady.

Kam to směřuje?

Ve výsledku můžeš mít data třeba ve…

Spenderu,

úplně stejně jako v jiné databázi, ale to připojení do Lookeru dostaneš právě přes BigQuery. Takže to může být nějaká mezivrstva mezi tím.

A jak vidíš popularitu Lookeru na českém trhu? Já s ním mám velmi úzký vhled, ale nesetkávám se s ním tak často. Looker jako ta bezplatná verze, která dříve nesla název Data Studio, je hodně populární mezi marketéry, protože si tam už připojili své Google Analytics atd. Ale v některých případech firmy používají Power BI, takže je to spíše ekvivalent toho.

To, co Google přidal do Looker Studia Pro, je spíše řešení centrální správy a manažovatelnosti uživatelů. Typicky odejde nějaký uživatel, a tak, aby si ten report mohl převzít někdo jiný, se tam přidává tato mezivrstva.

A jak se bude pozicovat ten dražší Looker? To je spíše vůči Tableau. A tam zase bude používat několik firem, protože cena je v tisících dolarů měsíčně.

Super. Když se podíváme na generative AI stack, ty jsi říkal, že jsme to celé začali tím, že Google teď vlastně „vykopává“ tuto oblast, že on je ten průkopník, který s tím vychází ven a testuje to na více místech pod různými názvy.

Tak jak je tomu teď? Jak je to s jazykovými modely a kde je v Googlu najdeme? Nebo s jazykovými a multimodálními modely?

Pokud chceš používat velké jazykové modely, existuje několik variant. Běžná varianta, kde uživatelé většinou skončí, je BARD, protože je to nejběžnější způsob, jak se připojit k webu, něco se zeptat a získat odpověď. Ale protože je tam mezivrstva, která zajišťuje korektnost a tak dále, dostáváš nějaký konečný výsledek.

Pokud jsi vývojář nebo firma, obvykle potřebuješ mít větší kontrolu nebo ladit parametry. Takže pro nás laiky je BARD vlastně chat GPT od Google.

Super. A teď se bavíme o Copilotovi od Google?

Teď mluvíme o tom, že v rámci firemních cloudových zákazníků, pokud máš cloudový účet nebo Google účet, můžeš si vytvořit cloudový projekt a v rámci něj je jedna ze služeb, která se jmenuje Vertex AI.

Vertex AI je na úrovni BigQuery, což znamená, že je to jedna platforma, podobně jako BigQuery, Cloud Run a další služby. Vertex AI dříve nesl název AI Platform a umožňoval provozovat instance tvých strojů, jejich učení a další úkony.

Google to přejmenoval na Vertex AI. Když vstoupíš do Vertex AI, najdeš tam několik služeb a jednou z nich je Generative AI Studio.

Zde je zajímavé zaměřit se na to označení „studio“, protože vidím, že do cloudových projektů Google přidává více aplikací určených pro uživatele, které můžeš používat, aniž bys musel něco programovat. Typicky jsme zmínili Looker Studio, potom Generative AI Studio, a nově Google představil BigQuery Studio.

Zdá se tedy, že studia budou sada aplikací, které jsi schopen používat bez nutnosti připojovat se k API nebo volat je přes SDK. To je posun cloudových produktů směrem k tomu, že tam budou specializované nástroje v konzoli.

Je to posun směrem k low-code a no-code?

Ano, je to posun k tomu, aby to bylo přívětivější pro uživatele. Když jsem sledoval ty platformy, Google vždycky měl technologicky dokonalé uživatelské prostředí, ale pro běžného uživatele to nebylo dostačující, protože to bylo velmi složité a často přeplánované.

Moje vnímání je takové, že AWS je skvělý v poskytování API – to historicky chtěl i Jeff Bezos, aby byly všechny aplikace postavené na principu API-first a měly integrovaná rozhraní. Azure mi vždycky přišel uživatelsky přívětivější, když jsi uživatel, tak si tam jednoduše naklikáš, co potřebuješ, a dostaneš výsledek.

Google byl vždy technologicky špičkový. Toto znamená, že pokud jsi chtěl dříve dělat strojové učení, měl jsi třeba TensorFlow framework, mohl jsi tam dařit svá data a trénovat modely. Ale pro běžného uživatele to bylo složité.

Teď se Google dostává od čisté technologie přes API až k vrstvě pro uživatele, takže jsi schopný to používat bez nutnosti programovat. A v těch studiích máš uživatelské rozhraní, kde můžeš začít pracovat.

Typicky v BigQuery Studiu musíš vytvořit SQL dotaz, pojmenovat ho, máš historii revizí, můžeš to sdílet s týmem – to je klasická týmová práce.

Proto vznikají ta studia. A v rámci nich je i Vertex AI Generative AI Studio, kde v sobě má jak jazykový, tak obrazový pohled. Když klikneš na jazykový pohled, můžeš psát prompty, dostávat výsledky a začít to používat.

To je vlastně use case pro firemní použití.

Co si myslíš, že se bude v tomto ekosystému dít dál? Na co se máme těšit? Kdy bude, stejně jako je Autocorrect v každém e-mailu, generativní AI přítomná v každém workspace, placeném účtu, v Gmailu? Nebo je to jedna z milníků, která jistě přijde? Jaké další věci podle tebe přibudou? Bude například přepínač ve vyhledávání samotném? Jakou roli v tom všem hraje vyhledávání, které vlastně stvořilo Google?

Vyhledávání v tom hraje velmi významnou roli. Google navenek neprojevuje většinu svých technologií, ale má je integrované. Například v rámci služby Vertex AI přidal službu Vertex AI Search, která umožňuje zaindexovat dokumenty a v nich vyhledávat. Můžeš získat kontextuální výsledky přímo z daného dokumentu a navíc to shrne přes velký jazykový model.

Historicky, když jsem dělal nějaká dema klientům, bylo několik osvědčených postupů, které se mění, protože je to nová oblast, ale logicky vždy platilo, že když jsi chtěl vyhledávat nebo pracovat s velkými jazykovými modely a nechtěl, aby ti halucinovaly, musel jsi využít svá data.

První varianta je využít celý jazykový model – typicky open source a celý ho dotrénovat, což však stojí čas i peníze.

Druhá varianta je fine-tuning, tedy dotrénovat jen část vrstvy modelu a říct, jaká fakta má znát.

Třetí varianta je převést svá data do bloků (například paragrafy pravidel silničního provozu) a převést je do embeddingu.

Embedding je technologie, resp. API služba, která převede text do vícerozměrného prostoru identifikovaného čísly – představ si 700 čísel vedle sebe. Každý text se tak převede do této číselné reprezentace.

Když se někdo zeptá, dotaz se také převede do embeddingu na číselnou reprezentaci a poté se hledá podobnost vektorů. Porovnáváš vzdálenost mezi vektory a ten s nejmenší vzdáleností je vhodný výsledek. Tento výsledek se pak předá velkému jazykovému modelu, který shrne odpověď s ohledem na daná data, čímž se eliminuje halucinace.

Pro tento účel se nyní často používá LangChain, což je framework pro Python, který umožňuje skládat jednotlivé řetězce akcí, co by se mělo stát.

Ale toto všechno je zatím konstrukce z jednotlivých kostek lego.

Dalším krokem a směrem, kam se to vyvíjí, je služba Vertex AI Search od Googlu, kdy jednoduše řekneš: „Mám PDF dokumenty,“ a Google je zaindexuje na pozadí, takže se nestaráš o embeddingy.

Při vyhledávání ti Google rovnou vrací informace s konkrétními místy v dokumentech.

Zdrojem mohou být webové stránky, PDF dokumenty, ale už nemusíš řešit mezikrok s embeddingy ani limit počtu tokenů.

Z mého pohledu firmy budou už v nejbližší době tvořit svá samostatná úložiště dat, která v Googlu mohou být cloud storage nebo později Google Drive, kde určíš, která data se mají zaindexovat, a když se uživatel zeptá, získá rovnou výsledek.

To by měly být novinky dostupné během půl roku.

Co přijde dál?

Spoluzakladatel DeepMind, Mustafa Suleiman, říká, že další generace AI bude „actionable“, tedy schopná vykonávat akce. To povede ke vzniku multiagentních systémů, kdy budeš moci napsat, co chceš, agent bude definovaný textově, co dělá.

Například když se zeptáš, jaký má firma obrat, za tím bude kus kódu, který zavolá API a vrátí číslo.

Poté budeš moci spojovat více agentů, kde každý bude definovaný popisem v textu, například: „Hledám nového zákazníka, poraď si s tím.“

Jazykový model se pak zeptá jednotlivých agentů: „Kdo z vás umí hledat firmy na internetu?“ Jeden agent odpoví, že tuto schopnost má a použije kód, který projde stránky a najde firmy.

Další agent zhodnotí, zda je firma vhodná, a informuje model.

Jiný agent má v textovém popisu, že umí prohledávat firmy, a zapojí se podle potřeby.

Ty tak abstraktně popíšeš funkce nebo aplikace textem, bez nutnosti API, a agenti si mezi sebou „povídají“ a dávají ti jen výsledek.

Nebo nemusíš ani výsledky dostávat, protože jiný agent například umí psát e-maily – stačí ho zapojit a on za tebe napíše e-mail.

Tím může být prvních pět kroků salesu kompletně hotových agentem a ty dostaneš již jen kvalifikovaný lead.

To zní skvěle, ale zároveň trochu děsivě.

Na druhou stranu ty dobře víš, co technologie dnes umí, jaký mají potenciál a jaká je reálná situace na trhu.

Vnímáš, že se zvětšuje propast mezi firmami, které jsou opravdu datově řízené, digitální, inovativní, softwarové či technologicky zaměřené, a zbytkem? Jak jsme to viděli v online světě a nyní v cloudu, mám obavy, že se to opravdu rozdělí na dvě kategorie – ty, co AI používají, a ty, co ne.

Dělítkem bude, zda firma používá cloud, nebo ne.

Pokud máš svá data v cloudu, pravděpodobně budeš mít také přístup k velkému jazykovému modelu, výkonu a technologii, která ti umožní nabídnout nový pohled a možnosti, které jsi dříve neměl.

To znamená, že firmy si mohou vybudovat konkurenční výhodu, protože získají přístup k něčemu víc.

Hezky to jde vidět například na převodu řeči na text (speech-to-text).

Klasické modely a nová vrstva postavená na velkých jazykových modelech od Googlu přináší radikální zlepšení.

Testoval jsem starý model Google speech-to-text, který má přesnost kolem 80–90 %, což znamená, že je potřeba hodně úprav na úrovni slov.

Nový model postavený na velkém jazykovém modelu dosahuje až 95 % přesnosti pro češtinu.

To znamená, že velké jazykové modely přidávají mezivrstvu, o které jsi ani nemohl předtím snít, a speech-to-text to dokonale ilustruje.

Určitě se to bude vše dělit, ale firmy, které budou používat tyto technologie a budou v cloudu, získají značnou výhodu.

Co se týče použití dat, můžeš je využít velmi rychle.

Za tebe s AI bude vlastně komodita – pokud budeš na cloudu, bude lehké ji koupit.

Budeš samozřejmě potřebovat mít data, dávat zpětnou vazbu, hodnotit, zda ti výsledky připadají správné.

To znamená, že bude potřeba někdo, kdo firmu naučí AI efektivně používat.

Typicky když máš nějaký model a ptáš se na výsledek, musíš mu dávat zpětnou vazbu, zda je správný, aby mohl být dál trénován.

To budou nové techniky, které se lidé budou muset naučit.

Samozřejmě čím větší firma, tím více dat bude mít a bude dávat rozsáhlejší zpětnou vazbu, což povede k modelu přesnějšímu než u firem, které takový model nemají, nebo ho používají málo.

A když se podíváme do dalších šesti měsíců, co očekáváš u LLM (large language models)?

Myslíš, že uvidíme agenty přímo v cloudových platformách?

Ano, říkám, že budeme mít autonomní agenty, podobně jako dnes máme přístup k jazykovým modelům, ale budou mnohem pokročilejší a více rozšiřitelní.

Bude možné textově popsat, co potřebuješ udělat, a systém to za tebe vykoná.

Kdybych měl jmenovat konkrétní službu, zmínil bych Vertex AI Extensions, která umožní psát rozšíření pro tvé služby.

Stejně jako ChatGPT má pluginy, tak Vertex AI bude mít své extensions.

Ty se budeš ptát modelu a ten se může připojit na tvůj e-shop nebo jinou službu.

Dále bude růst limit tokenů, který dnes považujeme za omezení, ale brzy bude směšný.

Token představuje přibližně jedno slovo.

Tokeny dříve začínaly na zhruba 8 tisících, Google nyní uvádí limit 32 tisíc tokenů, což znamená, kolik vstupních dat lze zpracovat – kolik stránek můžeš vložit.

Google již testuje v betě 100 tisíc tokenů a plánuje dosažení milionu tokenů, tedy prakticky neomezeně.

Tedy uvažování o limitech tokenů se stane zcela irelevantní; budeš moci vložit třeba celou knihu a získat její sumarizaci.

To je další směr vývoje.

Myslíš, že tedy nemá smysl příliš se zaměřovat na vlastní vývoj infrastruktury tohoto typu?

Vnímám, že za poslední půlrok vzniklo mnoho technologických projektů, které se snaží obcházet tokenizaci nebo jinak řešit mezivrstvy.

Myslíš, že vývoj půjde tak rychle, že to nebude zapotřebí, protože to bude jako služba integrovaná?

Kdybych neviděl to demo, možná bych si řekl, že to tak bude, ale tím, že jsem viděl… (text končí)

Přepis obsahuje 100 % obsahu originálu, je rozdělen do odstavců a upraven do spisovné češtiny při zachování původního významu.

Viděl jsem to demo a sledoval, jak Google skutečně reálně ukazoval celou knížku a říkal, že má 100 000 tokenů, přičemž chtějí dosáhnout milionu. Má tedy nějakou infrastrukturu nebo nástroj, jak to dělat. A teď mi přijde, že se vlastně zkracuje ten cyklus, kdy to uvedli jako research paper a potom možná se to dostane do produkce. Nyní totiž přímo ten research paper, který zveřejní, se snaží dostat formou nějaké API služby.

Další věc, kterou například měli a kvůli které je zajímavé číst research papery nebo se v tom orientovat, je nový koncept nazvaný destilování krok za krokem. Ten říká, že pokud jste měli velký jazykový model, obrovský a drahý na provoz, stačilo vám méně příkladů; nebo jste měli menší model, který byl specializovaný na konkrétní úkol, například překlad, a k tomu jste potřebovali víc příkladů, protože model byl menší, ale měl kvalitu ekvivalentní velkému modelu. Tento proces destilování informací umožňuje mít lepší kvalitu a model nemusí být nutně tak velký, což představuje určitý kompromis. A právě tento koncept Google zveřejnil ve svém research paperu, a už nyní má k dispozici beta testování v rámci Vertex AI. Takže se to dostává i k nám.

Pokud budu pokračovat dál, vedle toho má Google ještě dva zajímavé papery. Jeden se jmenuje PaLM-E a druhý Robot Transformer. U těch Google ukazuje, že vzali velké jazykové modely a výstupem těchto modelů byly souřadnice ovládání robotů. To znamená, že pokud jste chtěli ovládat nějaké robotické rameno, museli jste ho celé naučit ovládat, což bylo nepohodlné. Nyní díky velkým jazykovým modelům jste schopni říct ramenu v přirozeném jazyce „vezmi tužku a polož ji vedle penálu nebo banánu či čehokoliv jiného,“ a model to pochopí, protože ví, jak vypadá banán, co je tužka, kde se na těch souřadnicích nachází daná věc, a podle toho posune robotické rameno a úkol provede.

To znamená, že vidím v blízké budoucnosti, třeba během následujících 12 měsíců, velký boom v integraci velkých jazykových modelů do hardwarových zařízení, protože ty zařízení už budete schopni ovládat hlasem nebo textově a robot bude dělat to, co skutečně potřebujete.

Mě na tobě, Ivane, baví, jak zvládáš všechny úrovně. Umíš vyhrnout rukávy, jít do kódu a opravdu si zkusit programovat, máš úroveň CTO a rozumíš technologiím, kostrám, synopsím a všemu kolem. Ale zároveň mě jako úplného laika baví i ta intelektuální, filozofická část, jak k tomu přistupuješ.

Teď, když mluvíme o budoucnosti a o tom, co můžeme očekávat během dalších 12 měsíců jen od Google, jak vnímáš AI jako AGI? Jak vnímáš fakt, že nejdřív jsme vytvořili jazykový model, který statisticky odpovídal na to, co má být další slovo, pak začal odpovídat tak, že se nám to líbilo, a nyní jsme zjistili, že prostřednictvím slov se naučil ovládat nebo pomáhat ovládat robotickou ruku?

Co podle tebe znamenal vývoj za posledních 12 měsíců ve vztahu k tvému světonázoru, technooptimismu a jak se díváš na to, co přijde dál? Když se technologie, které se naučily jazykové modely v posledních měsících, během dalších 12 měsíců naučí používat ve fyzickém prostoru, bojím se zeptat, co tedy přijde za dalších 12 měsíců.

Mě moc baví dívat se do historie, respektive sledovat, jak se některé věci predikují. A jako první mi přijde na mysl Ray Kurzweil, který je vedoucím inženýrství a vědcem a vytvořil mnoho věcí. Napsal knihu o singularitě a chystal druhou knihu nazvanou „Singularity is Nearer“. Vydání knihy mělo být v roce 2022, ale posunul ho na roky 2023, 2024, 2025, protože do ní stále přidává nové poznatky. Je to člověk, který v rámci stovek svých predikcí dosáhl přibližně 80% úspěšnosti a předpověděl, že vše směřuje k tomu, že budeme schopni nahrát lidský mozek do cloudu a s tímto „materiálem“ pracovat. Zabýval se i vědomím a podobnými tématy. Nejzásadnější průlomy podle něj nastanou kolem let 2025 a 2026, tedy velmi brzy.

V roce 2020 mnozí lidé říkali, že je to nemožné a ještě nejsme tam, kde by se to mohlo stát. Ale když vidíme, co se všechno stalo za jeden rok, přijde mi, že to vše jen potvrzuje jeho predikce.

Nevím, jak to Kurzweil dělá, ale byl schopný si promítnout časovou osu a zrychlení technologií. Každá technologie historicky procházela akumulací poznatků a nebylo možné, aby nebyla vynalezena. Typicky v historii matematiky derivace a integrály vynalezlo dva až tři lidé zhruba současně, protože už akumulace zkušeností byla natolik velká, že nebylo jinak možné je neobjevit. Podobně je to i dnes – během jednoho až tří let výsledkem akumulace znalostí přicházejí dvě nebo tři osoby s průlomovými objevy. Právě teď stojíme u takového velkého okamžiku – v průběhu tří let dojde ke skokovému posunu v naší práci s informacemi a technologiemi.

Pro ty, kteří jsou právě teď v tom věku, kdy se musí přizpůsobit, to bude náročné, ale zároveň to zpřístupní nové možnosti. Když mluvíme o historii, co ty vnímáš jako nový internet? Je to přechod do online prostředí, nebo něco většího? Jsou to „počítače“ v širším smyslu?

Myslím, že to jsou jakoby nové způsoby počítání – nové formy práce s informacemi, které změní vše. A děje se to například proto, že doposud jsme informace zpracovávali z knih a čtením, ale neměli jsme tu historickou zkušenost. Před vznikem knih a tisku se informace a příběhy vyprávěly ústně a lidé si je museli zapamatovat. Nyní se médium mění: kniha byla nosičem informací, ale nyní jím může být umělá inteligence, do které nahromadíme všechny znalosti a se kterou budeme následně interagovat.

Jak s tím budeme pracovat? Jaký k tomu máš postoj? Jsi stále technooptimista? Je to jen další technologická revoluce? Vždy jsme se obávali změn, ale nakonec přinesly víc dobrého než zlého? Nebo vidíš nějaká zásadní rizika, podobně jako u jaderných zbraní či jiných potenciálně nebezpečných technologií?

Krátkodobě se lidé vždy báli. Když projel první vlak, lidé si mysleli, že vyplaší krávy a nebudou dávat mléko. Když se objevil střídavý proud, také vyvolával obavy – stejně jako dnes. A tak stáří technologií přináší nové výzvy, ale dlouhodobě to určitě přinese pokrok.

Nechci filozofovat, ale člověk nemusí být konečnou fází inteligence na této planetě. To je podle mě nádherný závěr našeho dnešního datatalku s Ivanem Kutělem.

Ivane, myslím, že bychom mohli v této debatě pokračovat dlouho a těším se na další speciál. Rád bych třeba udělal nějaký futuristický transhumanistický nebo – jak to poslouchám – posthumanistický díl.

Díky moc a těším se, co zase Google vymyslí a jak nám to přijdeš ukázat.

Tak jo, díky moc, čau.

A to je všechno. Děkujeme, že jste doposlouchali až sem, a také děkujeme našim partnerům: Big Hub, Recombi, Intex, Nano Energies, LiveSport, Saska, Bystrítum, Colors of Data, Revolba AI a Gudata.

Pokud vás zajímá více z české datové scény a datových technologií globálně, zanechte nám svůj e-mail na datatalk.cz, nebo nás navštivte na některém z našich meetupů na datamesh.cz.

Nechť vás provází data.

Podcast

Data Talk #62: Ivan Kutil (Appsatori)

Strojový přepis

Odebírejte Data Talk