Data Talk #89: Jan Romportl (Elin.ai)

V tomto díle Data Talk podcastu přivítali moderátoři Karel Šimánek a Jirka Vicherek legendu české AI scény - Honzu Romportla. Společně projdeme Honzovu kariéru, od začátků v akademické sféře, přes jeho působení v rámci O2, kde za několik let vybudovali AI centre of excellence pro celou PPF pojmenovanou Dataclair, až po jeho současný startupový projekt Elin.ai, který vyvíjí "antivirus pro mozek", osobního asistenta pro Generaci Z, který jim pomůže se lépe bránit negativním vlivům současné digitální doby. Celá cesta je proložena tématy etiky v umělé inteligenci, komentáři na růst důležitosti AI v byznyse a společnosti a zakončena důležitým poselstvím - podle Honzy totiž stojíme před bezprecedentním rozhodnutím, kam se lidstvo bude dál ubírat.

Partnerem tohoto dílu je Google Cloud Summit Czech Republic, konference 12. června 2024 v Kongresovém centru Praha. Více o akci se dozvíte na oficiálním webu: https://cloudonair.withgoogle.com/events/summit-czechrepublic-24

Strojový přepis

Dobrý den, mé jméno je Jirka Vicherek.

Ahoj, tady Tarka Rošmánek. Vítáme vás u dalšího dílu DataTalku.

Dnes zde máme legendu umělé inteligence, jak to říkal Jirka. Máme zde Honzu Romportla. Ahoj, Honzo.

Ahoj, ahoj.

Zakladatel Ellen AI.

Musím říct, že se stydím, když mě nazýváte legendou. Pokud mě chcete záměrně uvádět do rozpaků, tak v tom můžete klidně pokračovat. Stačí říkat Honza, ty tituly nechme stranou.

Než přejdeme k našemu rozhovoru s Honzou Romportlem, chci vás znovu pozvat na Google Cloud Summit Czech Republic. Program je rozdělen do pěti bloků a je nabitý k prasknutí.

Na Mátkou se můžete těšit na startupové povídání s Kebulou, dvě přednášky od Rohlik.cz, jedna z nich je právě o Kebule. Vodafone bude mluvit o tom, jak buduje vlastní Data Ocean, protože jim jezero evidentně nestačilo. A mnoho dalšího.

Hodně se to točí kolem dat a umělé inteligence, ale přednášky jsou také o e-commerce, klasickém softwarovém vývoji, DevOps a startupech.

Přijďte se s námi a dalšími setkat na Google Cloud Summitu 12. června v Kongresovém centru Praha. Odkaz najdete v popisu tohoto podcastu, nebo si to jednoduše vyhledejte na internetu.

Honza je bezesporu jednou z nejvýraznějších osobností české scény umělé inteligence, který měl nálepku „AI before it was cool“. Dělá zde už dlouho dobrou práci a přináší velkou osvětu.

Dnes se podíváme, kde to všechno začalo, jak se trh, data science a implementace AI za ty roky, co Honza v oboru je, posunuly. Také se zaměříme na některé negativní aspekty a jak se na ně připravit, co lze dělat s riziky spojenými především s generativní umělou inteligencí, protože to je Honzova nová mise.

Tak jdeme na to. Začněme od začátku. Každá legenda má svůj začátek. Budu tě trochu záměrně trochu zkoušet, ale myslím si, že mnoho osobností, které takto reprezentují AI a mají hlas i v byznysu, zde není.

Kdy ses poprvé setkal s umělou inteligencí a kdy jsi si rozhodl, že to bude tvůj směr?

To už bylo někdy na Gimplu, v druhé polovině devadesátých let. Nějak jsem se nadchnul pro umělou inteligenci. Pamatuji si, že jsem tehdy v Delfích programoval nějaký multiagentní systém, třeba mraveniště, nebo něco podobného.

Zároveň jsem měl jako každý takový člověk tehdy silné humanitní přesahy. Byl jsem takový rozervaný levicově básnický, přestože to nevypadalo, měl jsem přístup „punk's not dead“.

Jako každý takový rozervaný puberťák jsem toužil po nějaké transcendenci a věřil, že lidské vědomí musí mít hlubší smysl. Umělá inteligence mě však hodně rozčilovala.

Věřil jsem, že existuje nějaký magický faktor X v lidském vědomí a duši, a proto jsem se rozhodl studovat umělou inteligenci, abych dokázal, že to celý nejde.

Teď střih — a nepodařilo se mi to. Už si nemyslím, že v člověku je něco transcendentalního. Kdybychom chtěli hledat transcendenci, museli bychom asi jít na hranice času a vesmíru.

Takto se to však stalo. V devadesátých letech jsem už měl pocit, že cesta k lidskému myšlení vede přes přirozený jazyk.

Rozhodl jsem se proto dělat něco, kde je umělá inteligence, přirozený jazyk a zpracování přirozeného jazyka, řečové technologie.

Zároveň jsem měl trochu zvláštní směřování a chtěl jsem studovat na Filozofické fakultě amerikanistiku, anglistiku, lingvistiku, fonetiku. Tam mě naštěstí nevzali, takže jsem šel studovat do Plzně.

Do Plzně jsem šel na Fakultu aplikovaných věd, studovat kybernetiku a umělou inteligenci se zaměřením na řečové technologie. Tam to všechno začalo.

Honzo, prosím tě, pro nás mladší, kteří mají představu, že ty nejlepší IT školy pro AI jsou v Praze nebo Brně, proč jsi šel zrovna do Plzně?

Myslím, že Plzeň potom postihla taková smutná tragédie.

Právnická fakulta zde měla vlastní řízení, které bylo špatné, ale Fakulta aplikovaných věd měla v té době poměrně silnou reputaci, zvláště v oblasti zpracování přirozeného jazyka.

Existovala velmi úzká spolupráce mezi studentským matematicko-fyzikálním fakulty a Katedrou kybernetiky v Plzni. To se mi opravdu líbilo.

Myslím, že tehdy to byla nejlepší věc v oblasti řečových technologií v Česku.

Pokud si mám představit, jak tehdy technologie vypadala: stačilo napsat pár textů na Windows a poslechli jste si syntézu písmenko po písmenku. To nebyla příliš kvalitní úroveň?

Ne, to už bylo výrazně lepší. Řečová syntéza, které jsem se věnoval, byla klasická konkatenativní syntéza.

Nahrajete deset tisíc vět, profesionálního mluvčího ve studiu za dokonalých akustických podmínek, z nichž se segmentují fonémy. Používaly se automatické metody, založené na skrytých Markovských modelech.

Tyto skryté Markovské modely byly od 70. let po dobu zavedení rekurentních neuronových sítí univerzálním „švýcarským nožíkem“.

Pomocí nich se tvořily jazykové modely, segmentace a řečová syntéza.

Při syntéze se jednotlivé části skládaly dohromady.

V osmdesátých a devadesátých letech se snažilo dělat i modelování signálu, ale ty modely byly příliš lineární, což způsobovalo kývající, plechový zvuk.

Přelomem tisíciletí bylo využití konkatenativní syntézy, která již dosahovala mnohem lepší přirozenosti, protože se skládaly malé vlnové formy na úrovni hlásek, které se pak vyhlazovaly.

Tento proces se stále vylepšoval, až byl nakonec nahrazen neuronovými sítěmi.

Chtěl jsem říct, že rekurentní neuronové sítě, které následují, vlastně princip fungování z Markovských modelů převzaly.

Stále generuješ další symboly, další písmena a podobně.

A dnes směrem koncového řešení to vypadá tak, že vstupem neuronové sítě je waveform v jednom jazyce a výstupem waveform v jiném jazyce, bez nutnosti mezilehlých lingvistických a sémantických vrstev.

To přináší extrémně zajímavé problémy, například jak poznat, zda je řeč přirozená či nikoliv.

Když máte rozpoznávání řeči, tak známým ukazatelem je word error rate.

Ale jak rozpoznat, že syntetická řeč obsahuje nějaké chyby nebo působí „uncanny“, to byla například věc, kterou jsem řešil ve své dizertační práci.

Ty ses tehdy opravdu ponořil do univerzitního prostředí, studoval jsi hlouběji.

Teď když mluvíš o svém studiu a vzniku technologie, tak velká část našich posluchačů se setkala s produktem tvé tehdejší práce.

Jo, to bylo dříve. Kdybych věděl, že to tak využiješ, tak bych to asi ani nezmiňoval.

Nevím, jak je to dnes, ale velmi dlouhou dobu řečová syntéza, která se používala u hlásičů v metru, obsahovala komponenty z mé dizertační práce, týkající se prozódy, intonace a podobně.

Takže když slyšíte mužský hlas oznamující, že eskalátory na patře jsou rozbité, tak je to naše syntéza.

Mám však větší hrdost například na projekty z roku 2011–2012, kdy jsme spolupracovali s profesorem Betkou z ORL kliniky v Motole.

Profesor Betka je legenda české otorinolaryngologie.

Snažili jsme se vytvářet řečovou protézu pro pacienty po totální laryngektomii.

To znamená, že nemocný má vážný nádor v krku, odstraní mu během 14 dnů polovinu krku, ztratí hlas a přežít je už otázka.

To je hodně devastující zpráva.

S tehdejšími technologiemi, tedy před 10 lety, jsme se snažili nahrát 100 vět od pacienta, který je v absolutním stresu v čekárně s rozbouřenou hlavou.

A docela se nám dařilo.

Dnes je to úsměvné – stačí webová služba zadarmo, nahrajete pár vět a máte vlastní hlas.

Ale v té době to byla průkopnická věc.

Podobné zřejmě jako Stephen Hawking?

Ano, ale aby to znělo přirozeně.

Stephen Hawking byl v tom těžká situace, protože svůj hlas nikdy nepoznal.

Tady však šlo o to, že pacienti po té zhoubné diagnóze často raději odmítli radikální chirurgické řešení, než by chtěli po operaci žít zmrzačený.

Zjistili jsme, že když měli možnost získat smartphone s nahraným vlastním hlasem před operací, zvyšovala se pravděpodobnost, že se nechají podrobit operaci.

Jak to fungovalo, bylo to opět na bázi konkatenativní syntézy.

To bylo velmi náročné na kvalitu hlasu, protože signálové modelování ještě nebylo dostupné.

Dospěl jsi pak i ke studiu v zahraničí?

Ano, to už jsem měl skoro hotovou dizertaci.

Mezitím jsem vystudoval také Filozofickou fakultu, protože mě bavily oblasti vědomí a AI bezpečnosti.

Už od roku 2010, což je docela zvláštní, jsem se tím zabýval.

Velkou roli v tom sehrál můj tehdejší učitel a mentor Ivan Havel.

To je neskutečná legenda české umělé inteligence, bratr Václava Havla, prezidenta.

Zakladatel a dlouholetý ředitel Centra teoretických studií v Praze na Karlově univerzitě.

Navštěvoval jsem jeho slavný seminář „Přirozené a umělé myšlení“, který mě naprosto transformoval.

V té době jsem si myslel, že chápu, co se děje.

Uvědomil jsem si, že v lidském myšlení asi není transcendentní faktor X, a že umělé myšlení lze realizovat nebiologickou cestou.

Ivan Havel však dával obrovský přesah k filozofii.

Po dizertaci jsem zjistil, že mi nestačí být jen u technologického základu, chci být na rozhraní human-machine interaction.

Tehdy mě také začala bavit témata AI safety a otázka, co když to začne skutečně fungovat.

V té době Ben Goertzel představil pojem Artificial General Intelligence (AGI), což jsme okamžitě přijali.

Naskytla se i příležitost jít na Future of Humanity Institute (FHI) v Oxfordu za Nickem Bostromem.

Můj mentor tam byl Andrew Sandberg, velmi zajímavý člověk.

Zjistil jsem však, že FHI právě nedělá AI safety, proto jsem se věnoval problémům human cognitive enhancement.

Tehdy jsme o Neuralinku nemohli vůbec mluvit, ale koncepty byly rozpracované.

Po návratu jsem se pokusil něco podobného založit na české univerzitě.

Tak vzniklo Oddělení interakce člověka a stroje v Plzni, kde jsme dělali naše „punkové věci“.

Co je to za rok?

Na FHI jsem byl v roce 2011. V letech 2012–2015 jsem se přecházel od aplikované AI v řečových technologiích k human-machine interfaces.

V té době jsme začali spolupracovat s profesorem Betkou, ale také třeba s Jiřím Horáčkem z Národního ústavu duševního zdraví, tehdy Psychiatrické centrum Praha.

Testovali jsme experimenty, kdy pacienti chodili na magnetickou rezonanci a nosili Google Glass.

Zjišťovali jsme, co to dělá s mozkem.

Měl jsem i diplomanta, který řešil řečovou syntézu tím způsobem, že posluchač měl na hlavě EEG a poslouchal řeč.

Neurokorreláty měřily kvalitu nebo nekvalitu řeči.

To byla veliká radost.

Ale současně mě velmi frustrovalo klasické univerzitní pokrytectví, mrhání zdroji, lidskou energií, nadšením, a podivné řízení státem financovaných grantů.

Začal jsem mít pocit, že pokud chci měnit svět k lepšímu, univerzitní prostředí v Česku není nejlepší místo.

Pokud jste na Oxfordu nebo Stanfordu, tak je to asi v pořádku, ale sedět na české univerzitě a hrát si, že měníte svět k lepšímu, prostě nefunguje.

Omlouvám se za upřímnost, ale stále si za tím stojím.

Vím, že mnohé lidi tím naštvu. Nemám nic proti jednotlivým lidem, kteří tam jsou úžasní osobně.

Ale instituce jako celek jsou značně nefunkční.

Fundamentálně je rozbitý systém financování a incentivizace, což dělá z těchto institucí špatné entity, ne však z jednotlivců.

Těch lidí. Stačí se podívat jenom na některé dizertační práce, které z univerzit vycházejí. Výjimka samozřejmě existuje, ale kvalita těch dizertací a ta průlomovost jsou v podstatě mizivé ve srovnání se zahraničím. Asi nesledujeme české dizertace dostatečně, jestli se tam neobjeví nějaký úplně nový přínos… Za poslední tři, čtyři roky se to však i ze světového měřítka, například podle posledního Stanford AI reportu, stává zřejmým: vliv univerzit na špičkový vývoj AI je skutečně mizivý. To je potom takové zvláštní sociokulturní tribální exhibování na neurčité úrovni, ale jinak…

Myslím, že univerzity v tomto směru v oblasti AI dost ztrácejí. Vývoj a výzkum (R&D) se přesunul jinam, a já osobně se také přesunul. Když jsem se po škole rozhodoval… Ono to bylo tak, že jsem od roku přibližně 2010 do roku 2015 působil na plzeňské univerzitě jako vedoucí oddělení, které se jmenovalo Oddělení mezioborových studií, což byl takový kryptický název, protože jsme si tam mohli dělat, co nás bavilo. Byla to oblast na rozhraní člověk-stroj.

Později jsme oddělení oficiálně přejmenovali na Oddělení interakce člověka a stroje. Pamatuji si, že jsem tehdy získal velmi dobrý grant. V té době jsme pořádali konferenci Beyond AI, na kterou bych téměř zapomněl, ale web beyondai.cz je dodnes funkční, což mě naprosto překvapilo. Konference probíhala mezi lety 2011 a 2013, a ročník 2013 jsme nazvali Artificial Golem Intelligence, aby tam byla aluze na AGI (Artificial General Intelligence). Na této konferenci jsme řešili přesně ty věci, které se nyní staly realitou. Lidé teď říkají: „Ježišmarja, to tehdy bylo nějak promyšlené.“ To mě opravdu bavilo.

Později se mi podařilo získat opravdu skvělý grant – velký a z norských fondů, což bylo na tu dobu špičkové. Přesně v roce 2014 to bylo asi 400 přihlášek na granty a jen 14 jich bylo podpořeno, ale já měl štěstí. Bohužel mě zatěžovala příšerná interakce s Ministerstvem školství, která mě úplně vyšťavila, až jsem úplně vyhořel. Místo abych dělal reálný výzkum, musel jsem se s úředníky dohadovat a předstírat, že něco dělám. Musel jsem předstírat, že publikuji a to mě naprosto vyčerpávalo.

Říkal jsem si, co teď? Už jsem v tom komerčním světě a na internetu jsem zjistil, že se začíná objevovat jako „sexy“ výraz data scientist. Říkal jsem si, že bych to mohl být já. Jako už od roku 2015 jsem byl rozhodnutý s univerzitou odejít. Začala mě totiž ohrožovat habilitace, že si musím udělat docenturu, což mě nelákalo, protože jsem nechtěl hrát politické hry spojené s tím. Takže jsem zjistil, že existuje LinkedIn. Byl jsem zmatený z univerzitního světa a vůbec jsem nevěděl, jak funguje reálný svět.

Na LinkedInu byly různé inzeráty, tak jsem tam „píchl prst“. První příběh je zajímavý: hledali tam manažera data science v MSDčku, což je klasická farmaceutická společnost. Přihlásil jsem se, ale tehdy si mě nerozebrali, protože prý potřebovali někoho podstatně zkušenějšího a schopnějšího. Tak jsem se do MSDčka nedostal.

Poté jsem byl trochu otřesený, ale věnoval jsem se vzdělávání. Na univerzitě to je možné – když tam tři měsíce nepřijdete, nikdo si toho nevšimne. To je mimochodem jedna z mála výhod univerzity – můžete předstírat, že pracujete, a oni předstírají, že vás platí. To je stejné jako někde ve velkých korporacích, ne?

Když jsme u toho, měl jsem tu vysokou úroveň znalostí, ale nějakou i aplikovanou zkušenost. Co znamenalo doučit se praktické věci? Byly to nástroje? Asi v mém případě to bylo hodně o tom, že jsem na univerzitě částečně dělal spin-out firmy naší katedry SpeechTech, kde jsme kódili řečový syntetizér. Takže neměl jsem úplně praxi nulovou, programoval jsem v C docela dost, ale byla to stále stará doba, asi 15 let zpátky, a nebyli jsme úplní profesionální softwaroví inženýři.

Vše jsme dělali v MATLABu, všechny modelování bylo přes MATLAB. Tam jsem narazil, protože jsem si prošel všechny kurzy v R v letech 2014–2015. Python už se tehdy začínal používat, například u dizertací v roce 2012–2013, kdy ho používal můj kolega Honza Švec, průkopník Pythonu na katedře. On nás odnaučil Perlu a naučil Python. Byl autorem českého překladu tehde významné knihy o Pythonu.

Ale Python mi tehdy nepřišel vhodný pro firemní data science. Chybělo pořádné prostředí jako Jupyter Notebook a podobně. Zato RStudio bylo dobré kvůli pohodlí. Naučil jsem se řešit běžné problémy v oblasti credit scoringu a dalších, a zjistil jsem, co znamená slovo „ČERN“ (černí). To jsem dříve nevěděl. Šel jsem do firmy a nevěděl jsem, co znamená „černovat“. To jsem se naučil během tří až čtyř měsíců.

Pak jsem koukal na LinkedIn a uviděl nabídku v O2. Říkal jsem si, že O2 bude dobrá firma, i když jsem nevěděl, že už v té době nepatří Telefónice. Přihlásil jsem se, dostal pohovor, vzali mě a začali jsme stavět data science tým. Takto jsem odešel z univerzity.

Rok 2015 – nastupuji do O2, mého prvního zaměstnání mimo akademickou sféru. První půlrok jsem byl úplně dezorientovaný a „valil oči“, ale protože jsem měl management pozici „middle manažera“, musel jsem se tvářit, že vím, co dělám. Velmi mi pomohlo poznání, že takhle to tam funguje u spousty lidí. Stačí, když si manažeři „hrají“, že vědí, co dělají, a zbytek přijde sám.

Měl jsem asi štěstí, že jsem dělal něco správného a že to bylo relativně funkční. Můj tehdejší tým data science byl směšně malý, ale management se nějak předjednal, že dostaneme relativně velký headcount. V korporaci, když máte schválený headcount, můžete začít přijímat lidi.

Někteří lidé asi neseděli s mým stylem vedení, ale začal jsem se obklopovat skvělými kolegy a tým rostl. Začali jsme stavět řešení v době „big data“ hype, kdy bylo cool sbírat velké objemy dat, aniž by si lidi přesně uvědomovali, co to znamená.

Nám se začalo dařit doručovat reálné výsledky. Například nástroje, které jsme měli, nemusely být převratné, vlastně to byl dost rozbitý systém, nelze jej dobře upgradovat, Spark byl v zastaralé verzi, nicméně jsme to rozjeli a bylo to celkem dobré.

Co považuji za dobré rozhodnutí, a co i uvnitř O2 a ve skupině PPF dobře funguje, je přístup k organizaci. Typicky se říká, že například podle Nassima Taleba jsou taxikáři v New Yorku „anti-fragile“, zatímco korporace bývají „fragile“, tedy křehké.

Korporace totiž permanentně tlumí a překrývají reálné vlivy vnitřního světa, až jednoho dne zkolabují nebo celá divize zmizí – někdo vypadne, propustí se tisíc lidí apod. Lepší je, když se firma stane „anti-fragile“ – tím, že denně pociťujete tlak dělat věci dobře, doručovat výsledky, měřit a nebýt v omylu.

Tak funguje i evoluce jako anti-fragilní systém. A O2 pod vedením PPF se stala anti-fragilní organizací, což znamená, že každodenní tlak na výsledky je opravdu přítomen.

Tento přístup mi osobně vyhovoval: sice bez korporátních benefitů, bez služebního auta pro middle management, ale zase jste obklopen skvělými lidmi, nejen mémi nadřízenými, ale i vrcholovým managementem a C-level lidmi, a pracuje se s nimi opravdu dobře. Máte velkou odpovědnost, ale i široký mandát a volné ruce.

Náš tým data science měl vlastní PNL, tedy musel si sám vydělat peníze, což je neobvyklé, protože většina podobných týmů bývá čistě nákladová položka a peníze na ně „jdou shora“. My jsme dělali mnoho B2B externích projektů, které generovaly revenue (výnosy), a alespoň maličký zisk.

Pokud jsme měli vyšší zisk (EBITDA), měli jsme volnou ruku rozšiřovat tým. Nakonec jsme dosáhli přibližně 40 lidí v rámci jedné české business jednotky, tedy datově-scientistický tým střední velikosti.

Důvod, proč to fungovalo, byl ten, že tým uměl vydělávat peníze, a přitom polovina lidí dělala velké interní projekty, které přinášely stovky milionů korun do primárního businessu, zatímco druhá polovina se věnovala B2B projektům, které generovaly přidané příjmy.

Tím pádem jsme pro mateřskou společnost prakticky vůbec nepředstavovali náklad, protože jsme si na sebe vydělali a přinášeli komplexní modely podpory rozhodování pro zákazníky, nejen v oblasti marketingu, ale i například retence zákazníků.

Zákazníci zanechávají datové stopy, a když systém správně analyzuje, co se děje – například někde něco nefunguje, něco zákazníkovi není jasné – můžeme poskytovat automatický feedback, třeba aby zákazník obdržel proaktivní telefonát od poradce (autoguide).

Nejde tedy jen o zvyšování upsellu a cross-sellu, ale opravdu o udržování zákaznické retence.

Většina našich projektů spadala právě do této oblasti. A to je podle mě důležité i pro lidi, kteří nás nyní sledují a snaží se budovat podobné týmy ve svých firmách.

Ukázalo se nám totiž, že se nejvíce vyplatí mířit, pokud začínáte a chcete mít dobrý track record, na komerční divizi. Tedy ten ultimátní business owner by měl být přímo front-end, například call centrum. Pokud děláte systémy strojového učení a data science, které snižují náklady, je to dobré, ale nákladová spodní hranice je limitem.

Například zvyšování příjmů (revenue) je téměř neomezené zhora a má lepší přijetí v celé firmě. Pokud můžete firmě říct „tohle nám přinese navýšení tržeb takto a takhle“, přijatelněji to projde.

Úspory na nákladech jsou druhá nejlepší cesta.

Nejtěžší je dělat pro technologickou divizi, kde se často projektům těžko měří návratnost. Například optimalizace BTS (base transceiver stations) byla zajímavá, ale náročná na přesun do obchodní pipeline v technologické nákladové divizi.

Proto je lepší nejprve vybudovat pilíře v komerční části.

Na to jsem do jisté míry narazil, protože v té době jsem také začínal první práci mimo univerzitu.

Pamatuji si, jaká byla éra big data a jak se současně objevoval data science. Typické případy byly analýzy churnu nebo prodloužení smluv (prolongace).

Big data byla většinou záležitostí techniků, řešili to CTO a jim podobní.

Hlavní přínos datových týmů byl v reportování managementu a businessu.

Postupem času se data science stávalo samostatnou značkou, což i v běžných korporacích, například v PPF, bylo tak, že jsme byli většinou „navěšeni“ pod komerční divize.

Samozřejmě jsme měli skvělé vztahy s CTO, protože jsme byli i konzumenti technologií, například…

[Text končí neúplně.]

A signalezačních dat, která jsme například, jako klasicky síť (Network) měla, jsme ukládali v Big Data platformě. My jsme realizovali například migraci dat – můj dnešní spoluzakladatel v Elin, Petr Stanislav, velmi pomohl s migrací dat z on-prem Hadoopu na kompletní přechod do Azure, včetně signalezačních dat a dalších informací. V tu chvíli se úplně otevřela možnost práce s machine learningem. Prostě pokud můžete vyprovižnovat nějaký stroj a dostat se k datům, která máte uložená tam, to extrémně pomohlo.

Poznámka moderátora: Petra jsme tady už měli v jiné epizodě. On mi dneska… Pokud se někdo zajímá o větší detaily, může si pustit ten speciál. Možná tam i zmínil něco o tehdejší migraci, nevím.

A ty jsi se zmínil ještě o těch externích případech. Tam bylo hodně, ale dva nejstarší, nejzajímavější a největší se vždycky týkaly dvou proudů. První byl mobility projekty, tedy doprava k obchodním centrům. Prostě tím, jak máte taková reziduální signalezační data, to znamená, jak mobilní stanice anonymně blikají na BTS. Nevíme, kdo to je, je to v podstatě anonymizované. Měří se například, kolik lidí najíždí na silnice a tak dále. Takže produkty postavené nad tím zahrnovaly traffic, mobility, footfall analysis. Jak se jmenoval ten projekt, produkt od O2? Šlo to od vás, něco jako Albertina? Ne, to bylo mimo nás, bylo to i pravděpodobně z dob poměrně starších, myslím před rokem 2015. Já to nepamatuji, jen vím, že existovalo. Produkt, který teď funguje, je O2 geodata.

Druhý projekt, teď si přesně nevzpomenu, jak se marketoval, ale dělali jsme ho pro Big Board. To je vlastně projekt nebo produkt na měření sledovanosti jednotlivých billboardů, protože těch reklamních ploch je spousta.

Druhý proud, který mě skutečně bavil, byl Telco scoring. To je řešení pro případ, kdy chcete jít do banky pro úvěr, ale banka vás nezná, proto vás odmítne. Řekne náhle, že vás nezná a nepodá vám pomocnou ruku. Když ovšem podepíšete souhlas, banka přes operátora zjistí informace z vašeho telefonního čísla a vyjde jí skóre. To je přesně ten přístup, kdy banka získá přístup k neenergetickým datům, samozřejmě při souhlasu zákazníka. Najednou máte šanci na úvěr, aniž byste byli mladý, bez track recordu nebo třeba bez vyplněného daňového přiznání – typické situace, které se běžně vyskytují.

A co se týká tvé expertizy – předpokládám, že jsi byl license manager – zmínil jsi mnoho případů, ale tvoje hlavní expertiza je syntéza řeči. Zjistil jsem – a platí to i dodnes –, že je velmi důležité netrvdit pouze na té expertize, na které jste zůstali už u dizertace. To je podle mě obrovský problém spousty dnešních startupů, které jsou navázané na granty, protože ve skutečnosti nemají reálný business model. Často jsou to spin-outy z univerzit, kde problém spočívá v tom, že děláte dizertaci, milujete téma, pak chcete pokračovat, publikujete, a když vám někdo řekne, že byste měli komercionalizovat, rozhodnete se jít do transferu technologií. Ale tvrdohlavě pak děláte dál to samé, co jste dělali na dizertaci či diplomce. To podle mě je chyba.

Doporučil bych každému, aby změnil obor – já jsem například na řečových technologiích působil jen do určité doby, pak už jsem na ně nesáhl. Dělal jsem credit scoring, analýzy různých business věcí, prediktivní modely, asociační analýzy i exploratorní věci. Teď se věnuji úplně jiným věcem ve startupu.

Můžeš to pochopit tak, že ten use case řečových technologií tehdy nebyl dostatečně perspektivní, nebo jsi to prostě nechtěl dělat kvůli tomu, co jsi zmínil? Asi kdybych se tehdy přidal do nějakého týmu s řečovými technologiemi, pokračoval bych v tom. Je to spíše náhoda, že jsem z toho vypadl, ale jsem za to rád. Já totiž řečové technologie stále baví, zejména jazykové modely, zvlášť teď, když mám svět zpátky ve svých rukou. Možná se k tomu ještě dostaneme, co jazykový model reálně je. Ale jsem rád, že jsem se takto změnil, že mě business přinutil.

Mám jinou otázku ohledně tvé evoluce – najednou se z tebe stal data scientist, pak manažer. Tvé business jednotky rostly, dařilo se jim. Jak jsi rostl ty jako manažer? Měl jsi nějaké důležité zkušenosti, které můžeš doporučit našim posluchačům, kteří čekají na vedení svého prvního komerčního týmu?

Zjistil jsem své silné a slabé stránky v managementu. Myslím, že nejsem excelentní people manažer. Nicméně umím lidi motivovat, ale potřebuji spolupůsobit s někým, kdo zvládá operační řízení a people management těch lidí. Když není jiná možnost, tak to dělám já.

Co jsem za léta zjistil, je to, že byste měli dělat výrazně více toho, na co jste opravdu dobří. Samozřejmě, pokud máte kolem sebe kompetentní lidi – nechcete mít žádné jiné než kompetentní –, každý je pak schopný dodat skvělé výsledky. Já jsem sám byl schopný dělat úplně všechno, což je v začátku startupu normální, ale dříve nebo později musíte část práce delegovat, abyste neshořeli. To jsem zvládl. Když jsem se stal ředitelem v O2, nabral jsem skvělé a šikovné manažery, kteří řešili různé kompetence. To byla první věc, ale samo od sebe by se to nestalo. Na začátku si musíte odkroutit tu praxi, nejde stát se seniorem během pár týdnů. Musíte si tu práci postupně odpracovat a nabrat zkušenosti.

Další velmi důležitá lekce je, že drtivá většina problémů vychází z komunikace. Přirozený jazyk je totiž nástroj k naší vzájemné synchronizaci a sdílení společné reality, což je extrémně zásadní. Proto už nehledám lidi jen s mega technickou kompetencí. Potřebuji univerzální lidi, kteří umí dobře rozumět lidské komunikaci.

Možná se ještě vrátíme k tomu, jak jsi říkal, že umíš lidi dobře motivovat, a zároveň jsi chtěl dělat všechno najednou. Spočívala ta motivace v tom, že jsi lidi táhl za sebou, že jsi je nadchnul tím, že to děláš společně s nimi? Nebo jsi používal jiný způsoby motivace?

Na začátku to tak bylo, ale nakonec jsem zjistil, že pokud musíte lidi motivovat příliš často, tak asi nejste obklopen správnými lidmi. Pokud manažerům stále připadá, že musí lidi táhnout, je něco špatně v nich samotných. Motivaci bych spíše spojil s tím, aby lidé věděli, že věci, na kterých pracují, mají smysl. Že to není nějaký nesmysl, který si jenom provozujeme.

Dbal jsem na to, aby měli práci s jasným přesah do byznysu a také, aby měli pocit, že dělají něco užitečného i jinak než jen kvůli byznysu. Například jsme velmi intenzivně dbali na projekty týkající se diferenciálního soukromí, anonymizace a matematické spravedlnosti u credit scoringu – to všechno ještě před tím, než vznikl AI Act, který tyto věci reguluje.

Myslím, že mnoho dobrých lidí tam není motivováno jen penězi, to mohou získat jinde. Potřebují smysluplnou práci, ne nějaký „bullshit“.

Když navážu na telko data jako na zlatý důl, protože se s nimi dá dělat mnoho věcí – stávalo se vám, že jste museli nějaký požadavek nebo projekt odmítnout z etických důvodů?

Ano, stávalo se. Odmítali jsme spoustu projektů, ale většinou kvůli nedostatku kapacit. Všichni si navykli, že přijde žádost „vytáhni to“, ale prostě nejde.

Myslím, že etické standardy jsme nastavili extrémně vysoko, takže hodně interních projektů bylo v pořádku, ale mnohdy ani samotním lidem uvnitř firmy nenapadlo, že určitý projekt nemusí být úplně ideální.

Mechanismy jsme měli vypracované velmi dobře, s jasným zaměřením na byznys, ale i etickou stránku věci.

Samozřejmě byly i externí požadavky a projekty. Například ministerstvo pro místní rozvoj vypsalo veřejnou soutěž na Telco projekt, jehož splnění by vyžadovalo v podstatě nezákonnou práci s daty. To jsme napadli s právníky – takovéto záležitosti se řešily.

Nemyslím si, že by se něco dělalo ve zlém úmyslu, spíše šlo o neznalost.

Pojďme se podívat na konec korporátní éry v PPF. Potom vznikl Dataclear.

Vznik Dataclearu přišel ve chvíli, kdy jsme se v O2 opravdu úspěšně rozvíjeli. V rámci PPF skupiny vznikla silná skupina PPF Telco, která zahrnovala O2 Česko, O2 Slovensko a postupně se přidali i tři Telenoři ze Srbska, Bulharska a Maďarska.

Nevznikla ale obrovská centralizovaná skupina s gigantickým HQ, které všechno řídí shora. PPF má úplně jiný mindset – jedná se o tenkou vrstvu několika málo manažerů sedících na PPF Gateu. Je to absolutně lean struktura, což je někdy výhoda i nevýhoda, ale většinou spíš výhoda.

To znamená, když některá business unit má kompetenci používanou celé skupině, neřeší se to z centra, ale business unit je zodpovědná za šíření „světla“ po celé skupině.

My jsme se stali právě s tímto pro AI.

Já jsem si tehdy vysnil, že budeme dělat machine learning research pro biotech, například na zrychlení výzkumu v oblasti imunoterapie a léčby rakoviny. Málokdo ví, že jsme měli asi čtyřčlenný tým v Datacleru v Telku, který se věnoval výzkumu rakoviny, což mě fakt bavilo.

Vše mělo stále pozitivní EBITDA, pořád jsme si na sebe vydělávali.

Byla to extrémně zajímavá zkušenost, jak v dobrém, kdy jsem jezdil za CEO a dohadoval spolupráci. Potkal jsem skvělé lidi v top managementu PPFky.

Ovšem je tu i druhá stránka – snažit se někomu pomoci, když se nechce nechat pomoci, často se stává, zejména pokud přijdete z Prahy například do Budapešti. Tamní datoví vědci vám občas řeknou: „To jsou zase nějací chytráci z Prahy, neposlouchejte je, raději si zkomplikujeme práci.“ A pak musíte vše řídit odsud, což je extrémně náročné.

Vnitřně jsem zjišťoval, že mě to nenaplňuje. Bavily mě spíše projekty jako machine learning v biotechnologii.

Paralelně jsme začali rychle rozjíždět interní B2B projekty v Česku, nábor talentů a podobně.

Pak se ale začal svět po covidu měnit.

Za celou dobu, o které mluvím, jsem si stále zachoval filozofickou linku AI safety. Nikdy jsem ji neopustil.

Dodnes spolupracuji s Katedrou filozofie v Plzni, kde občas pro studenty pořádám podobné přednášky či workshopy.

Vždycky jsem udržoval kontakt například s Jiřím Horáčkem z NUDZ (Národní ústav duševního zdraví), bavili mě kognitivní vědy, pořádal jsem filozofické konference. Pro mě to bylo vždy koníčkem.

Což je mimochodem výhoda filozofie – vydělávat se na ní nedá až tak snadno, ale když je to hobby, je to super.

Celou dobu v korporátu jsem tedy pokračoval v této akademické linii.

Kolem roku 2019, kdy jsme se začali dostávat víc do vlivu hybridního působení – například ze strany Ruska –, se začaly více objevovat fake news a konspirační teorie.

Pak přišel covid a duševní zdraví se začalo rozpadat na všechny strany.

Začalo mě zajímat, proč inteligentní a funkční lidé, kteří mají hodnoty na správné úrovni, najednou propadají bizarním konspiračním teoriím, a kde se to děje.

V Praze se tehdy konal hackathon s názvem Roboton, který jsme spolu s Dataclerem sponzorovali. Jedno z témat byla detekce fake news.

Přihlásili se tři velmi schopní studenti, kteří vytvořili tým, a já byl na akci mentorem.

[Text končí.]

Něco vyhodnili a oni to vyhráli, že jo, prostě celý ten… Ten je oslovil. Říkám: „Hele, tohle je tak důležité, tak pojďte. Já tady, jakože mám tu pozitivní EBIdu, tak můžu trochu uříznout a uděláme tady něco přímo pro vás.“ A začneme budovat ten detektor fake news tady u nás, čistě pro Bonovihez. Prostě proto, abychom se pokusili trochu pomoct záchraně světa.

No a vlastně kluci – Matyáš, Filip, Michal – do toho pustili. Pro mě byla čest, že jeden dělal v Seznamu, druhý dělal v Deloitu, třetí v Sumu. Podle mě dali výpovědi a šli k nám. Takže jsem si říkal: „Aha, tak jsme tady v tom brandově dostatečně zajímaví, nevím, nevím, nějak je to no…“ A začali jsme vyrábět. Projekt se nejdřív jmenoval nějak, myslím AIY, a nakonec jsme přišli na jméno Brand Verify. Uvnitř O2 jsme trošičku „znásilnili“ marketingové oddělení, které pomohlo s těmi brandovými věcmi, a vzniklo Verify.

Zjistil jsem, že to bylo podle mě hlavně v létě 2021, kdy mě absolutně nejvíc bavila tahle část Verifyho ze všech prací, které jsem dělal v rámci AI uvnitř PNH. Celé prázdniny jsem tam s klukama seděl do večera, pořád jsem na to myslel – v dobrém slova smyslu, že je to taková obsedantně kompulzivní porucha, ale v dobrém smyslu, pořád na to myslím, furt to žene dál.

A zároveň jsme tehdy s Jiřím Horáčkem, významným českým profesorem psychiatrie z Národního ústavu duševního zdraví, kde byl zástupcem ředitele (ředitel byl Cyril Höschl), u piva řešili, co se děje v lidských myslích. Dochází k jakési pandemii rozkladu smysluplných modelů světa, která se projevuje jak zvýšenou sebevražedností u teenagerů, tak i inklinací ke konspiračním teoriím.

Vytvořili jsme si nějaký obrázek, jak se to děje, o čemž už některé publikace nějakým způsobem vypovídaly. V tu chvíli začala válka na Ukrajině, což znamenalo i velký informační tlak (big shitstorm). Po boku mě to permanentně vedlo směrem k AI safety. Viděl jsem se ještě s GPT-2, tehdy jsem v roce 2019 vedl na LinkedInu zapálenou flame war o tom, jak je GPT-2 skutečně podstatná věc.

Spousta lidí říkala, že je to nesmysl, že to nebude fungovat, ale AI safety implikace tam byly zásadní. A u Verify jsme také zjistili, že už to byla spíš vnitřní osobní volba a součást poznání. Je to paráda mít systém, který označuje, jestli to, co čtete, je manipulativní nebo ne, proč je to manipulativní a jak to doručit lidem, aby to mělo masový dopad.

Protože lidé, kteří si to dobrovolně nainstalují do Chromu a má to pro ně smysl, to vlastně nepotřebují. Ale někdo, kdo čte třeba Sputnik nebo Ironet, nebo i Parlamentní listy, by měl být varován, že „tohle je manipulativní, to je nějaký šoroš, Bill Gates to celé platí“ – a oni to vypnou a nebudou to používat. Nejde tedy o to, aby to fungovalo za každou cenu.

Jde o podstatu – jak se může stát, že inteligentní lidé vůbec vstupují do takových králičích nor a do rozbitých modelů světa? To má velké důsledky nejen do oblasti duševního zdraví, ale také do permanentního působení úzkostí a stressorů v online světě, což vede k nárůstu hladiny kortizolu a podobných hormonů.

S Jirkou jsme to nějak dali dohromady, společně i s Matyášem, který později stál u zrodu našeho startupu Alien AI. Řekli jsme si: „Pojďme to vyzkoušet jako nástroj AI companiona pro kohokoliv online, který pomůže člověku udržet se při smyslech a uchovat si duševní pohodu na rozumné úrovni.“

Matyáš se pak dostal asi na Stanford, což je věc, která se stává spíš náhodně. To mě osobně těší a nemám na to nic k zazlení. Takže jsme s Petrem, Stanislavem a Jirkou Horáčkem založili Alien AI jako startup, který se pokusí vytvořit AI companiona, jenž by měl chránit mysl, když jste online.

Po několika pivotováních jsme projekt omezili na cílovou skupinu Generace Z, tedy mladých uživatelů internetu. V době, kdy jsme to krásně rozjížděli a všechno bylo dobře nastavené, jsem musel učinit extrémně těžké kariérní rozhodnutí. Obvykle lidé odcházejí z korporátu, když se loď potápí, tady ale raketa startovala, ukazovalo se, že to funguje, byl to krásný okamžik.

Otočit se a jít do startupového prostředí ve věku cca 40 let s 3H – hypotékou, haranty a hladem – je velké rozhodnutí. Protože v korporaci vám každý měsíc přijde výplata; když jste ředitel, není to špatná výplata. Jít do něčeho s větším stresem a menšími penězi bylo opravdu náročné.

Takže tak – filozofická fakulta mi to zkazila, ta mi zkazila ty corporate lektvary. Mám ještě jednu věc, než se dostaneme k Alien AI a aktuální situaci, otázku ohledně vývoje stacku a změn v data science.

Popisuješ svůj příběh, jak jste si vybudovali místo v korporaci, jak jste to řídili a dávalo smysl růst nad nějaké standardy. Mluvil jsi o use casech a o tom, kde dávalo smysl technologie aplikovat. Jak jsi vnímal trh a scénu celkově?

No, GPT-2 – blbost! A právě když mluvíme o roce 2022, stalo se toho hodně. Pamatuju si ale ještě velmi dobře období před rokem 2000, kdy slovo „AI“ bylo spíše takovým obskurním výrazem. Neříkalo se „machine learning“, ale spíše pattern recognition. Moje první konference vůbec byla v roce 2002, ještě než jsem byl doktorand, v Kyjevě na konferenci, která se jmenovala OBR – byla to konference na pattern recognition, ale ve skutečnosti to byl machine learning, akorát s využitím support vector machines a podobných technologií.

Matfyzáci tehdy říkali vtip, že neuronové sítě jsou druhé nejlepší řešení jakéhokoliv problému, kde vědí, co je to nejlepší řešení – většinou nějaký obskurní statistický model. My jako inženýři jsme blbě používali neuronové sítě.

Tohle přetrvávalo až do roku 2010 a něco, kdy jsme všechno modelovali skrytými Markovskými modely. Jen jeden člověk, kterého jsem znal, Tomáš Mikolov, dělal bizarní věc a nepodlehl tlaku používat pouze Markovské modely, ale experimentoval s neuronovými sítěmi. Pak víme, jak příběh pokračoval.

Mám vtipný příběh ze svých začátků: vystudoval jsem kybernetiku a umělou inteligenci a na konferenci jsem komunikoval s finskými kolegy, kteří mi řekli „Cybernetics? That sounds very Soviet!“ Já jsem jim na to řekl a co dělám na PhD? „Artificial intelligence.“ Jeho odpověď: „That sounds very sci-fi.“ Tak jsem si říkal, že dělám něco, co je mrtvé, a PhD z něčeho „mrtvého“ směrem do budoucna. Nikdy by mě nenapadlo, že AI bude tak sexy PhD téma, jako je dnes.

Pokud jde o software, tehdy se na produkci většinou používalo C. V NLP pak došlo ke změně z Perlu na Python, což přetrvává dodnes. Rostlo to však hodně nahodile. Pokud jste dělal něco, co dnešní lidé dělají v R, v té době to bylo v MATLABu. Některé obory, například teorie řízení v průmyslu, dodnes používají MATLAB a Simulink.

Z podhoubí lidí, kteří studovali takovéhle obory, jako já – kybernetiku, control engineering a podobné – se začala formovat nová role data scientista přibližně mezi roky 2012 a 2015. Byli to lidé, kteří dělali v podstatě totéž, co dříve, ale byli „překřtění“ a dohryzní byznysu a naučili se SQL, které dříve nebylo tak běžné.

Začaly se vést spory R versus Python – to byla krásná minulost. Během mé práce v O2 jsme zjistili, že data scientisti jsou velmi osamělí, samostatní a většinou si práci odvedou sami end-to-end. Končí u nich celý vývoj od explorace až po prediktivní model, ale co pak s nasazením, ML Ops a podobně?

V podstatě se jim končí práce v notebooku s modelem a tabulkami, bez starosti o deployment. Proto jsme dali dohromady tým data scientistů, kteří byli opravdu dobří, a začali najímat data inženýry a softwarové inženýry. Ukázalo se, že je potřeba více data inženýrů na jednoho data scientista.

V době DataClair jsme záměrně na základě diskuzí s přáteli doplnili software engineering skillset a mindset. Tito software inženýři jsou „buildři“, kteří vytvářejí projekty a produkty komplexnější než jeden člověk zvládne.

Začali jsme tyto softwarové inženýry a product ownery integrovat přímo do DataClairu. Například Petr Hirš, který po mně nyní DataClair vede, byl původně software engineering manažer a pomáhal mi s people managementem.

Tedy okolo data scientistů jsme postavili kompletní strukturu softwarových inženýrů.

A teď omlouvám se za monolog, ale během posledních dvou let došlo k obrovské demokratizaci nástrojů – například hugging face, langchain a další. Před dvěma lety jste pro AI projekt potřebovali tým zděný jako v DataClair nebo Zoomu – lidi, co opravdu rozumí machine learningu, data science a data engineeringu.

Dnes už ne na všechno, ale na docela slušný AI produkt vám často stačí tým softwarových inženýrů. Nejenže to lze takto realizovat, ale je to i konkurenční výhoda: sehraný tým softwarových inženýrů, který staví komplexní softwarové produkty, zvládne lépe AI produkty než tradiční machine learning researchři nebo data scientisti, kteří obvykle bojují, aby zkombinovali vědu s produktem.

Samozřejmě neudělají vše – např. kreditní scoring stále vyžaduje expertní data science dovednosti. Ale práh vstupu výrazně klesl. Pro mě byla tato transformace klíčová.

Vzpomínám, že data scientisti byli většinou self-learned lidé, čerství absolventi s Pythonem, což bylo ve své době zásadní, už se nepoužívala Scala tolik, protože Spark už Skalu téměř nepoužívá.

Většinou jejich práce končila notebookem s explorací, analýzou a modelem. Software engineering byl už etablovaný a když se tyto dva světy potkaly, vznikla jakási synergie.

Potvrzuji, že dnes, pokud chcete vyrobit GPT-based řešení, vývojář to zvládne. Problém je, že GPT není vše. Vedle něj používáte i jiné modely a technologie.

Jazykový model je v podstatě nástroj pro redukci dimenzionality reality světa. Svět je extrémně vysoce dimenzionální a jazykový model je jakási abstraktní struktura, která nám umožňuje svět vidět skrze optiku jazyka.

Když dělám inferenci jako člověk, nedělám kauzální inferenci podle Judei Pearlovy teorie, což je abstraktní pojem a ideální matematický konstrukt – něco jako Platónovy ideální kružnice ve světě idejí. V praxi jazykový model vytváří plauzibilní příběhy, které připomínají inferenci a které dokážu nějak koherentně využít.

Celkově to znamená, že jazykový model je pro mě člověka externí strukturou, do které se částečně „otiskla“ realita světa, a já ji tak vidím prizmatem jazyka.

Lu, vizuální model, proprioceptivní model. To znamená, že zde máme tu komputačně nezvládnutelnou realitu světa. Já mám zhruba 99,99 % všeho toho, co se na mě valí, normálně klasický pruning (prořezávání) toho stavového prostoru, který je vyřezaný, podobně jako ho má třeba AlphaGo, která také nakonec někde dělá Monte Carlo Tree Search. Akorát že většinu z toho vyhodí tím, že si jednotlivé uzly nacení nějakou hlubokou neuronovou sítí.

A jazykový model je jedna ze struktur, která mi pomáhá takto snižovat tu kombinatorickou explozi světa, jenž se na mě valí. Přesně takto jazykový model může fungovat jako enkódování (zakódování) informací o světě. My jsme třeba už tady, jakmile se objevila GPT-3, začali experimentovat, tzn. před třemi, čtyřmi lety vlastně již. To API bylo dostupné ale pouze tři roky zpátky. Měli jsme představu: „Děláme tady nějaký next best action vůči zákazníkovi, pojďme to vyzkoušet.“

Problém je, že když jste český telekomunikační operátor, máte strašně řídká data. Není to tak, že byste měli desítky milionů zákazníků jako nějaký čínský operátor. Je to prostě fakt jednotky milionů a ti mají relativně málo kontaktů s operátorem. Představte si situaci, že někdo si koupí set-top box, došlo k nějaké komunikační chybě a doma nemá těch 100 megabitů, ale pouze 5 megabitů. On ale vůbec neví, co megabity jsou, dívá se na zápas Sparta-Slavia a obraz se mu seká, takže volá na operátora, kde mu řeknou: „Ano, to se stává, je to malé procento případů, ale stává se to.“ A co vy máte? Děláte reinforcement learning (učení posilováním), kde učíte systém, takže vytvoříte nějaký encoding těch dat, třeba skrze rekurentní neuronové sítě, například LSTM, ze sekvence dat o tom, co dotyčný dělá – volá do call centra, nedovolá se, jde na prodejnu, to se nějak měří. Neuronová síť, například LSTM, je opět nástroj na redukci dimenzionality, takže dimenzionalita dat se redukuje. Výstupem je nějaký vektorový prostor, ve kterém se snažíte mapovat enkódované informace o zákazníkovi na to, co by měla být nejlepší další akce.

Jenže ten prostor je pořád velmi vysokodimenzionální a vy nemáte dostatek trénovacích dat. Kdybyste ale jako lidé koukali na toho zákazníka, nemuseli byste být moc inteligentní, abyste viděli, co se mu stalo, a uděláte si jednoduchou inferenci – což je komprese toho, co vidíte, do konceptu. Z toho konceptu víte, že ano, ten člověk je naštvaný, velmi naštvaný.

A najednou jste zkomprimovali obrovské množství reality světa do jednoduchého konceptu. Potom řeknete: „No, on je naštvaný, proto mu nebudeme posílat upsell na nejlepší OTT, ale naopak mu zavoláme.“ Tímto způsobem interakce mezi konceptem „naštvaný“ a „co udělat“ je daleko méně řídká než mezi nějakým 100dimenzionálním vektorovým prostorem.

Jazykový model nám umožňuje udělat tuto kompresi na začátku. Můžeme jazykovým modelem komprimovat kusy reality a pak s nimi dále pracovat. To je něco, co běžný software engineering nemá ve svém skillsetu; je potřeba data scientist, machine learning inženýr, nebo kdokoli, kdo uvažuje s research mindsetem.

Největší problém je, že dneska, když se řekne GPT, představí si všichni chatbota. To je hrozné. Toto je vlastně neočekávané. Podle mě to říkal i Demi Zasabis v jednom podcastu, myslím, že to byl podcast s Dvarkeshem. Marketingový trik OpenAI spočíval v tom, že statický jazykový model pod kapotou překřtili na chatbota, poslali ho mezi lidi a dali mu zdání agentury. Byl to obrovský marketingový tah s dramatickými důsledky na podobu AI světa.

Kdyby k tomu nedošlo, dnes by svět dál směřoval více k utility-based projektům, jako například AlphaFold 3. Ale teď je to „přepálené“, připomíná mi to svět krypta, který je fantastická věc na spoustu budoucích případů, ale spekulativní exploze vytvořená krypto ekosystémem je zároveň jeho největší slabinou a vlastně brání skutečnému růstu užitečnosti. Mně přijde, že přepálení „chatovacího“ dojmu AI nyní nemá úplně nejpozitivnější efekt. Realita platného využití AI je vlastně někde jinde.

Souhlasím s tímto srovnáním, paralelu jsem viděl taky a říkal jsem to: „Je to prostě druhé krypto.“ Na druhou stranu obě iniciativy do toho přinesly obrovské množství peněz. Bez toho chatbotu by firmy do AI nikdy takto neinvestovaly. Je to pravda.

Souhlasím, že teď je úplně každý druhý „AI expert“, který ještě minulý rok prodával McAchi telefony. Tato kontroverze mě baví, protože to reflektuje realitu. Na druhou stranu bez těchto lidí nemůžeme dělat rozumné věci. Díky tomu se do světa AI nalilo daleko více peněz. Otázka je, zda jsou tyto peníze efektivně využívány, protože většina je spotřebována na vylepšení dalších verzí „frontier“ modelů, například trénink Gemini 1.5 Ultra za 190 milionů dolarů je relativně drahý. A podobné snahy probíhají i v Groxu, OpenAI atd. Nevím, co z toho bude, ale mám pocit, že to neakceleruje přínos AI tak, jako kdyby se financování více soustředilo na projekty typu AlphaFold a jiné utility-based přístupy. Možná to ale bude mít i pozitivní dopad z jiné strany. Na druhou stranu se obávám i negativních dopadů. Studoval jsem hodně uvnitř AI komunity, kde jsou i AI alignment experti, které hanlivě nazývají „AI doomers“. Já si myslím, že svět bez AI není možný. Musíme jít touto cestou a AI nám pomůže vyřešit většinu dalších problémů, které máme. Přestože riziko spojené s AI je extrémně vysoké, před ním si nelze zatloukat hlavu.

Poslední dobou jsem zjistil, že mi lépe spolupracuje s filozofy na nastavení high-level principů fungování AI. Normálně vystudovaní filozofové, kteří někdy mají zkušenosti z byznysu, nebo profese filozofa s ochotou naučit se Python a programovat, mají daleko realističtější pohled na svět než geekové z mého okruhu, kteří často trpí okrajovým odbornictvím („fachidiotismem“). Tito geekové často vidí jen úzký detail, ale nemají hlubší porozumění například tomu, co stabilizuje společnost Homo sapiens.

Co dělá Ellen AI? Říkal jsi, že je to takový antivirus na informace a memy. Původně jsme tomu říkali „kognitivní antivirus“ – nějaký marketingový termín, který však přestáváme používat, protože cílíme na generaci Z a tento výraz zní příliš strašidelně.

Představte si, že právě žijeme v neuvěřitelně hyperstimulační době online digitálního světa, kde jsme vystaveni útokům na kusy naší kognice způsobem, který nikdy v evoluční historii lidstva neexistoval. Náš hardware a software mozku, naše psychika jsou přizpůsobeny face-to-face tribální komunikaci v partě, ve vesnické komunitě. Naučili jsme se fungovat i ve větších skupinách, například v církvích, ale vždy sdílení v reálném fyzickém světě znamenalo vynaložit nějakou skutečnou energii – buď fyzickou, jít někam křičet nebo roznášet letáky, nebo společenskou solidaritu a kredit.

Když někomu face-to-face řeknete, že je „pěkný blbec“ nebo něco horšího, nesete riziko, že on vám může odpovědět fyzicky nebo jinak. V online světě ale nastala dynamika po roce 2010, kdy tato bariéra zcela zmizela. Navíc se k tomu přidaly algoritmy maximalizující „dwell time“ („čas strávený u obrazovky“), které vedou k permanentnímu zaplavení uživatelů úzkostí a anxietou vyvolávajícím chováním.

Jsme takto kognitivně nepřipraveni na dlouhodobý pobyt v tomto prostředí. Dnes už nikdo nepochybuje, že když si zapnete nový počítač s Windows, máte tam nějaký antivirový program, nebo si stáhnete Avast či Gen, abyste počítač ochránili. Cítím osobně, jak je ohrožen počítač různými hrozbami, phishingem apod. Ale to, že vystavíme svou mysl v tomto online světě, vnímám jako kdybychom nebyli chráněni vůbec. Typické hejtování pod LinkedIn příspěvky, i mě to bolí a je to nepříjemné. Když tento podcast zveřejníš na YouTube, pak tam budou lidé, kteří mě budou hejtovat. Už dopředu říkám, že mě to samozřejmě bude bolet, i přestože si myslím, že jsem emočně relativně zralý člověk.

A teď si představ, že jsi patnáctiletý, úplně nevíš, v čem jsi dobrý, nevíš, co budeš dělat, svět kolem je divoký. U každého patnáctiletého je to vždy chaotické a dějí se podivné věci, ale vůbec neví, kam směřovat. Evolučně jsme to po desetitisíce let uměli zvládat, protože život probíhal podobně. Najednou první generace vyrůstá v prostředí, které jsem tady popsal.

Naším cílem je vytvořit AI kompana, který v takovém světě bude s tebou, bude vždy na tvojí straně, nikdy tě neodsuzuje, bude extrémně znalý světa a spojí vlastnosti dobrého kamaráda, který tě zná, a zároveň mozku psychiatra Jiřího Horáčka s jeho 30letou praxí psychoterapeuta.

Snažíme se přemostit dva světy – například kluk, který hraje Fortnite a má problémy, protože ho někdo hejtí kvůli tomu, že nezvládl Battle Royale. Jiný čtrnáctiletý mu může dát přesný vhled do situace. Když ale přijde za padesátiletým terapeutem s 30 lety zkušeností, ten mu často řekne, aby přestal hrát Fortnite – což se nedá takto jednoduše vyřešit.

Ukazuje se, že nejlepší řešení jsou nějaké formy mindfulness. K tomu jsou aplikace, například Wozhealth na žurnálování, které mají velké využití a jsou důležité, ale pokrývají jen část spektra. Když už potřebujete psychoterapeuta, je na to často pozdě. Psychoterapeutů je nedostatek kdekoli na světě, a v Česku hlavně dětských je zvlášť málo. Proto potřebujete aspoň nyní někoho, když je vám opravdu špatně.

My se snažíme pokrýt celý „onset“ problému tak, aby lidé ideálně nikdy neměli psychoterapeuta potřebovat. Taková je naše vize.

Co se týče LNKI a období 2000–2004, kde vůbec začít? My asi během dvou týdnů od dneška, kdy toto natáčíme (nevím, kdy to přesně půjde ven, ale řekněme během června), plánujeme vydat opravdové MVP.

Zatím to bude uzavřená skupina, whitelistovaných testerů, taková před-MVP verze, o které víme, že je d…

Ale je to daleko od toho, aby to byla perfektní věc.

Teď to tedy spustíme a bude to pořád zatím testovací verze, ale bude více méně pro všechny. A pořád je to zatím jenom webová aplikace. Fungujeme v režimu Progressive Web Application, což znamená, že se to na telefonu tváří jako aplikace, ale je to reálně webová aplikace, takže to má nějaká svá omezení.

Toto bude něco, co zde bude, řekněme, fungovat už v polovině června. A během léta bychom měli vytvořit plnohodnotnou nativní aplikaci a dostat ji ven do světa. Hlavní funkcionalita, kterou Elin už v tuto chvíli umí, je rozumět tomu, jaký jste člověk. Umí díky tomu tajemství dávat mnohem efektivnější intervence v situacích, kdy je potřebujete.

Interfejs, který je teď v té MVP verzi, je takový, že uděláte screenshot libovolné situace, kterou máte. Třeba vás někdo hejtí na školním WhatsAppu, nebo čtete nějakou šílenou zprávu o tom, že Putin opět vítězí na Ukrajině, nebo klimatická krize a požáry, nevím co všechno.

Nebo například nějaké podivné, jemné věci, například ve vaší školní WhatsAppové skupině někdo dal hlasování, jestli jste lepší vy nebo Petr. Ať už vyhraje kdokoliv, pro oba to je hrozné. Horší je to pro toho, kdo prohraje, nebo cokoli. Nebo vám někdo napsal něco hnusného a vy ho chcete zahlásit zpátky, máte rozepsanou zprávu a teď nevíte, jestli je to v pořádku, nebo že vlastně ne.

To, co se teď pokusíme udělat, je, aby to první, co máte na mysli, bylo nechat to zkontrolovat s Elin. Uděláte screenshot, pošlete ho Elin, dostanete tam insight kombinovaný s někým, kdo má kontextové povědomí o vašem světě, jako váš nejlepší přítel, a zároveň má mozek Jiřího Horáčka – toho psychoterapeuta.

Tohle je něco, co bychom měli mít v testovací verzi, řekněme, v polovině června, abych teď nějak to nastavil. Takže od teď zhruba tři týdny od doby, kdy to natáčíme. Samozřejmě tam bude spousta problémů, ale budeme rádi za testovací uživatele. Na Discordu uděláme komunitu kolem toho, jmenuje se Genzen Space.

Budeme rádi, když tam lidé přijdou, budeme tam pořádat Ask Me Anything sessiony, budou tam setkání o duševním zdraví, vše možné – o závislostech apod. Jak zvládat mentální wellbeing nejenom pro generaci Z, ale vlastně pro všechny.

Budeme rádi, když tam lidé přijdou, klidně nahlásí chyby nebo se jen podívají. Pak doufejme, že během léta bude ta nativní aplikace.

Super. Když u Elin zůstaneme, tak jsi teď popsal produktovou vizi a současný produkt. Když se podíváme pod kapotu, tak…

Když se podíváme pod kapotu, musím říct, že obrovské množství věcí, které jsme ještě před rokem a půl, když jsme dělali návrh všeho, jsme měli za to, že budou použity legacy machine learning komponenty, například pro určité funkce.

Rychlost vývoje základních (foundation) modelů je ale tak velká, že se nám v podstatě ani nevyplatí, minimálně pro MVP, používat tyto starší metody. V podstatě zahazujeme ty starší nápady a prototypy legacy machine learning věcí.

V rámci tohoto vývoje teď hodně využíváme foundation modely dostupné přes API, protože nám to umožňuje rychlejší vývoj. Současně si ladíme vlastní fine-tuned model. Máme sice v zásuvce ještě nějaké klasické modely, například pro rozhodovací procesy, doporučení apod., ale veškeré NLP tradiční algoritmy jsou zbytečné. Mohli jsme zahodit všechny dosavadní NLP algoritmy.

Toolstack je teď kombinací těchto moderních přístupů. Taky je to důvod, proč jsme právě uzavřeli menší pre-seed kolo financování. Toto budeme komunikovat, získali jsme podporu od Presto Ventures a BD Partners – dvěho VC fondů, kterým zde veřejně děkujeme za důvěru a podporu.

Takže teď makáme a lidé, se kterými pracujeme, jsou především vývojáři zaměření na softwarové inženýrství.

Je to zcela v souladu s tím, co jsem říkal – když budujeme produkt a potřebujeme trefit product-market fit, tak s Petrem Stanislavem myslíme, že strojové učení zvládáme dobře, ale zbytek potřebujeme. Potřebujeme šikovné, samostatné lidi, které baví mise a jsou schopní vytvořit produkt. Momentálně nepotřebujeme další machine learning specialisty, je to spíše o software engineeringu. Stejně jako v O2.

V O2 sice existuje větší prostor pro klasické legacy modely, například v oblasti mobility. Tam jsou například transformery, o kterých kolega Štefan Jozef nedávno přednášel na ML workshopu. Transformery se používají například pro matching. Takže to je taková věc, kterou je potřeba umět napsat například v PyTorch.

Možná to budeme potřebovat i v Elin, ale teď jsem si vědom svých zkušeností a už jsem mentálně spíše sítě opatrný – technologický hračička. Musím si naordinovat pravidelnou kůru zahazování technologických parádiček a vymýšlení prostě proto, aby tam byl byznys, protože u startupu jasně vidíme, jak nám hodiny odtíkají z rozpočtu.

Rád bych se nořil do různých technologických funkcí, ale poučil jsem se dostatečně, doufám.

Jdeme tedy fakt cestou rychlého vývoje.

Náš čas tady v podcastu se krátí, abychom to uzavřeli jednou velkou myšlenkou: Vyprávěl jsi o konferenci Artificial Golem Intelligence, kterou jsi pořádal, o tom, jak se vrací témata etiky umělé inteligence, a jak jsi zjistil, že myšlení a uvažování nejsou pouze doménou biologických strojů.

Jak tedy vnímáš bezprostřední budoucnost a to, co dělá lidi lidmi, a co nám vše stroje vezmou?

Na bezprostřední budoucnost se dívám samozřejmě s obavami, nicméně jsem optimista v tom, že pořád vidím cestu.

Přirovnal bych to k tomu, že je to teď skutečně v našich rukou – kolektivních rukou celé společnosti – zda se vydáme cestou dystopickou nebo relativně optimistickou. Na jedné straně může vzniknout dystopie typu superstabilní autoritářské autokracie, například euroazijsko-čínského typu, která se u nás vyvíjí.

V takové společnosti bude každý z nás jako konzument extrémně atomizovaný, protože budeme mít maximálně personalizovaný obsah. Už to nebude o sdílení stejných mýtů a příběhů jako generace před námi – ať už křesťanských nebo sdílení Pána prstenů, Hry o trůny, apod.

Každý z nás bude žít v atomizovaném, hyperpersonalizovaném obsahu extrémně optimalizovaném na zachycení naší pozornosti.

A samozřejmě si řekneme: „To nechceme! My jako homo sapiens potřebujeme sdílet s druhými lidmi, potřebujeme sdílet nějaké příběhy.“ Pojďme to tedy zastavit.

Pak ale technologičtí extrapozitivisti a efektivní akceleracionisté řeknou: „Víš co? To vyřešíme tak, že každý dostane svého AI přítele, který bude lepší než opravdoví přátelé.“

Takže budeš mít personalizovaný obsah svého vlastního Tolkiena nebo své vlastní Tolkieny, které už nebudeš potřebovat sdílet s druhými. Už je bude mít jako AI friend, který bude lepší než my ostatní.

A to je čistě cesta, kterou se můžeme vydat.

Podobně může dojít k tomu, že hodně bílých límečků přijde o práci a buď se kompletně přihákne na Netflix a metaverzum, kde bude konzumovat obsah a sdílet ho se svými lepšími AI přáteli. Paralelně pak v domovech seniorů budou senioři umírat v extrémní samotě na svém posledním cestě, což je realita, která se děje teď.

My, co jsme hypersociální opice, odsuzujeme své nejstarší lidi na muky na této poslední cestě.

Můžeme však zvolit i dvě jiné cesty.

Jedna je, že lidé, kteří přijdou o své uplatnění v divné řeholi přehazování faktur z místa A na místo B, se mohou spojit s osamělými lidmi, být jejich průvodci. To je optimistická cesta.

Pesimistická cesta je, že místo toho jim tam nasadíme AI boty.

Takže se to může vyvíjet jedním či druhým směrem.

Je zcela zjevné, která cesta je ekonomicky výhodnější. Je to ta, která vede k atomizaci a vytvoření AI přátel, protože cesta našeho přirozeného života je vždy energeticky náročná.

To, co dnes vidíme u generace Z, je neschopnost odložit odměnu, prostě neschopnost počkat si na něco.

Nemůžeme jim to mít za zlé, je to neurofyziologie, která nás takto vede.

Optimistická cesta je složitější, znamená odložení odměn, překonání diskomfortu a komunikaci mezi lidmi, kteří mají odlišné názory.

Místo toho, abych tě kvůli odlišnému názoru vypnul a pustil si AI, která má stejný názor jako já, a přes ni útočil, je potřeba tuto složitější variantu.

Ta totiž přináší smysl našemu dalšímu lidskému bytí na Zemi.

V příštích, řekněme, relativně krátkých deseti letech se otevírá okno, ve kterém se to více méně rozhodne, kterou cestou se vydáme.

Myslím si, že to je možné nasměrovat dobře, protože zde dávám svůj oblíbený příklad ze 19. století s kvakeři a abolicí otroctví.

Otroctví bylo eticky přijímané tisíce let, bylo normální, všichni měli otroky – Aristoteles psal o etice a měl otroky.

Ekonomicky to bylo výhodné.

Pak přišli kvakeři, malá skupina lidí, která během 10–20 let změnila etický mindset celé západní civilizace tak, že Británie ilegálně zrušila otroctví a věnovala 2 % svého HDP na boj s obchodem s otroky.

Nejprve se změnila hodnota uvnitř malé skupiny lidí, kteří měli dobré PR a podařilo se jim „memeticky“ propagovat novou etickou vizi v populaci. Pak přišla regulace.

Následně bylo chucpe mít otroka – bylo to špatné, tabuizované, podobně jako incest.

Stejně tak by mělo být tabu misusu AI.

Ne že to nebudeme dělat kvůli zákazu, ale protože je to odporné.

Ať už to dělá kdokoliv, s ním nepůjdu na pivo.

Myslím si, že v příštím desetiletí se toto utvoří a rozhodne.

Buď se nám podaří změnit hodnotový rámec, anebo ne.

Proto si myslím, že bychom měli lidi opravdu povzbudit, aby tady nevznikaly polarizace nejenom v celé společnosti, ale například i mezi AI komunitou.

Ta je nyní extrémně polarizovaná.

Někdo mě hejtí, já je také, a vzniká mezi námi konflikt.

Technologičtí geekové se opovrhují filozofy a ti zase geeky.

Doporučil bych vrátit se z babylonského zmatku, kdy nikdo nikomu nerozumí a existuje tolik jazyků, kolik je lidí.

Je potřeba znovu vytvářet společné narativy a příběhy.

Pokud se nám to povede, věřím, že se zvyšuje šance, že to zvládneme.

Že dokážeme vybudovat velmi příjemnou a pozitivní budoucnost s AI.

Ale musíme na tom opravdu pracovat.

Děkujeme moc, Honzo, za tvé kázání a vstupní test.

A já ve jménu svých dětí doufám, že se nám to podaří zvrátit správným směrem.

Neseďte jenom na internetu, pojďte se setkat face to face.

Je v pořádku s někým nesouhlasit, ale je třeba si to umět vyříkat.

Děkujeme moc, Honzo.

Díky za prostor.

Omlouvám se, že jsem se trochu rozkecal, ale rozvášnil jsem se.

Děkujeme, proto jsme tě pozvali.

Když tak to vystřihni.

Moc se těšíme, držíme palce.

Elina, to by bylo skvělé.

Díky, díky. Díky moc.

A to je všechno.

Děkujeme, že jste nás doposlouchali až sem.

Děkujeme také našim partnerům: Big Hub, Intex, Saska, ByStreet, Colors of Data, Revolt BI, GoodData, Kebule, eMark, Karel Data Company a Datamindum.

Pokud vás zajímá víc, navštivte naše stránky datatalk.cz a přihlaste se k odběru našeho newsletteru.

Podcast

Data Talk #89: Jan Romportl (Elin.ai)

Strojový přepis

Odebírejte Data Talk