Newsletter

#135 Nechali byste agenta migrovat legacy pipeliny?

Ahoj,

Google vydal Data Engineering Agenta, Číňani mají špičkový model, ale pravděpodobně kecají o ceně tréninku, tvůrci Hitchatu končí, dbt Labs vydali MetricFlow jako open-source a agent od AISLE našel 13 let starou kritickou zranitelnost v Samba.

A taky je tady další Data Talk Newsletter.

Newsletter nyní odebírá 1863lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Tento týden:

Pak:

Víte o datové akci, která tady chybí, nebo ji dokonce pořádáte?

Pošlete nám ji na michal@fenekpr.cz

📰 Novinky, linky a drby

Google vydal agenta, který vám pomůže s data engineeringem

V BigQuery Studio a Dataform UI minulý týden přistála preview verze Data Engineering Agenta – prvního ztrojice datových agentů, které Google představil letos v dubnu.

Tento agent dokáže na základě promptů v přirozeném jazyce generovat, upravovat a optimalizovat datové pipeliny a také do velké míry automatizovat jejich migraci zlegacy nástrojů. Pomůže i s diagnostikou a opravou chyb a dokonce i zvládne vytvořit dokumentaci. Umí také čistit a formátovat data a hlídat jejich kvalitu.

Při své práci se drží jak pravidel a slovníku v Dataplexu, tak i vámi zadaných instrukcí a user-defined funkcí, díky čemuž může převzít vaši businessovou logiku a ověřené postupy.

Data engineeři se ale zatím o práci bát nemusí. Budou mít však k ruce fajn pomocníka, který jim může pomoci s rutinními, časově náročnými úkoly. Jen je potřeba mít na paměti, že není neomylný a práci je po něm dobré zkontrolovat – ikdyž například pro Vodafone bez jakékoliv lidské asistence přemigroval všechna existující data a transformační skripty z legacy systémů do BigQuery bez jediné chyby.

Čínský vyzyvatel frontier modelů

Minulý týden ve středu se na summitu Future of AI nechal CEO NVIDIA Jensen Huang slyšet, že Čína je vAIzávodech ve zbrojení jen nanosekundy za Západem a zdlouhodobého hlediska má slušně nakročeno vyhrát. A hned druhý den se ukázalo, že nejde o planá varování.

Ve čtvrtek totiž vydal Alibabou vlastněný čínský startup Moonshot AI open-weights model Kimi K2 Thinking, který nejen že se v mnoha ohledech vyrovná nejlepším západním modelům, v některých benchmarcích, například v notoricky těžkém  Humanity's Last Exam, dokonce dosáhl rekordních skóre, i když pouze s drobným náskokem.

Náskok několika bodíků v pár metrikách by ještě tolik neznamenal – mnohem zásadnější je ale jeho cena. Oproti GPT-5 a Gemini 2.5 Pro je per token více než 3x levnější, oproti Grok 4 a Claude4.5Sonnet dokonce 5,5x. Spotřebuje sice při přemýšlení o něco více tokenů (oproti čtyřem zmíněným o 17–65 % více), i tak s ním ale značně ušetříte.

Všechny tyto informace potvrzují i nezávislé testy, jedno však ověřit neumíme – a totiž tvrzení Moonshot AI, že natrénování tohoto modelu s 1000 B parametrů stálo pouhých 5 milionů dolarů. Tomu se nechce úplně věřit – pokud totiž čínské firmy vněčem západní konkurenci na hlavu porážejí, je to kreativní účetnictví při počítání nákladů na tvorbu modelů.

Autoři Hitchatu zavřeli krám

Startup RTM Labs, který stál za aplikací Hitchat umožňující konverzace s digitálními verzemi známých osobností, skončil v insolvenci. Hlavní investor Marek Štangl firmě utnul peníze s tím, že se s nimi nezacházelo právě hospodárně.

Zakladatelé Radek Lunda a Tomáš Podrazil si prý pořídili luxusní Mercedes CLA, přestože už měli dvě firemní auta a žádné zaměstnance. Miliony navíc měly odtéct do jejich dalších firem přes fiktivní faktury – bez smluv, bez objednávek, bez jakékoli stopy.

A slibovaný obrat? Místo ambiciózních 3–12 milionů korun za druhou půlku roku 2024 dorazily pouhé 4 tisíce.

Futurehouse spouští spinout, který zrychlí výzkum o řády

Neziskovka Futurehouse představila komerční spinout Edison Scientific a jeho nástroj Kosmos – AI systém, který zvládne zpracovat stovky studií, analyzovat data, navrhnout hypotézy i experimenty.

Co by vědeckému týmu trvalo půl roku, zvládne Kosmos za 12 hodin a 200 dolarů. Pro nekomerční výzkum bude k dispozici i bezplatná verze.

Kosmos zatím není neomylný – správných je zhruba 79 % závěrů. Ale vědci našli jednoduché řešení: prostě ho nechají každý úkol vypracovat několikrát.
Podobný projekt nyní rozjíždí Filip Doušek (vizte v sekci gossip).

🗞️ Další novinky:

💰 Investice, akvizice a business:

📄 Články, papery a newslettery:

☕ Data gossip:

🎙️ Podcasty, videa, přednášky:

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastně odkudkoliv se dá.

📚 Random trivia na závěr

Věděli jste, že pravděpodobně celý život vyslovujete název Legerovy ulice špatně?

Je totiž pojmenována po francouzském profesoru slavistiky a velkém podporovateli myšlenky samostatného českého státu Louisi Légerovi, jehož příjmení se vyslovuje jako [ležer] – název této ulice vedoucí od Nuselského mostu až k hlavnímu nádraží ale jako [ležerova] vyslovuje málokdo.

My Češi jsme vůbec s výslovností francouzských jmen poněkud na štíru – ostatně stejně jako většina národů na světě. Vždyť ani název světoznámé Eiffelovy věže nikdo nevyslovuje správně – správná výslovnost příjmení jejího konstruktéra Gustava Eiffela je totiž [efel].

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!