#101 Data Science Agent vám práci nesebere, jenom ulehčí
Ahoj,
Google vám zautomatizuje notebooky, DeepSeek machrují se svým profit marginem (ale nekecají zase?) a Sesame vydali zatím nejpřirozenější hlasový model.
A taky je tady další Data Talk Newsletter.
Newsletter nyní odebírá 1601lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.
Data Brothers chystají druhý ročník Data Point Prague
29. a 30. května se v Comfort Hotel Prague City East v pražských Strašnicích uskuteční tahle odborná konference zaměřená na Microsoft Data Platform, MS datový ekosystém, Microsoft Fabric a Power BI.
Sjede se sem řada expertů na MS data stack z celého světa. Mimo jiné vystoupí hned 4 Data Platform MVPs - Erwin de Kreuk (InSpark), Uwe Ricken (dbBerater), Mathias Halkjær Petersen (Fellowmind) a Marc Lelijveld (Macaw).
Těšit se můžete i na několik opravdu in-depth workshopů a spoustu hands-on experience. Tady prostě nesmíte chybět!

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📅 Kalendář datových akcí
Příští týden:
- Creative AI Meet-Up #13(pondělí 10. března, Praha)
- Košice in the Cloud Vol. 5 (středa 12. března, Košice)
- Avatar Pioneers: HeyGen community meetup (čtvrtek 13. března, Praha)
Později:
- Tech Execs Community Brunch #4 (středa 19. března, Praha)
- Tech Trends 2025: The Future of Business & Innovation (středa 19. března, Praha)
- PyData Prague #26 - Table Diffusion (čtvrtek 20. března, Praha)
- Konference Fenomén (čtvrtek 20. března, Zlín)
- E2B Hackathon: Agents and AI tools (sobota 22. března, Praha)
- nConnect 25 (středa 26. března, Nitra)
- Engineering Leaders Conference (čtvrtek 27. března, Praha)
- Konference Zážeh AI spolupráce (čtvrtek 27. března, Praha)
- AdvanceMed 2025 (čtvrtek a pátek 3. a 4. dubna, Ostrava)
- 2024 Data Vault User Group Conference (úterý 15. dubna, Praha)
- Prague Crawl by Apify and Massive (středa 23. dubna, Praha)
- Machine Learning Prague conference 2025 (pondělí až středa 28.-30. dubna, Praha)
- AWS Community Day CZ (úterý 29. dubna, Praha)
- IDC CIO Summit (úterý a středa 20. a 21. května, Praha)
- WebExpo 2025 (28.-30. května, Praha)
- Prague Orbit - charitativní cyklotour by Billigence (sobota 7. června, Praha)
📰 Novinky, linky a drby
Google představil Data Science Agent pro Google Colab

Google vydal nový nástroj Data Science Agent, který dokáže pomocí Gemini generovat kompletní, spustitelné notebooky přímo ze zadání v přirozeném jazyce. Můžete tak automatizovat psaní kódu pro předzpracování dat, vizualizace i úlohy strojového učení.
Nástroj podporuje oblíbené frameworky jako scikit-learn, TensorFlow, PyTorch a XGBoost a zvládá širokou škálu úloh jako je například klasifikace, regrese, výběr relevantních rysů a analýza korelace. Poradí si s formáty CSV, JSON a excelovskými soubory, manuálně jej také jde napojit na externí databázi nebo různé API. Notebooky mohou také pracovat s daty z Kaggle nebo Data Commons.
Data Science Agent je zatím dostupný jen v některých zemích, EU mezi ně tradičně v první vlně nepatří.
Další novinky:
- DeepSeek tvrdí, že i přes extrémně nízké ceny API mají marži 548 % a poskytli i techniky, jak toho dosáhli. Berme to ale s rezervou, v minulosti třeba neříkali tak úplně pravdu o ceně tréninku modelu, která nebyla 6 milionů dolarů, ale spíše někde okolo 1.3 miliardy.
- GPT 4.5 budí rozporuplné reakce. Na jednu stranu se na chvíli v LM Arena vyhoupl na první místo (a vzápětí byl promptně sesazen novým updatem Grok 3). Kritici ale poukazují na to, že vzhledem k tomu, o kolik je model větší (a tedy i dražší na provoz), je kvalitativní zlepšení naprosto nedostatečné a LLMs bez reasoningu už očividně nejsou cesta. Objevuje se ale i názor, že největším přínosem modelu není to, že by se oproti GPT-4o zlepšil v tom, v čem byl předchůdce nejlepší, ale naopak v tom, kde měl největší mezery.
- Sesame vydali hlasový model Conversational Speech Model, který je vsoučasnosti absolutní špičkou v přirozenosti komunikace.
- OpenAI potvrdili, že plánují integrovat video model Sora do ChatGPT.
- Alibaba vydali open-source video model bez restrikcí nazvaný Wan 2.1, uživatelé pomocí něj okamžitě začali generovat AI porno.
- Microsoft vydal samostatnou aplikaci Copilot pro MacOS.
- Apple po nátlaku britské vlády na poskytnutí backdooru vypnuli uživatelům ve Spojeném království Advanced Data Protection, díky kterému byla jejich data šifrovaná a nepřístupná i pro Apple.
Články a papery:
- Astronomer.io | The State of Apache Airflow 2025
- Cloudflare | Over 700 million events/second: How we make sense of too much data
- BizzTreat mňamka #539 | Tooltipy, popisky a vysvětlivky: Jak provést uživatele reportem bez otázek?
- Carl Data Company | Od lajků k hlasům: Jak čeští politici hackují sociální sítě? Okamura zahlcuje a sází na placené kampaně, Babiš venčí psa
- Hrot | Umělé inteligenci rozumí jako málokdo. Teď česká legenda robotiky dotáhla životní deal v Silicon Valley
- Michaela Liegertová (Přírodovědecká fakulta UJEP) | Test rešeršovacích schopností AI modelů
- spoiler: Perplexity nedopadlo vůbec dobře
- Tomáš Čupr | We’re watching the rapid transformation - and possible end - of SaaS as we know it
Data gossip:
- Martina Ivaničová (ex Kiwi.com) přechází do DiusAI na pozici VP Data.
- Jaroslav Beck (Beck Adventures Group, CANS, BeatSaber) zakládá startup BottleCap AI, ve kterém povede výzkumný tým Tomáš Mikolov (autor word2vec). Jejich cílem je radikálně zefektivnit existující AI modely po celém světě. Držíme palce!
Podcasty, videa, přednášky:
- Data Talk #126 | František Pavlíček (CleverMaps) o tom, jak se pracuje s geodaty, jak se dají použít v zemědělství a jak v Marketspot.cz pomocí dat radí, kde otevřít novou provozovnu
- pepe logic #121 | Proč nejsou grafické karty, AI čipy v ČR, test SSD disku z Polska
- Insane Data Podcast | Francesco Puppini, Unified Star Schema best-selling author and the guy who killed the join
- mAIndset podcast | Filip Vítek (CommentSold): AI AGENTS - Next Colleagues Or Just Empty Overhyped Promise?
- Adam Zvada | NOVÝ GPT-4.5: Neměl to být nejchytřejší model. Tohle si nikdo neuvědomuje
- Keboola CEO Vlog | Keboola Offsite 2024
Random trivia
Věděli jste, že med je jednou z mála potravin, které se prakticky nikdy nezkazí?
Tento fakt byl ověřen opravdu dlouhým testem času. Archeologové našli med starý tisíce let v hrobkách starověkého Egypta - a i po tak dlouhé době byl stále jedlý. Jak je to ale vůbec možné?
Tajemství tkví v unikátním složení medu. Obsahuje totiž velmi malé množství vody (obvykle méně než 18 %), což vytváří prostředí, ve kterém nemohou přežívat bakterie a mikroorganismy. Med navíc obsahuje kyselinu glukonovou, která mu propůjčuje mírně kyselé pH. Tato kombinace nízkého obsahu vody a kyselého prostředí je pro bakterie téměř smrtelná.
Dalším faktorem je obsah přírodních antibakteriálních látek - zejména peroxidu vodíku, který vzniká enzymatickou aktivitou v medu. Díky těmto látkám je med nejen odolný vůči zkažení, ale má i antiseptické vlastnosti.
Tisíce let starému medu tak v podstatě nic není - pokud vám tedy nevadí, když vám med zcukernatí.

⚒️ DATA JOBS
- Sazka
- Senior IT projektový manažer (Praha)
- AI and Automation Engineer (Praha)
- Revolt.BI
- Data Engineer (Praha)
- Senior Data Engineer (Praha)
- Tech Lead (Praha)
- Colours of Data
- CRM Strategy Expert (Praha/remote)
- CRM Strategy Expert (Praha/remote)
- intecs
- Senior BI Consultant (Brno)
- Senior BI Consultant (Brno)
- Emark
- Data Architect – Azure Synapse (Praha/Pardubice/Bratislava)
- Data Scientist (Praha/Pardubice/Bratislava)
- BI Specialist (Praha/Pardubice/Bratislava)
- GoodData
- Notino
- FLO
- Data Analyst (Praha/Sydney)
- Data Engineer (Praha/Sydney)
- BigHub
BI Analyst (Praha)
Full-Stack Engineer (Praha)
. . Data Engineer (Praha) - Joyful Craftsmen
- Portfolio Principal - Business Intelligence (Zug/Praha/remote)
- Palantir Data Engineer(Bratislava/Mnichov)
- Data Engineer senior/medior (Praha/remote)
- Kiwi
- Engineering Manager - Search Backend (Praha, Brno, Bratislava, Barcelona)
- Analytics Engineer (Praha, Brno, Barcelona)
- Heureka
- BI Analytik (Praha)
- Ministerstvo průmyslu a obchodu
Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.
Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.
Chcete si přečíst naše starší newslettery?
Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?
Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!
A pokud vás naše práce baví a poskytuje vám hodnotu,
můžete nám poslat finanční podporuna kafe!
Data Talk partnery jsou: intecs, SAZKA, BizzTreat, Colours of Data,
Revolt.BI, Keboola, EMARK, Carl Data Company, Data Mind, NOTINO, FLO