#115 Datová revoluce v podání Kebooly
Ahoj,
Keboola vydala zásadní novinku, Google upgradoval Gemini, OpenAI vydali celkem zbytečný model, ale taky pořádně zlevnili jeden starší, EleutherAI vytvořili konečně použitelný open-source dataset pro trénování LLMs a Apple vydal framework pro spouštění edge modelu přímo na zařízení.
A taky je tady další Data Talk Newsletter.
Newsletter nyní odebírá 1775lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.
Řešíte anotaci dat? A jak by se vám líbilo, kdybyste nemuseli?
Irča Zatloukalová potřebuje vaši pomoc. Chtěla by zjistit, jak firmy řeší anotaci dat, a jestli k tomu zaměstnávají neurodivergentní lidi. Plánuje totiž vstoupit na český trh s firmou, která by využívala přednosti lidí s vysoce funkční poruchou autistického spektra k precizní anotaci dat pro trénink AI modelů. Takže pokud řešíte anotaci dat, prosím dejte nám pár minut, pomůžete tím dobré věci!

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📅 Kalendář datových akcí
Následující týden:
- CIIRC Tech Dating 2025 (pondělí 16. června, Praha)
- Budoucnost AI v zákaznické komunikaci (úterý 17. června, Praha)
- Pyvo Prague #169 - Breathing Life into FMCW Radar Data with Python (středa 18. června, Praha)
- KEmunITa Night: No Code, No Problem – Exploring AI Platforms for UX (středa 18. června, Košice)
- Předprázdninový Google Cloud meetup #3 (středa 18. června, Praha)
- Čína 2025: Budoucnost, která už dorazila(čtvrtek 19. června, Brno)
- Talk & Grow: Data, AI a večer plný inspirace (pátek 20. června, Praha)
Pak:
- Prague PostgreSQL Meetup: June Edition (pondělí 23. června, Praha)
- AI dovednosti pro veřejnou správu (čtvrtek 26. června, Praha)
- Prague Synapse 2025 (čtvrtek až sobota 10. až 12 července, Praha)
- EuroPython 2025 (pondělí až neděle 14. až 20. července, Praha)
- Konference DobroData (středa 3. září, Praha)
- MeasureCamp (sobota 6. září, Brno)
📰 Novinky, linky a drby
Keboola vydala svůj vlastní MCP server

Tohle je velké. Keboola vydala svůj Model Context Protocol server, který dovoluje propojení jakýchkoliv MCP-kompatibilních AI modelů, nástrojů nebo agentů s jejich platformou sloužící k propojení celého vašeho datového stacku a managementu dat z jednoho místa.
Umožňuje tak napojit AI asistenty jako je Claude nebo Cursor na celý váš stack, takže můžete vibecodovat SQL dotazy nebo rovnou celé pipeliny – a to se znalostí kompletního kontextu.
PODPOŘIT JE MŮŽETE DNES I NA PRODUCTHUNT!!!
Další novinky:
- Po posledním updatu Gemini 2.5 Pro zase o kousek poskočil v benchmarcích a také se vrátil na špičku uživatelských žebříčků LMArena a WebDevArena.
- OpenAI vydali model o3-pro, který nahrazuje o1-pro, a dokonce je o 87% levnější – nutno ale dodat, že cena o1-pro byla brutální. Podle benchmarků se nejedná zase o takový posun proti o1-pro, a už vůbec ne oproti základnímu o3. Je o nepatrný zlomek lepší než nová verze Gemini 2.5 Pro, je také ale 5x pomalejší a 10x dražší. Největší novinkou tak je, že OpenAI zároveň zlevnili základní o3 o 80 %. Ten je o ještě nepatrnější zlomek horší než Gemini 2.5 Pro, ale nově 2-3x levnější – a to už poměrně zamíchá s kartami.
- Google také v rámci AI Modu svého vyhledávače testuje funkci Search Live, která umožní s vyhledávačem konverzovat, v budoucnu dokonce i za využití dat z kamery vašeho telefonu.
- EleutherAI vydali v kooperaci s Hugging Face a řadou univerzit a výzkumných ústavů 8TB dataset Common Pile v0.1 s otevřenou licencí určený k trénování jazykových modelů.
- Apple vydal framework Foundation Models pro MacOS, iOS, iPadOS a visionOS. Prostřednictvím něj můžou aplikace lokálně spouštět jazykový model s 3B parametrů. Výhodou je, že jej lze využívat offline, a jeho inherentní bezpečnost – data neopustí vaše zařízení. Nevýhodou však jako uvšech modelů spouštěných na koncových zařízeních zůstává jeho vysoká spotřeba baterie. Vývojářům je dostupný už teď, uživatelé si na něj počkají až do září, kdy přijde příští velký update všech operačních systémů.
- ElevenLabs vydali alpha verzi nového text-to-speech modelu Eleven v3. Generovaný hlas je přirozenější a plynulejší (minimálně vangličtině), zlepšil se v konverzování s více lidmi naráz, nechá se v hovoru přirozeněji přerušovat apřibyla možnost využívat audio tagy, kterými můžete kontrolovat tón, emoce a styl hlasu – může například šeptat, křičet, mluvit smutným hlasem apod. Kritika se ale snáší na jeho neschopnost generovat hlas v reálném čase, časté bugy v nových funkcích, velmi přísný filtr slov, které nesmí říkat, ataké zvýšení jeho ceny na dvojnásobek. Nově sice podporuje přes 70 jazyků, podle uživatelů ale většiny z nich kvalitou znatelně zaostává za angličtinou.
- Czechoslovak Group, jejíž majitel Michal Strnad se nedávno stal nejbohatším Čechem, přibližně před měsícem emitovala dluhopisy v rekordní hodnotě 10 miliard korun. Tento týden oznámila, že se již všechny prodaly.
- Konsorcium investorů, jeho součástí jsou J&T Ventures, RockawayX, Naše Česko z J&T Banky, BD Partners a několik dalších, zainvestovali do Oddin.gg v řádu nižších stovek milionů korun.
Články, papery a newslettery:
- Apple | The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity
- Apple v této studii pomocí jednoduše škálovatelných logických úloh zkoumal, jak se reasoning modely vypořádávají s jejichnarůstající komplexitou. Ukázalo se, že nikterak dobře – při překročení určité komplexity úlohy modely začnou selhávat. Po dosažení této hranice modely dokonce začnou úlohy vzdávat dříve, než vyčerpají svůj budget tokenů na přemýšlení. Překonání tohohle problému bude naprosto klíčové v dalším vývoji umělé inteligence.
- Miton AI Newsletter #91 | Jak na vlastního AI agenta
- Deepnote Deep in data | DeepSeek vs Big LLM, Pandas' PyArrow speed up, Snowflake's feature avalanche to bury the competition?
Data gossip:
- Víme první: Karolína Everlingová přešla z Revolt.BI do Kebooly.
- Víme první: Eva Hankusová končí v BigHubu! Ale nebojte – z komunity se nestahuje, naopak. V zákulisí se šušká, že pokukuje spíš po klidnější klientské straně, kde by mohla naplno využít svůj cit pro propojení byznysu, dat a AI. Pokud hledáte někoho, kdo věci nejen vymyslí, ale hlavně dotáhne – víte, kam psát.
- Marián Žabka (ex BizzTreat) nastupuje do Alzy jako Data Engineer.
Podcasty, videa, přednášky:
- Data Talk #140: Marek Miltner
- Data Talk #138 | Petr Žáček (Ataccama)
- AI ta Krajta #6 | Benchmarky, AI v akademické sféře a průmyslu, jak dostat práci v Googlu?
- Chytrá a umělá | AI na cestách: Naplánuje výlet, smaže turisty z fotek a vybere tuňáka
- Data: Heaven or Hell? #65 | Digitalizace začíná u telefonního hovoru. Zdravotnictví není e-shop, ale z chaosu umíme udělat řád, říká Tomáš Havryluk, Medevio
Random trivia
Věděli jste, že Slack vznikl díky neúspěšné videohře?
V roce 2009 začali Tiny Speck, dnešní Slack Technologies, vyvíjet mírumilovnou prohlížečovou MMO hru s názvem Glitch. Vedl je Stewart Butterfield, který měl tou dobou na kontě Flickr, který vytvořil v roce 2004 se společností Ludicorp potom, co jim ztroskotal vývoj videohry. Flickr v roce 2005 prodal Yahoo, kde další 3 roky pracoval jako ředitel této platformy na sdílení fotek.
Aby se jim hra lépe vyvíjela, vytvořili si interní nástroj pro komunikaci jejich týmu, který umožňoval jednoduše vyhledávat v historii zpráv. Snad i díky němu se napodruhé zadařilo a hru v roce 2011 vydali. I přes počáteční technické problémy si hra našla oddanou hráčskou základnu. Jenže zatraceně malou. Modelem založeným na mikrotransakcích si na sebe nedokázala vydělat a tak se vývojáři rozhodli servery koncem roku 2012 vypnout.
Stewart Butterfield ale věděl, co dělat. Už to přece jednou vyšlo.
Vzal svůj tým teď už bývalých herních vývojářů a začali z jejich interní komunikační platformy vytvářet plnohodnotný produkt. Přišel také s názvem Slack, který je mimochodem zkratkou Searchable Log of All Conversation and Knowledge. Za8měsíců měli hotovo a Slack v srpnu 2013 vydali.
Následoval poměrně rychlý růst, už na konci roku 2015 měli 2 miliony aktivních uživatelů denně. Pod vedením Stewarta Butterfielda se vyšplhali až na 12,6 milionů uživatelů denně, respektive 21 milionů uživatelů měsíčně, na konci roku 2020, kdy se rozhodl Slack prodat Salesforce za krásných 27,7 miliard dolarů.
To není špatné na aplikaci, co vznikla tak nějak mimochodem při vývoji videohry.

⚒️ DATA JOBS
- Sazka
- BI specialista (Praha)
- BI specialista (Praha)
- Revolt.BI
- Data Engineer (Praha)
- Senior Data Engineer (Praha)
- Tech Lead (Praha)
- Colours of Data
- CRM Strategy Expert (Praha/remote)
- CRM Strategy Expert (Praha/remote)
- intecs
- Senior BI Consultant (Brno)
- BI Data Engineer (Brno)
- Emark
- Cloud Data Engineer – Snowflake (Praha/Pardubice/Bratislava)
- BI Specialist (Praha/Pardubice/Bratislava)
- Senior Consultant for Microsoft Fabric (Praha/Pardubice/Bratislava)
- FLO
- Data Analyst (Praha/Sydney)
- Data Engineer (Praha/Sydney)
- další datové a AI pozice
- BigHub
- Data Engineer (Praha)
- Gen AI Developer (Praha)
- Data Engineer (Praha)
- Aim
- AI Data scientist(Praha)
- Full Stack Engineer (Praha)
- AI / LLM Engineer (Praha)
- DeepScout
- Data scientist(Praha)
- Rossum
- Equilibre
- Second Foundation
- Data Engineer (Praha)
- Business Analyst (Dev) (Praha)
- Project Manager / Business Analyst (Praha)
- Quantitative Analyst(Praha)
- Direct Group
- Data Engineer (Brno)
- Senior Data Analyst (Praha)
- Greipi
- Medior/seniorní Analytik na AI projekt (full remote)
Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.
Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.
Chcete si přečíst naše starší newslettery?
Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?
Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!
A pokud vás naše práce baví a poskytuje vám hodnotu,
můžete nám poslat finanční podporuna kafe!
