#129 Deterministický model a hardcore mode
Ahoj,
Thinking Machines Lab vytvořil první model, který na určitý prompt generuje vždy stejný výsledek, xAI vydali Grok 4 Fast, NVIDIA investovala do OpenAI, vyšla plná verze PostgreSQL 18 a LinkedIn řeší Hardcore mode™.
A taky je tady další Data Talk Newsletter.
Newsletter nyní odebírá 1830lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.
Data Day 2025
Za dva měsíce, ve čtvrtek 27. listopadu, nás čeká třetí Data Day, vánoční večírek datové scény zabalený do půldenní konference.
Tématem jsou letos AGENTI, jak jinak. Celou akci chceme díky božím partnerům (SAZKA, Keboola, Apify, GoodData, LIVESPORT a intecs) posunout zase o level výš než loni.
Sice ještě nemáme aktualizovaný web ani finalizovaný program, to nám nebrání ale prodávat lístky! A pro pvních 50 z vás, kterým to nebrání je koupit máme 50% slevu - stačí zadat slevový kód EARLY BIRD.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📅 Kalendář datových akcí
Následující týden:
- Fajne prompty aka Párty AI nadšenců (čtvrtek 2. října, Ostrava)
Pak:
- Planeta AI (pondělí 6. října, Praha)
- Živé natáčení podcastu Na volné noze s Janem Romportlem (středa 8. října, Brno)
- Datamole meetup: The Future of Data Analytics (čtvrtek 9. října, Brno)
- AI HotSpot 2025 (čtvrtek 16. října, Praha)
- AI transformace zdravotnictví(středa 22. října, Praha)
- DevFest(čtvrtek a pátek 23. a 24. října, Praha)
- Dny AI (pondělí až neděle 3.-16. listopadu, po celém Česku)
- TechMeetup Conference(pátek 7. listopadu, Ostrava)
- Hackaton Když data promluví 2025 (pátek až neděle 14.-16. listopadu, Olomouc)
- Data Day (čtvrtek 27. listopadu, Praha)
- Machine Learning Prague 2026 (pondělí až středa 4.-6. května 2026, Praha)
📰 Novinky, linky a drby
xAI vydali odlehčený Grok 4 Fast
Nový Grok 4 Fast se xAI opravdu povedl. Je velice rychlý, cena za token je nevídaně nízká, a navíc s nimi nakládá při reasoningu poměrně úsporně. Schopnosti modelů, které se pyšní těmito vlastnostmi, však obvykle nejsou nijak oslnivé. V tom se ale Grok 4 Fast liší.
Nejen že je zatraceně dobrý ve své váhové kategorii – v řadě benchmarků dýchá napaty frontier modelům a v některých je dokonce překonává. Má samozřejmě isvé limitace – na pomoc s programováním rozhodně existují lepší modely, stejně tak lehce zaostává i v benchmarcích vyžadujících vysoce komplexní uvažování a aplikaci znalostí, jako je Humanity's Last Exam. Jestli však v něčem naprosto exceluje, je to vyhledávání na internetu – v tomto konkrétním žebříčku LM Areny se bezpečně usadil na prvním místě.
OpenAI a NVIDIA uzavřeli partnerství
V rámci tohoto partnerství NVIDIA postupně zainvestuje do OpenAI 100 miliard dolarů. Tyto prostředky poslouží k rozšíření jejich výpočetní infrastruktury o AI čipy ocelkové spotřebě 10GW – samozřejmě ty od NVIDIA. První gigawatt by měl být nasazen vdruhé polovině roku 2026 v podobě chystané generace čipů Vera Rubin.
Největší otázkou ale zůstává, jak plánují vyřešit napájení nové infrastruktury. Pro představu, největší datacentrum na světě, čínský Inner Mongolia Information Park, má spotřebu 150 MW. 10 GW je pětinásobek výkonu Temelínu. Je jisté, že infrastruktura bude muset být distribuovaná mezi mnoha a mnoha datacentry, i tak se ale bude jednat o obrovský nápor na americkou rozvodnou síť, která byla výrazněji rozšiřována naposledy v 50. a 60. letech minulého století a už nyní je vpodstatě na svém limitu. Některá datacentra už teď raději využívají vlastní, převážně plynové elektrárny – uvidíme, jestli se touto cestou vydají i OpenAI.
Každopádně mi tohle podávání peněz tam a zase zpátky připomnělo tenhle vousatý vtip o dvou ekonomech:
Další novinky:
- Vyšla plná verze PostgreSQL 18, která přináší asynchronní I/O, nativní podporu UUIDv7, vylepšený EXPLAIN, virtuální sloupce a hromadu dalších vylepšení.
- Google vydal Frontier Safety Framework 3.0, novou verzi souboru protokolů pro rozpoznání a zmírnění rizik frontier modelů.
- Scale AI představili nový benchmark SWE-Bench Pro odpovídající na rapidní vývoj software engineeringových AI agentů. Neobsahuje už žádné zbytečně jednoduché úlohy, naopak se zaměřuje na rozsáhlé problémy odpovídající reálnému enterprise nasazení agentů. Zatímco v jejich předchozím benchmarku SWE-Bench Verified dokázali ti nejlepší agenti vyřešit přes 70 % úloh, v nové verzi si neporadí ani se čtvrtinou úkolů.
- Kromě toho spustili Scale AI nový uživatelský žebříček AI modelů SEAL Showdown podobný tomu od LM Arena. Hodnocení modelů probíhá v rámci platformy Outlier, přes kterou Scale AI crowdsourcují testování a zdokonalování AI modelů za drobnou odměnu. Tato platforma sbírá ověřené údaje o svých hodnotitelích – zemi původu, věk, vzdělání, profesi a jazyk konverzací. Díky tomu lze v jejich žebříčku filtrovat podle těchto údajů a zjistit, který AI model preferují uživatelé podobní vám. Tedy kromě toho asi nejdůležitějšího hlediska – profese, podle které z nepochopitelných důvodů filtrovat nejde.
- Microsoft vyvinul revoluční metodu chlazení čipů, kdy je chladicí kapalina hnána miniaturními kanálky o tloušťce okolo 0,1 mm přímo skrz čip. Je díky tomu až 3x účinnější než běžně používané aktivní chlazení.
- Kromě OpenAI zainvestovala NVIDIA také do ElevenLabs, startupu zaměřujícího se na tvorbu AI modelů určených ke generování hlasu a zvuku.
- Keboola vydala Osiris Pipeline v0.2.0, deterministický kompilátor proAInative datové pipeliny.
- České O2 představilo lokalizovanou verzi AI babičky, jejímž úkolem je plýtvat časem podvodníků. Operátor automaticky přesměrovává hovory, které vyhodnotí jako podvodné, na tento AI systém, který si s ním hlasem herečky Miluše Hradské co nejdéle povídá a předstírá, že je zmatená, částečně kooperující důchodkyně.
- Alza začala testovat humanoidní roboty. Zatím mají dva – Adama a Boženu – do budoucna ale plánují jejich řady rozšířit.
Články, papery a newslettery:
- Thinking Machines Lab | Defeating Nondeterminism in LLM Inference
- I když nastavíte temperature (parametr určující kreativitu a variaci výsledků) běžného jazykového modelu na nulu, nedostanete na stejný prompt vždy stejný výsledek. AI lab Thinking Machines bývalého CTO OpenAI Miry Murati však zjistil, jak toto chování odstranit.
- Když model generuje text, provádí obrovské množství matematických operací. Ty jsou rozdělovány do batchů, které se zpracovávají paralelně. Velikost batchů závisí na řadě faktorů – aktuálním počtu souběžných požadavků a vytížení serveru, jejich průběžném dokončování, časových limitech pro batchování a paměťových omezeních.
- Při rozdílné velikosti batchů jsou dílčí mezivýpočty prováděny v rozdílném pořadí, což kvůli zaokrouhlování čísel s plovoucí desetinou čárkou vede k drobným odchylkám ve výsledcích, které můžou vést kjiné volbě dalšího tokenu.
- Kvůli tomu běžné modely i při temperature 0 generují na stejný prompt rozdílné výsledky – například na prompt „Řekni mi něco o Richardu Feynmanovi.“ vygeneroval testovaný při 1 000 pokusech 80 různých odpovědí.
- Řešením je nakonfigurovat model tak, aby výpočty prováděl metodami, které nejsou ovlivňovány velikostí batchů a udržují stejné pořadí akumulací dílčích výsledků – pak bude generovat na stejný prompt vždy stejný výsledek.
- Kvůli využívání fixního postupu při výpočtech namísto optimálního však bude takový model o poznání pomalejší – v závislosti na zvolené metodě zhruba 1,5x až 2x.
- Jan Romportl | recenze knihy If Anyone Builds It, Everyone Dies: Why Superhuman AI Would Kill Us All
Data gossip:
- Zakladatel Better Stack Juraj Masár zčeřil vody LinkedInu tím, že nabídl svým zaměstnancům možnost pracovat v Hardcore modu™ – 60 hodin týdně spovinností reagovat na pracovní zprávy i během víkendů a s pouhými 10dny dovolené ročně, za což nabízí dvojnásobný plat. Reakce na sebe nenechaly dlouho čekat. Podle zakladatele CDN77 Zdeňka Cendry je placení podle času stráveného v práci přežitek a mnohem rozumnější je platit dvojnásobek těm, kteří přinášejí firmě reálnou hodnotu – a to se podle něj bude z dlouhodobého hlediska dařit spíš zaměstnancům, kteří nejsou přetížení. Zakladatel Apify Jan Čurn potom dodává, že u nich by Hardcore mode™ ani nemohl fungovat, netrackují totiž odpracované hodiny a dokonce ani dovolené – důležité jsou pouze výsledky práce.
- Máte hluboké know-how, které chcete sdílet s kolegy z oboru formou workshopu? Machine Learning Prague možná hledají právě vás.
- Už jen do 30. září máte možnost nominovat výjimečné osobnosti nebo organizace působící v oblasti umělé inteligence do soutěže AI Awards 2025.
- Před dvěma lety se podařilo Blindspot AI pomocí jejich predikčního modelu předpovědět na základě 13 % sečtených hlasů vítěze prezidentské volby sodchylkou 9 setin procenta. Příští sobotu se pokusí o totéž během voleb do Poslanecké sněmovny – jejich předpověď můžete sledovat tady.
- V Carebot došlo k rošádě rolí. Daniel Kvak se ujme pozice CTO, na pozici CEO přichází druhý zakladatel (a bývalý moderátor zpráv na Primě) Matěj Misař.
Podcasty, videa, přednášky:
- Data Talk #154 | Tomáš Dvořák (Apoco) o jeho cestě od skriptování modů pro GTA San Andreas až po vývoj AI infrastruktury pro IBM Research, vývoj open-source frameworku BeeAI a Agent Communication Protocolu
- Igor Hlina aka Srigi | tutoriál Claude code custom (slash) commands
- Data Boutique | Nerozhodnutí voliči tentokrát volby nerozhodnou
- AI ta Krajta #21 | Agent ID - hlídací pes pro AI agenty, bourání jazykových bariér ve zdravotnictví
- PodVocasem S13E01 | Honza Láznička - Data engineering v Billigence
- Big Data and AI at the CERN LHC
Random trivia
Věděli jste, že desátá největší pyramida na světě je prodejna rybářských prutů?
Je jí Memphiská pyramida, známá také jako Bass Pro Shops pyramida, která stojí veměstě Memphis v americkém státě Tennessee. Podle původního konceptu zroku 1954 měly vzniknout pyramidy tři, nejvyšší z nich se měla tyčit ještě skoro opolovinu výš než tento 98 metrů vysoký kolos ze skla a železobetonu.
Proč by ale někdo proboha stavěl v Memphisu v Tennessee pyramidu? Autora původního architektonického návrhu Marka C. Hartze inspiroval prostý fakt, že je toto město pojmenováno po Memphisu, hlavním městě starověkého Egypta vobdobí Staré říše, kdy byla postavena většina pyramid.
Koncem osmdesátých let projekt oživil syn původního autora Jon Brent Hartz, kterému se podařilo pro něj nadchnout místní developery Johna Tigretta a Sidneyho Shlenkera. Postavit tři obří pyramidy by však byl poněkud megalomanský podnik, takže měla vzniknout jen jediná, koncipovaná jako sportovní aréna pro 20142 diváků. I přes štědrou podporu z veřejných fondů se jim ale projekt začal sypat pod rukama, a tak nad ním muselo převzít město kontrolu. Pyramidu, která byla dokončena v listopadu 1991, proto dodnes vlastní Memphis.
K jejímu dokončení se váže jistá podivuhodná příhoda. Krátce po něm si místní údržbáři všimli, že na její špičce připevněn jakýsi objekt, který v plánech rozhodně nebyl. Ukázalo se, že jedná o kovový box přivařený ke konstrukci. Městští úředníci jej nechali sundat a převézt na okresní úřad. Uvnitř našli sametem potaženou schránku, v níž se nacházela malá křišťálová lebka.
Krátce nato se ukázalo, že ji na vrcholek Pyramidy připevnil jistý Isaac Tigrett, mimo jiné zakladatel řetězce Hard Rock Café. Ten si ujížděl na východním mysticismu a učinil tak na pokyn jistého indického guru, podle kterého měla mít takto umístěná lebka „dopad kosmického významu“. Její odstranění Tigrett nesl velice těžce a nechal se slyšet, že tím byla přivolána hrozná kletba. Místní dodnes žertují, že tahle kletba může za stav, ve kterém se Memphis v současnosti nachází — město se potýká s mimořádně vysokou mírou kriminality, chudoby a bezdomovectví a velkým možstvím drogově závislých.
Pyramida nejčastěji hostila utkání v basketbalu a halovém americkém fotbalu, konaly se v ní ale i boxerské zápasy, wrestlingové shows a koncerty rockových hvězd. Když se ale město Memphis v roce 2001 rozhodlo koupit a přestěhovat tým NBA Vancouver Grizzlies, ukázalo se, že tato pouhých 10 let stará aréna nesplňuje standardy nejvyšší basketbalové ligy.
Masivní přestavba nutná k jejich naplnění by byla tak drahá, že bylo pro město levnější postavit za 250 milionů dolarů nový stadion FedExForum. Od jeho dokončení v roce 2004 se veškeré sportovní události konaly tam a Memphiská pyramida se tak stala pouze občasným dějištěm různých kulturních akcí a v jednom případě i improvizovaným filmovým studiem.
Jen rok nato se kolem prostoru začal motat americký gigant v oblasti prodeje rybářského, loveckého a outdoorového vybavení Bass Pro Shops. Trvalo však dlouhých 5 let vyjednávání, než se s městem Memphis dohodli na konkrétní podobě smlouvy o pronájmu Pyramidy na celých 55 let. Tu do roku 2015 přetvořili vneuvěřitelně výdělečný multifunkční komplex o 28 podlažích, který v sobě kromě jejich obřího obchodu skrývá například hotel, řadu restaurací, bowlingovou halu, střelnici, lukostřelnici, muzeum lovu vodního ptactva, mořský svět a také umělou bažinu plnou aligátorů.
Na tenhle monument kapitalismu je, zdá se, i kletba křišťálové lebky krátká.

⚒️ DATA JOBS
- Sazka
- BI specialista (Praha)
- BI specialista (Praha)
- Colours of Data
- CRM Strategy Expert (Praha/remote)
- intecs
- Senior BI Consultant (Brno)
- Senior BI Consultant (Brno)
- Emark
- Cloud Data Engineer – Snowflake (Praha/Pardubice/Bratislava)
- BI Specialist (Praha/Pardubice/Bratislava)
- Cloud Data Engineer – Azure - (Praha/Pardubice/Bratislava)
- FLO
- Data Analyst (Praha/Sydney)
- Data Engineer (Praha/Sydney)
- další datové a AI pozice
- Miton
- Venture Associate (Praha/remote)
- Aim
- Full Stack Engineer (Praha)
- AI / LLM Engineer (Praha)
- Rossum
- GoodData
- BI Solution Architect (Praha/Brno)
- Kindwise
- O2
- Tech Lead pro AI platformu (Praha)
Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.
Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.
Chcete si přečíst naše starší newslettery?
Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?
Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!
A pokud vás naše práce baví a poskytuje vám hodnotu,
můžete nám poslat finanční podporuna kafe!
