Newsletter

#137 AI král je mrtev, ať žije AI král

Ahoj,

minulý týden vyšly Gemini 3.0, GPT-5.1-Codex-Max a Grok 4.1, na které se podíváme detailněji. Kromě toho se Slevomat vrátil do českých rukou, Evropská komise přišla s plánem, jak snížit byrokratickou zátěž digitálních firem, Anthropic přidal do API Claude dlouho žádanou funkci a GoodAI představili svoje plány s drony.

A taky je tady další Data Talk Newsletter.

Newsletter nyní odebírá 1879lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Datamole slaví 10. narozeniny

2015 byl plodný rok. Po epické party Apify slaví desáté narozeniny také Datamole, odborníci na data, AI a IoT, kteří pomáhají hlavně průmyslovým a zemědělským firmám posouvat jejich byznys – hezky to popsal jejich CTO Ondra Stuchlík vnašem podcastu

Oslaví je na akci Data & AI Innovation in Industry & Agriculture, která proběhne vestředu 26.listopadu napůdě FIT ČVUT. Na ní vám například Ondřej Vaněk (CEO Blindspot, CAIO ADASTRA) vysvětlí, jak pomocí AI rozjet mezidruhový obchod sgorilami. O tom v Data Talku nemluvil!

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Tento týden:

Pak:

Víte o datové akci, která tady chybí, nebo ji dokonce pořádáte?

Pošlete nám ji na michal@fenekpr.cz

📰 Novinky, linky a drby

Google představil nového krále AI modelů

Dva týdny zpátky GPT-5.1 svým nenápadným upgradem potichu vystřídal svého předchůdce na trůně krále mezi AI modely. Minulý týden ale dorazil s fanfárami a ohňostrojem Gemini 3 Pro a o korunu ho velmi rychle připravil.

Nejde totiž o žádný mírný pokrok v mezích zákona; máme tu čest splnotučným modelem další generace, který pokořil rekordy ve všech benchmarcích kromě programovacích SWE‑bench Verified a Terminal‑Bench 2.0, které opanoval nový GPT-5.1-Codex-Max.

Největšího posunu dosáhl právě v těch nejtěžších benchmarcích: Humanity's Last Exam testujícího práci s akademickými vědomostmi – 45,8 % (předchozí rekord: GPT-5.1 – 26,5 %), ARC-AGI-2 testujícího schopnost řešit vizuální hádanky – 31,1 % (p.r.:GPT-5.1 – 17,6 %) nebo matematického MathArena Apex – 23,4 % (p.r.:Grok4 Fast – 5,21 %). Drtil ale například iagentní benchmarky; exceloval také vpráci sdlouhým kontextem. Model navíc oceňují iuživatelé – v duelech vLMArena si vydobyl prvenství ve všech kategoriích, kterých se účastní.

Za kvalitu se ale platí – v tomto případě konkrétně $2za1M tokenů inputu, $12za1M tokenů outputu prostřednictvím API, což je o 60 % více, než stál Gemini 2.5 Pro. Na druhou stranu je o dost šetrnější ve využívání tokenů – podle nezávislých testů ArtificialAnalysis byl při řešení stejných benchmarků v konečném důsledku jen o12%dražší než jeho předchůdce.

Spolu s modelem vydal Google také platformu Antigravity určenou pro tvorbu anasazování AIagentů, která jim umožňuje ovládat terminál a webový prohlížeč apodporuje asynchronní spouštění více agentů najednou – tedy slušný standard, ale nic nového pod sluncem. Zajímavější novinkou jsou ovšem Artifacts – záznamy, které o své práci agenti průběžně vytvářejí, vpodobě screenshotů, seznamů úkolů, implementačních plánů nebo jednoduché dokumentace. Díky nim lze práci agentů rychle a jednoduše kontrolovat, ale také v reálném čase připomínkovat.

A aby toho nebylo málo, přihodil ještě Google nový obrázkový model Nano Banana Pro. Oproti svému předchůdci nejen generuje lepší a realističtější obrázky, ale také podporuje namísto limitu 1024x1024 px rozlišení až do 4K a přináší nástroje provětší kreativní kontrolu, pomocí kterých lze simulovat změnu úhlu focení, zaostření, nasvícení nebo hloubky ostrosti, a také provádět color grading obrázku nebo měnit jeho poměr stran. Nově navíc dokáže složit výsledný obrázek až ze 14 vstupních fragmentů a dokonce má přístup i k vyhledávání na internetu.

Nový GPT-5.1-Codex-Max dělá to, co dělá, nejlíp

Gemini 3 momentálně dominuje ve všech oblastech kromě jediné – programování. Vté je šampionem čerstvě vydaná nová verze agentního kódovacího modelu odOpenAI GPT‑5.1‑Codex‑Max, kterou její tvůrci obdařili schopností kompakce (compaction), která spočívá v automatické kompresi a promazávání staršího kontextu. Díky tomu model dokáže pracovat s miliony tokenů a neztratí koherenci ani po 24 hodinách práce. Příjemným vedlejším efektem je také znatelně nižší spotřeba tokenů při přemýšlení (během testování OpenAI o 27–58 % méně), která šetří čas i výpočetní výkon.

Není proto divu, že GPT‑5.1‑Codex‑Max dosáhl rekordních skóre vbenchmarcíchSWE‑bench Verified aTerminal‑Bench2.0, které jsou zlatým standardem v testování schopnosti modelů programovat. Spíš je na první pohled překvapivé, že minulé rekordy překonal pouze o 0,7%, respektive 3,9% – pravděpodobně to ale bude způsobeno tím, že velikost kontextu úloh vtěchto benchmarcích není tím limitujícím faktorem, na kterém si ostatní frontier modely vylámou zuby.

Zvláštně komunikovaný Grok 4.1

Představení Grok 4.1 kvůli vydání Gemini 3 následující den poněkud zapadlo – a naslovo skoupá komunikace, která ho provázela, tomu taky nepomohla. O nové verzi modelu jsme se dozvěděli pouze to, že oproti svému předchůdci 3x méně halucinuje a výrazně se zlepšila její emoční inteligence, a také že patří ke špičce vkreativním psaní. Snad právě kombinace těchto vlastností stála za tím, že model obsadil nejvyšší příčku žebříčku LMArena v kategorii textových výstupů – tedy dokud jej následujícího dne Gemini 3 nevyšoupl na druhé místo.

Mimochodem, mysleli byste si podle názvu, že se jedná o modifikovaný model Grok4? Chyba lávky! Dokumentace i API portál o něm mluví jako o Grok 4.1 Fast, aže je postavený na notně odlehčeném Grok 4 Fast, ukazují i nezávislé testy Artificial Analysis – oba modely jsou silné ve stejných benchmarcích, v jiných zase podobně selhávají.

Očividně se tak nejedná o vylepšený Grok 4 – proč tedy ten název? Nejpravděpodobnější je, že se xAI rozhodli nevytvořit/nevydat verzi 4.1 plnohodnotného modelu a jedinou vydanou verzi prostě pojmenovali Grok 4.1. Ti

cyničtější z nás by v tom ale mohli vidět snahu přimět uživatele přestat používat původní Grok 4, který je v mnoha ohledech jednoznačně lepší než Grok 4.1, ale zároveň (soudě podle ceny API) přibližně 15x dražší na provoz.

🗞️ Další novinky:

💰 Investice, akvizice a business:

📄 Články, papery a newslettery:

☕ Data gossip:

🎙️ Podcasty, videa, přednášky:

📚 Random trivia

Věděli jste, že některé želvy dokáží dýchat zadkem?

Některé druhy sladkovodních želv dokáží okysličovat svoji krev nejen dýcháním plícemi, ale také prostřednictvím kloaky – víceúčelového otvoru, který jim jinak slouží i kvylučování, rozmnožování a kladení vajec. V ní mají umístěny dva váčkovité orgány zvané kloakální burzy, do kterých dokáží načerpat vodu, získat z ní kyslík, vyloučit do ní oxid uhličitý a vodu zase vypumpovat ven.

Protože ale voda obsahuje přibližně 200x méně kyslíku než vzduch, je kloakální dýchání oproti plicnímu mnohem méně efektivní. Využívají jej proto pouze některé druhy, které žijí v rychle tekoucích řekách, nebo tráví zimu pod ledem.

Říční želvy se díky kloakálnímu dýchání nemusí tak často vynořovat na hladinu, což je pro ně kvůli silným proudům namáhavé, a mohou tak zůstat pod vodou místo několika minut celé hodiny. Jeden australský druh, krátkokrčka bělooká, dokonce dokáže touto cestou pokrýt svoji potřebu kyslíku úplně, což jí umožňuje zůstat pod hladinou neomezeně dlouho.

Několik severoamerických druhů želv je pak odkázáno pouze na kloakální dýchání většinu zimy – žijí totiž ve stojatých vodách, jejichž hladina zpravidla zamrzá. Když teplota vody klesne pod určitou úroveň, upadají tyto želvy do stavu brumace (obdoba hibernace teplokrevných živočichů), ve kterém se jim výrazně zpomalí metabolismus a tím pádem i klesne jejich spotřeba kyslíku. V tomto úsporném režimu jim stačí pasivní forma kloakálního dýchání, při níž nedochází k aktivnímu čerpání vody do kloakálních burz, které by je během brumace zbytečně stálo energii. Takto přečkávají i několik měsíců, dokud led neroztaje a ony se nemohou znovu nadechnout nad hladinou.

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastně odkudkoliv se dá.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!