DATA talk Newsletter #107 Pohrobci bývalých frontier modelů

#107 Pohrobci bývalých frontier modelů

Ahoj,

tenhle týden tu máme příval novinek od OpenAI, nějaké drobnosti od Anthropicu a xAI, umělou inteligenci, co odhalí tuberkulózu líp než člověk, a taky hvězdně obsazenou reklamu na Perplexity, která ostře útočí na Google.

Je tady další Data Talk Newsletter!

Newsletter nyní odebírá 1667lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden máme hvěždnou středu, ráno je byznys snídaně Emark o plánování a forecastingu, a celý den pořádá Apify svoji úplně první konferenci.

Příští týden:

Prague Crawl by Apify and Massive (středa 23. dubna, Praha)
EMARK Connect: Byznys snídaně (středa 23. dubna, Praha)
AI 4 DEV (středa 23. dubna, Praha)
AI ve veřejné správě (čtvrtek a pátek 24. a 25. dubna, Hluboká nad Vltavou)
The Vibe Coders Prague - Hackathon vol.3 (pátek 25. dubna)

Později:

Machine Learning Prague conference 2025 (pondělí až středa 28.-30. dubna, Praha)
AWS Community Day CZ (úterý 29. dubna, Praha)
Data Punkers 14: Co jste chtěli vědět o dbt, ale nikdo vám to neřekl(úterý 29. dubna, Praha)
DATA mesh #28 by SAZKA (úterý 13. května, Praha)
IDC CIO Summit (úterý a středa 20. a 21. května, Praha)
Konference AI: Bitva o digitální éru (středa 21. května, Ostrava)
Prague PostgreSQL Meetup: May Edition (pondělí 26. května, Praha)
Systeum Hub: AI Insights (středa 28. května, Praha)
WebExpo 2025 (středa až pátek 28.-30. května, Praha)
Data Point Prague (čtvrtek a pátek 29. a 30. května, Praha)
Konference DobroData (čtvrtek 3. září, Praha)

📰 Novinky, linky a drby

OpenAI tento týden vydali tři nové modely, tři starší naopak stahují

V OpenAI měli tenhle týden napilno. Vydali hned tři nové modely, ale také oznámili, že se od 14. června rozloučíme s modelem GPT-4.5. Přístupné zůstane pouze jeho research preview, a to předplatitelům všech úrovní. Důvod jeho odchodu je prozaický - je příliš nákladný na provoz. OpenAI na jeho provozu prostřednictvím ChatGPT tratí ohromné peníze. A aby toho nebylo málo, jeho superdrahé API téměř nikdo nepoužívá.

Místo něj na scénu přichází jako nový frontier model jeho modifikovaná verze

GPT-4.1. Jeho velkou předností jsou nízké provozní náklady a tomu odpovídající cena API. Je dokonce o čtvrtinu levnější než to u GPT-4o - což zní krásně, dokud si neuvědomíte, že pořád stojí asi osmkrát víc než DeepSeek V3. Rozdíl to ale už není takový, aby si za vyšší bezpečnost a jistotu, že s vašimi daty nedělají Číňani bůh ví co, leckdo nepřiplatil.

Komu to ale stále připadá moc, ten může sáhnout po odlehčených variantách

GPT-4.1 mini a GPT-4.1 nano. Kromě bleskové odezvy potěší i svou cenou. Menší GPT-4.1 nano už je cenově na úrovni již zmíněného DeepSeek V3, nutno však podotknout, že z benchmarků vychází o fous hůř než jeho čínská konkurence.

Zpět ale k plnotučné verzi modelu GPT-4.1. Ta překvapila svými schopnostmi. I když je řádově levnější než GPT-4.5, z benchmarků vychází až na pár výjimek stejně, nebo dokonce líp než jeho předchůdce. Znatelný progres model zaznamenal hlavně vkvalitě generovaného kódu, což potěší nejednoho vývojáře.

Další příjemnou novinkou je rozšíření kontextového okna na 1 milion tokenů. Nejde o nic světoborného, Llama 4 nabízí desetkrát tolik, jinak tímto OpenAI dorovnali většinu konkurenčních frontier modelů.

Model je zatím dostupný jenom přes API, v blízké době by se ale měl objevit ivChatGPT.

OpenAI si napravili přešlap s nekonkurenceschopným GPT-4.5, jedna výtka by tu ale přece jenom byla. I v rámci často chaotického pojmenovávání modelů je název GPT-4.1 dost nešťastný. Nový model by prostě neměl mít nižší číslo než ten předchozí, zvlášť když ten starý v mnoha ohledech překonává. Internetový lid si z tohohle pojmenování okamžitě začal utahovat, osobně mě nejvíc pobavila tahle predikce snižování čísla nejvyššího dostupného modelu končící GPT-0 v roce 2033.

Teď ale něco málo k novým reasoning modelům. Představeny byly o3 a o4-mini, které jsou podle benchmarků jednoznačně nejlepší reasoning modely, které vOpenAI vytvořili. Poměrně překvapivé je, že v některých úlohách zhruba desetkrát levnější o4-mini překonal dražší o3. Vývojáři se tak budou muset pořádně zamyslet, který model je pro jejich účely vhodnější.

Oba modely mají přístup ke kompletnímu arzenálu nástrojů OpenAI - od webového vyhledávání a Deep research přes generování obrázků až po spouštění kódu v Pythonu.

Své předchůdce o1 a o3-mini nové modely ve všech ohledech překonávají. Důkazem vyšší efektivity modelů je i cena API - uvarianty mini zůstává stejná jako u jejího předchůdce, o3 je dokonce o třetinu levnější než o1. VChatGPT je teď dostupná jen tato nová generace, ta předchozí už se odebrala dokřemíkového důchodu.

Kromě nových reasoning modelů vydali OpenAI také open-source kódovacího agenta CodexCLI, který běží přímo v terminálu uživatele a dokáže se využívat tyto nové modely. Umí přímo editovat soubory s kódem, ke kterým mu dáte přístup, a zvládá i verzování. Stáhnout si ho můžete na GitHubu.

ChatGPT taky nově umí pracovat s vaší konverzační historií. Nejenže z ní dokáže vytáhnout relevantní informace, ale také vaše preference, díky čemuž může vyladit svůj styl a přístup k úlohám, které mu zadáte.

Dále také OpenAI vydali nový text-to-speech model, který můžete využívat přes API. O tom, že je opravdu působivý, se můžete přesvědčit v tomto demu.

Sam Altman také v rozhovoru odhalil že OpenAI plánují vydat open-source model, který by neměl příliš zaostávat za současnými frontier modely.

A neposlední řadě ještě jedna změna, která se týká hlavně firemních uživatelů. OpenAI zavedlo nový bezpečnostní protokol - pokud chcete mít přístup k těm nejpokročilejším funkcím jejich API, budete muset nechat svou společnost prověřit a získat status Verified Organization. Chtějí tím zabránit zneužívání svých nejpokročilejších technologií k nekalým účelům.

Mimochodem, nesou se zvěsti, že v OpenAI vyvíjejí vlastní sociální síť. Inspirací jim pravděpodobně byl Grok, který to ale vzal z druhé strany. Nejdřív byla sociální síť X, pak se na ni nabalil AI model. Šeptanda říká, že OpenAI chce využít data, která má zChatGPT, k tvorbě AI based sociální sítě, a následně využívat data z ní ke zdokonalování svých modelů. Uvidíme, co z toho bude.

Další novinky:

Claude dostal schopnost provádět komplexní rešerše na internetu podobně jako to umí ChatGPT pomocí Deep Research. Přibyla také integrace s Google Workspace, díky které může model pracovat se soubory uživatele, jeho emaily nebo kalendářem.
xAI nově zpřístupnili API modelů Grok 3 a Grok 3 Mini. Oba modely mají možnost přepnout se do reasoning módu, pokud to zadaná úloha vyžaduje. Do Groku taky přibyla funkce Grok Studio, která je obdobou Canvasu v konkurenčních modelech.
Švýcarští výzkumníci z univerzity v Lausanne vyvinuli AI nástroj ULTR-AI, který dokáže ze snímků z ultrazvuku odhalit plicní tuberkulózu. Dokáže správně odhalit 91% případů, což je o 9 % víc, než je průměr lidských lékařů.
Při VUT v Brně vzniklo České polovodičové centrum. Má zvýšit počet expertů v oboru a pomáhat startupům v oblasti výroby čipů.

Články a papery:

Data gossip:

Jakub Šuster (CEO ELV.AI) se dostal do žebříčku Forbes 30 Under 30 Europe. Gratulujeme!
Matyáš Boháček nastupuje do DeepMind na pozici student researcher.
Největším ambassadorem vibe codingu se v Česku stává Tomáš Čupr! Díky copilotům se zase pustil do programování a tento týden poslal svůj první pull request do open source projektu na githubu.
Známe vítězné projekty hackathonu proti Rakovině.

Podcasty, videa, přednášky:

Data Talk #132 | Jan Přívratský (SAZKA a.s.) o každodenním provozu v technické sekci Sazky, o výzvách při managementu 28TB datového skaldu, otom, jak smysluplně optimalizovat, nebo o tom, jak managovat platformu s50 dodavateli.
Prompt | HAL se nekoná, říká o umělé inteligenci Kašpárek
Chytrá a umělá | Opraví AI podlahu, zachrání kytku a zvládne namalovat úzké rty?
Insane Data Podcast | Douglas Laney, Author of Infonomic & Data Juice
Cinkátko 70 | Učí komunikovat top startup foundery: Vojta Horna z Index Ventures
Cinkátko 71 | AI agenty má v malíčku: Tereza Tížková z E2B
PodVocasem S11E06 | Martin Šafránek - Data Vault
Oblakadabra #7 | Make a Google Workspace: automatizace, agenti a MCP
pepe logic #122 | Největší čeští šmíráci, gigabitový internet vzduchem, evropský Starlink
Adastra Podcast 61 | Ráčková, Laifr, T-Mobile: Nečekali jsme to. Týmy si začaly tvořit datové produkty samy
Adastra podcast 62 | Optimalizace nám ušetří 15 milionů ročně. Ne každé řešení se ale vyplatí, říká Artur Heider z Hyundai
intecs insider #23 | Jak (ne)optimalizovat BI řešení - A. Bufka

Nová reklama Perplexity se otevřeně pouští do Googlu

Do hlavní role obsadili Lee Jung-jae, hvězdu Squid Game a prvního korejského herce, který získal cenu Emmy. Je to skvěle natočené, extrémně našlapané, rozhodně je to jedna z nejlepších reklam, které jsem v životě viděl. Tohle prostě musíte vidět.

Random trivia

Věděli jste, že kapacita cédéček byla designována tak, aby se na něj vešla celá Beethovenova 9. symfonie?

Když v 70. letech Sony a Philips spolupracovali na vývoji kompaktního disku, řešili mimo jiné zásadní otázku: jak velká by měla být jeho kapacita? V té době se uvažovalo o disku s průměrem 11,5 cm, což by umožnilo zhruba 60 minut záznamu při kvalitě vzorkovací frekvenci 44.1 kHz a bitové hloubce 16 bitů.

Jenže pak do hry vstoupil viceprezident Sony Norio Ohga, milovník vážné hudby a vystudovaný operní pěvec. Ten trval na tom, že na jedno CD se musí vejít celá Beethovenova 9. symfonie. kterou miloval, bez přerušení. Ta má v plné délce 74minut. Výsledkem bylo, že finální formát CD dostal průměr 12 cm, což umožnilo přesně tuto délku záznamu - a vznikl tak nový standard.

⚒️ DATA JOBS

Sazka
- Senior IT projektový manažer (Praha)
Revolt.BI
- Data Engineer (Praha)
- Senior Data Engineer (Praha)
- Tech Lead (Praha)
Colours of Data
- CRM Strategy Expert (Praha/remote)
intecs
- Senior BI Consultant (Brno)
  BI Data Engineer (Brno)
Emark
- Data Architect – Azure Synapse (Praha/Pardubice/Bratislava)
- Data Scientist (Praha/Pardubice/Bratislava)
- BI Specialist (Praha/Pardubice/Bratislava)
Notino
- Engineering Team Lead / .NET & React (Brno)
- AI Specialist (Brno)
Keboola
- Software Engineer - Frontend(Praha)
FLO
- Data Analyst (Praha/Sydney)
- Data Engineer (Praha/Sydney)
- další datové a AI pozice
BigHub
- Senior Gen AI Developer / AI Architect(Praha)
Nova
- Senior Business Analyst pro Machine Learning projekty (Praha)
- Data Engineer pro AI projekty (Praha)
MEDIA FACTORY Group
- Datový Analytik (Praha)

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.ai a vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery?

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!