Newsletter

#107 Pohrobci bývalých frontier modelů

Ahoj,

tenhle týden tu máme příval novinek od OpenAI, nějaké drobnosti od Anthropicu a xAI, umělou inteligenci, co odhalí tuberkulózu líp než člověk, a taky hvězdně obsazenou reklamu na Perplexity, která ostře útočí na Google.

Je tady další Data Talk Newsletter!

Newsletter nyní odebírá 1667lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit?  Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden máme hvěždnou středu, ráno je byznys snídaně Emark o plánování a forecastingu, a celý den pořádá Apify svoji úplně první konferenci.

Příští týden:

Později:

📰 Novinky, linky a drby

OpenAI tento týden vydali tři nové modely, tři starší naopak stahují

V OpenAI měli tenhle týden napilno. Vydali hned tři nové modely, ale také oznámili, že se od 14. června rozloučíme s modelem GPT-4.5. Přístupné zůstane pouze jeho research preview, a to předplatitelům všech úrovní. Důvod jeho odchodu je prozaický - je příliš nákladný na provoz. OpenAI na jeho provozu prostřednictvím ChatGPT tratí ohromné peníze. A aby toho nebylo málo, jeho superdrahé API téměř nikdo nepoužívá.

Místo něj na scénu přichází jako nový frontier model jeho modifikovaná verze

GPT-4.1. Jeho velkou předností jsou nízké provozní náklady a tomu odpovídající cena API. Je dokonce o čtvrtinu levnější než to u GPT-4o - což zní krásně, dokud si neuvědomíte, že pořád stojí asi osmkrát víc než DeepSeek V3. Rozdíl to ale už není takový, aby si za vyšší bezpečnost a jistotu, že s vašimi daty nedělají Číňani bůh ví co, leckdo nepřiplatil.

Komu to ale stále připadá moc, ten může sáhnout po odlehčených variantách

GPT-4.1 mini a GPT-4.1 nano. Kromě bleskové odezvy potěší i svou cenou. Menší GPT-4.1 nano už je cenově na úrovni již zmíněného DeepSeek V3, nutno však podotknout, že z benchmarků vychází o fous hůř než jeho čínská konkurence.

Zpět ale k plnotučné verzi modelu GPT-4.1. Ta překvapila svými schopnostmi. I když je řádově levnější než GPT-4.5, z benchmarků vychází až na pár výjimek stejně, nebo dokonce líp než jeho předchůdce. Znatelný progres model zaznamenal hlavně vkvalitě generovaného kódu, což potěší nejednoho vývojáře.

Další příjemnou novinkou je rozšíření kontextového okna na 1 milion tokenů. Nejde o nic světoborného, Llama 4 nabízí desetkrát tolik, jinak tímto OpenAI dorovnali většinu konkurenčních frontier modelů.

Model je zatím dostupný jenom přes API, v blízké době by se ale měl objevit ivChatGPT.

OpenAI si napravili přešlap s nekonkurenceschopným GPT-4.5, jedna výtka by tu ale přece jenom byla. I v rámci často chaotického pojmenovávání modelů je název GPT-4.1 dost nešťastný. Nový model by prostě neměl mít nižší číslo než ten předchozí, zvlášť když ten starý v mnoha ohledech překonává. Internetový lid si z tohohle pojmenování okamžitě začal utahovat, osobně mě nejvíc pobavila tahle predikce snižování čísla nejvyššího dostupného modelu končící GPT-0 v roce 2033.

Teď ale něco málo k novým reasoning modelům. Představeny byly o3 a o4-mini, které jsou podle benchmarků jednoznačně nejlepší reasoning modely, které vOpenAI vytvořili. Poměrně překvapivé je, že v některých úlohách zhruba desetkrát levnější o4-mini překonal dražší o3. Vývojáři se tak budou muset pořádně zamyslet, který model je pro jejich účely vhodnější.

Oba modely mají přístup ke kompletnímu arzenálu nástrojů OpenAI - od webového vyhledávání a Deep research přes generování obrázků až po spouštění kódu v Pythonu.

Své předchůdce o1 a o3-mini nové modely ve všech ohledech překonávají. Důkazem vyšší efektivity modelů je i cena API - uvarianty mini zůstává stejná jako u jejího předchůdce, o3 je dokonce o třetinu levnější než o1. VChatGPT je teď dostupná jen tato nová generace, ta předchozí už se odebrala dokřemíkového důchodu.

Kromě nových reasoning modelů vydali OpenAI také open-source kódovacího agenta CodexCLI, který běží přímo v terminálu uživatele a dokáže se využívat tyto nové modely. Umí přímo editovat soubory s kódem, ke kterým mu dáte přístup, a zvládá i verzování. Stáhnout si ho můžete na GitHubu.

ChatGPT taky nově umí pracovat s vaší konverzační historií. Nejenže z ní dokáže vytáhnout relevantní informace, ale také vaše preference, díky čemuž může vyladit svůj styl a přístup k úlohám, které mu zadáte.

Dále také OpenAI vydali nový text-to-speech model, který můžete využívat přes API. O tom, že je opravdu působivý, se můžete přesvědčit v tomto demu.

Sam Altman také v rozhovoru odhalil že OpenAI plánují vydat open-source model, který by neměl příliš zaostávat za současnými frontier modely.

A neposlední řadě ještě jedna změna, která se týká hlavně firemních uživatelů. OpenAI zavedlo nový bezpečnostní protokol - pokud chcete mít přístup k těm nejpokročilejším funkcím jejich API, budete muset nechat svou společnost prověřit a získat status Verified Organization. Chtějí tím zabránit zneužívání svých nejpokročilejších technologií k nekalým účelům.

Mimochodem, nesou se zvěsti, že v OpenAI vyvíjejí vlastní sociální síť. Inspirací jim pravděpodobně byl Grok, který to ale vzal z druhé strany. Nejdřív byla sociální síť X, pak se na ni nabalil AI model. Šeptanda říká, že OpenAI chce využít data, která má zChatGPT, k tvorbě AI based sociální sítě, a následně využívat data z ní ke zdokonalování svých modelů. Uvidíme, co z toho bude.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

Nová reklama Perplexity se otevřeně pouští do Googlu

Do hlavní role obsadili Lee Jung-jae, hvězdu Squid Game a prvního korejského herce, který získal cenu Emmy. Je to skvěle natočené, extrémně našlapané, rozhodně je to jedna z nejlepších reklam, které jsem v životě viděl. Tohle prostě musíte vidět.

Random trivia

Věděli jste, že kapacita cédéček byla designována tak, aby se na něj vešla celá Beethovenova 9. symfonie?

Když v 70. letech Sony a Philips spolupracovali na vývoji kompaktního disku, řešili mimo jiné zásadní otázku: jak velká by měla být jeho kapacita? V té době se uvažovalo o disku s průměrem 11,5 cm, což by umožnilo zhruba 60 minut záznamu při kvalitě vzorkovací frekvenci 44.1 kHz a bitové hloubce 16 bitů.

Jenže pak do hry vstoupil viceprezident Sony Norio Ohga, milovník vážné hudby a vystudovaný operní pěvec. Ten trval na tom, že na jedno CD se musí vejít celá Beethovenova 9. symfonie. kterou miloval, bez přerušení. Ta má v plné délce 74minut. Výsledkem bylo, že finální formát CD dostal průměr 12 cm, což umožnilo přesně tuto délku záznamu - a vznikl tak nový standard.

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!