Newsletter

#100 Nový model od OpenAI je tu. Ale stojí za to?

Ahoj,

OpenAI vydali GPT-4.5, Anthropic zase hybridní Claude 3.7, Amazon představil Alexa+ a Imperial College London otestovali AI co-scientist s výsledkem, který dodá člověku optimismu do budoucnosti.

A taky je tady další, jubilejní 100. Data Talk Newsletter.

Newsletter nyní odebírá 1589lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Příští týden bude další DATA mesh!

Na tenhle už 26. DATA mesh se sejdeme ve čtvrtek 6.3.2025 v Café V lese. Door open 18:00, začátek prezentací 18:30, afterparty od 20:00.

Krátké přednášky si pro vás připraví Vojtěch Matoušek z Carl Data Company, Jiří Vinárek z MEWS a Jan Papoušek z FLO.

Partnerem meetupu je konzultačně technologická firma BigHub! Děkujeme za podporu!

(A pokud byste chtěli v u těchto AI OGs pracovat, aktuálně nabírají na pozice BI Analyst, Data Engineer a Full-stack Engineer)

Máte memes nebo vtipné obrázky, o které se chcete podělit?  Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Později:

📰 Novinky, linky a drby

Je to tady. OpenAI vydali GPT-4.5

Poslední zvěsti říkaly, že nový model od OpenAI vyjde někdy příští týden. Ahle, máme ho tu už dnes.

V zásadě se jedná o mírný pokrok v mezích zákona. Jeho odpovědi jsou přirozenější, lépe chápe kontext lidských emocí, dokáže lépe odhalit podstatu problému, se kterým za ním přicházíte a odpovědět vám i na to, na co jste se přímo neptali, ale je pro vás v daném kontextu přínosné. Také odpovědi strukturuje tak, aby byly uživatelem co nejlépe vstřebatelné. Jazyk, který používá při kreativním psaní, je zase o krok blíž špičkovému copywriterovi.

Více než mírného pokroku zaznamenal v otázce AI halucinací - podle interního benchmarku OpenAI halucinuje více než 2x méně než o3-mini a o více než třetinu méně než GPT-4o. V porovnání s nejméně halucinujícím o1 je pořád téměř o čtvrtinu lepší.

OpenAI pro tento model vytvořili nový inferenční framework, díky kterému dokáže model rychle odpovídat i přes svoji obrovskou velikost. Tu OpenAI sice nezveřejnili, ale z jejich náznaků lze vyčíst, že tady opět vidíme scaling law v praxi.

Co je vzhledem k tomuto mírnému pokroku v mezích zákona zarážející, je cena přístupu přes API. 1M tokenů inputu stojí $75, 1M tokenů outputu $150. To je 30x víc na inputu a 15x víc na outputu než u GPT-4o. Tahle cena nám dává zavzpomínat na dobu před 2 lety, kdy vyšel GPT-4, ale i ten tehdy stál o pětinu míň.

Doufejme, že se OpenAI podaří cenu srazit co nejdříve, jinak nemůže v dnešní konkurenci obstát. Když přijde na lámání chleba (a vývoj aplikací využívajících AI), každý vývojář sáhne konkurenčních modelech, které jsou sice o fous horší, ale také řádově levnější - třeba takový Gemini 2.0 Flash 750x na inputu a 375x na outputu.

Model je už teď dostupný pro uživatele úrovně Pro ($200 za měsíc) a od příštího týdne bude i pro uživatele úrovně Plus ($20 za měsíc).

Anthropic vydal hybridní model Claude 3.7 Sonnet a agenta Claude Code

Nový model od Anthropicu si připsal jedno prvenství - jedná se o vůbec první hybridní model, který kombinuje klasický jazykový model s jeho reasoning variantou. V praxi to znamená, že model poskytuje téměř okamžité odpovědi klasického LLM, ale v případě potřeby je možné jej přepnout do reasoning módu. Pomocí API pak můžete ovládat i maximální dobu přemýšlení, kterou můžete nastavit až na 128K tokenů.

Může se to zdát triviální - i u konkurence můžete přepnout na reasoning model, když potřebujete. Jeho revolučnost tkví ale v tom, že se obě tyto složky skrývají v jednom modelu. Uživatelsky nezajímavé, ale technologicky naprosto přelomové.

Většinu benchmarků tento model zvládá na podobné úrovni jako současná jednička Grok 3, ostatní konkurenční modely jako je o1 od OpenAI nebo R1 od DeepSeek pak přesvědčivě překoná téměř ve všem kromě matematiky, kde velice lehce zaostává. Na výsledky z LM Arena si však budeme ještě muset počkat, model v ní není zatím dostupný.

Mimochodem, nadšenec z řad Anthropicu nechal nový model hrát Pokemon Red na Twitchi. Jde mu to docela dobře, i když teda kvůli reasoningu dost pomalu.

Claude Code je pak AI agent, který vám pomůže s programováním. Stačí ho nasměrovat na příslušný repozitář a v konzoli mu zadat úkoly. Ty zpracuje včetně velmi podrobného popisu toho, co dělá a jak nad problémem „přemýšlel.“ Veškeré změny v kódu vás poté nechá schválit. Můžete si od něj také nechat kód otestovat a na závěr i zkompilovat. A dokonce vám může kód pushnout na GitHub.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

Random trivia

Věděli jste, proč má Linux za maskota tučňáka

Linus Torvalds vybral tučňáka jako maskota Linux po incidentu v roce 1993, kdy jej v australské Zoo tučňák kousl. Místo superschopností se podle u něj jeho slov vyvinula „pingvinitida“, celoživotní láska k tomuto nelétavému opeřenci. 

Úvodní inspirací pro logo byl tučňák od Nicka Parkse, autora známého seriálem Wallace a Gromit. Posléze získal legendární pták jméno Tux, zkratka pro „(T)orvalds (U)ni(X)“ ale také „tuxedo“ neboli frak.

V roce 2009 vznikl zase v Austrálii ještě jeden maskot, kterého Linus vybral pro konferenci linux.conf.au. Tím byl tasmánský čert s falešným zobákem nazvaný Tuz. Cílem bylo poukázat na hrozící vyhubení tohoto živočišného druhu.

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!

Data Talk partnery jsou: intecsSAZKABizzTreatColours of Data,

Revolt.BIKeboolaEMARKCarl Data CompanyData MindNOTINOFLO