DATA talk Newsletter #100 Nový model od OpenAI je tu. Ale stojí za to?

#100 Nový model od OpenAI je tu. Ale stojí za to?

Ahoj,

OpenAI vydali GPT-4.5, Anthropic zase hybridní Claude 3.7, Amazon představil Alexa+ a Imperial College London otestovali AI co-scientist s výsledkem, který dodá člověku optimismu do budoucnosti.

A taky je tady další, jubilejní 100. Data Talk Newsletter.

Newsletter nyní odebírá 1589lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Příští týden bude další DATA mesh!

Na tenhle už 26. DATA mesh se sejdeme ve čtvrtek 6.3.2025 v Café V lese. Door open 18:00, začátek prezentací 18:30, afterparty od 20:00.

Krátké přednášky si pro vás připraví Vojtěch Matoušek z Carl Data Company, Jiří Vinárek z MEWS a Jan Papoušek z FLO.

Partnerem meetupu je konzultačně technologická firma BigHub! Děkujeme za podporu!

(A pokud byste chtěli v u těchto AI OGs pracovat, aktuálně nabírají na pozice BI Analyst, Data Engineer a Full-stack Engineer)

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Machine Learning Meetup Prague: How to Launch Your Products in International Markets in 60 Days or Less (pátek 28. února, Praha)
Truesdays (úterý 4. března, Praha)
DATA mesh #26 by BigHub(čtvrtek 6. března, Praha)
Machine Learning Meetup Brno: Misinformation and disinformation - detecting fakes with AI (čtvrtek 6. března, Brno)
Digitální Česko 2025 (pátek 7. března, Praha)

Později:

Creative AI Meet-Up #13 (pondělí 10. března, Praha)
Avatar Pioneers: HeyGen community meetup (čtvrtek 13. března, Praha)
Tech Execs Community Brunch #4 (středa 19. března, Praha)
Tech Trends 2025: The Future of Business & Innovation (středa 19. března, Praha)
Konference Fenomén (čtvrtek 20. března, Zlín)
nConnect 25 (26. března, Nitra)
AdvanceMed 2025 (čtvrtek a pátek 3. a 4. dubna, Ostrava)
2024 Data Vault User Group Conference (úterý 15. dubna, Praha)
Prague Crawl by Apify and Massive (středa 23. dubna, Praha)
Machine Learning Prague conference 2025 (pondělí až středa 28.-30. dubna, Praha)
AWS Community Day CZ (úterý 29. dubna, Praha)
IDC CIO Summit (úterý a středa 20. a 21. května, Praha)
WebExpo 2025 (28.-30. května, Praha)

📰 Novinky, linky a drby

Je to tady. OpenAI vydali GPT-4.5

Poslední zvěsti říkaly, že nový model od OpenAI vyjde někdy příští týden. Ahle, máme ho tu už dnes.

V zásadě se jedná o mírný pokrok v mezích zákona. Jeho odpovědi jsou přirozenější, lépe chápe kontext lidských emocí, dokáže lépe odhalit podstatu problému, se kterým za ním přicházíte a odpovědět vám i na to, na co jste se přímo neptali, ale je pro vás v daném kontextu přínosné. Také odpovědi strukturuje tak, aby byly uživatelem co nejlépe vstřebatelné. Jazyk, který používá při kreativním psaní, je zase o krok blíž špičkovému copywriterovi.

Více než mírného pokroku zaznamenal v otázce AI halucinací - podle interního benchmarku OpenAI halucinuje více než 2x méně než o3-mini a o více než třetinu méně než GPT-4o. V porovnání s nejméně halucinujícím o1 je pořád téměř o čtvrtinu lepší.

OpenAI pro tento model vytvořili nový inferenční framework, díky kterému dokáže model rychle odpovídat i přes svoji obrovskou velikost. Tu OpenAI sice nezveřejnili, ale z jejich náznaků lze vyčíst, že tady opět vidíme scaling law v praxi.

Co je vzhledem k tomuto mírnému pokroku v mezích zákona zarážející, je cena přístupu přes API. 1M tokenů inputu stojí $75, 1M tokenů outputu $150. To je 30x víc na inputu a 15x víc na outputu než u GPT-4o. Tahle cena nám dává zavzpomínat na dobu před 2 lety, kdy vyšel GPT-4, ale i ten tehdy stál o pětinu míň.

Doufejme, že se OpenAI podaří cenu srazit co nejdříve, jinak nemůže v dnešní konkurenci obstát. Když přijde na lámání chleba (a vývoj aplikací využívajících AI), každý vývojář sáhne konkurenčních modelech, které jsou sice o fous horší, ale také řádově levnější - třeba takový Gemini 2.0 Flash 750x na inputu a 375x na outputu.

Model je už teď dostupný pro uživatele úrovně Pro ($200 za měsíc) a od příštího týdne bude i pro uživatele úrovně Plus ($20 za měsíc).

Anthropic vydal hybridní model Claude 3.7 Sonnet a agenta Claude Code

Nový model od Anthropicu si připsal jedno prvenství - jedná se o vůbec první hybridní model, který kombinuje klasický jazykový model s jeho reasoning variantou. V praxi to znamená, že model poskytuje téměř okamžité odpovědi klasického LLM, ale v případě potřeby je možné jej přepnout do reasoning módu. Pomocí API pak můžete ovládat i maximální dobu přemýšlení, kterou můžete nastavit až na 128K tokenů.

Může se to zdát triviální - i u konkurence můžete přepnout na reasoning model, když potřebujete. Jeho revolučnost tkví ale v tom, že se obě tyto složky skrývají v jednom modelu. Uživatelsky nezajímavé, ale technologicky naprosto přelomové.

Většinu benchmarků tento model zvládá na podobné úrovni jako současná jednička Grok 3, ostatní konkurenční modely jako je o1 od OpenAI nebo R1 od DeepSeek pak přesvědčivě překoná téměř ve všem kromě matematiky, kde velice lehce zaostává. Na výsledky z LM Arena si však budeme ještě muset počkat, model v ní není zatím dostupný.

Mimochodem, nadšenec z řad Anthropicu nechal nový model hrát Pokemon Red na Twitchi. Jde mu to docela dobře, i když teda kvůli reasoningu dost pomalu.

Claude Code je pak AI agent, který vám pomůže s programováním. Stačí ho nasměrovat na příslušný repozitář a v konzoli mu zadat úkoly. Ty zpracuje včetně velmi podrobného popisu toho, co dělá a jak nad problémem „přemýšlel.“ Veškeré změny v kódu vás poté nechá schválit. Můžete si od něj také nechat kód otestovat a na závěr i zkompilovat. A dokonce vám může kód pushnout na GitHub.

Další novinky:

Výzkumníci z Imperial College London otestovali AI co-scientist od Google. Tomu dali za úkol vyřešit komplexní problém z oblasti výzkumu bakterií rezistentních vůči antibiotikům, který dříve sami řešili. To, co trvalo lidským vědcům vyřešit přes 10 let, zvládl AI co-scientist za 2 dny. Nejen, že problém vyřešil stejně jako oni, ale nabídl další relevantní 4 hypotézy, z nichž výzkumníky jedna nenapadla a kterou se hodlají do budoucna zabývat.
Amazon představil Alexa+, novou generaci od základu přestavěného hlasového asistenta, která přináší řadu AI funkcionalit. Má přístup k řadě modelů dostupných v Amazon Bedrock, z nichž si sama vybere, který se k danému úkolu hodí nejvíce. Nejzásadnější však budou její agentní funkce - dokáže vám například objednat nákup, koupit letenky, zabookovat hotel nebo třeba najít hudbu, která bude odpovídat vašim požadavkům.
Nový model není jedinou novinkou u OpenAI. Nově zpřístupnili Deep Research pro uživatele úrovně Plus ($20 za měsíc) pro 10 rešerší měsíčně a do bezplatné verze ChatGPT přidali voice mode poháněný GPT-4o-mini. A také slaví pokoření hranice 400 milionů aktivních uživatelů ChatGPT týdně.
Google zpřístupnil jejich asistenta programování Gemini Code Assist zcela zdarma.
CleverMaps spustili nový produkt MarketSpot, který vám dá podrobný report o tom, jak je daná lokalita vhodná pro otevření vašeho podniku. Zanonymizovaných dat T-Mobile zjistí, jak velký je tam pohyb lidí, od Mastercard zase, jak moc lidé tam lidé utrácejí.

Články a papery:

Data gossip:

Data Talk speciál s Pavlem Doležalem, Vojtou Ročkem a Janem Romportlem láme veškeré rekordy a je s 1750 přehráními naším nejposlouchanějším podcastem.
Guiliano Giannetti z Revolt.BI rozjel nový datový podcast Insane Data. Zatím je venku pouze jedna kratičká epizoda, do budoucna se však můžete těšit na plnotučné epizody a řadu rozhovorů - například s otcem datového skladu Billem Inmonem, nebo Francescem Puppinim, se kterým Bill Inmon napsal knihu The Unified Star Schema.
Sazka se stala sponzorem Nadačního fondu Czechitas, podařilo se jim tak zafinancovat studium 10 ženám ze znevýhodněného prostředí.
Jindřich Oukropec (Česko.Digital) a Petra Krištof (Shoptet) rozjíždějí iniciativu Pomáháme.Digital, která si klade za cíl vzdělávat lidi ze slabšího sociálního prostředí v digitální gramotnosti.
V Apify uspořádali interní hackathon zaměřený na AI agenty. Na jeho výsledky se můžete těšit už v pondělí na jejich Apify Store.

Podcasty, videa, přednášky:

Data Talk #125 | Martin Kudera (Živina) a Tereza Váradyoná (BizzTreat) otom, jak i v malé firmě můžete s daty nadělat hodně parády
Insane Data #1 | Insane Insights with Giuliano: WTF is Data Modeling
Vojta Žižka | Vojta Roček: AI - Komu vezme práci a kdo na ní zbohatne?
Datová kuchyně #11 | Dnes vaří Petr Fabera (Ušetřeno.cz)

Random trivia

Věděli jste, proč má Linux za maskota tučňáka?

Linus Torvalds vybral tučňáka jako maskota Linux po incidentu v roce 1993, kdy jej v australské Zoo tučňák kousl. Místo superschopností se podle u něj jeho slov vyvinula „pingvinitida“, celoživotní láska k tomuto nelétavému opeřenci.

Úvodní inspirací pro logo byl tučňák od Nicka Parkse, autora známého seriálem Wallace a Gromit. Posléze získal legendární pták jméno Tux, zkratka pro „(T)orvalds (U)ni(X)“ ale také „tuxedo“ neboli frak.

V roce 2009 vznikl zase v Austrálii ještě jeden maskot, kterého Linus vybral pro konferenci linux.conf.au. Tím byl tasmánský čert s falešným zobákem nazvaný Tuz. Cílem bylo poukázat na hrozící vyhubení tohoto živočišného druhu.

⚒️ DATA JOBS

Sazka
- Senior IT projektový manažer
- AI and Automation Engineer
Revolt.BI
Colours of Data
- CRM Strategy Expert
- Senior Data Scientist
intecs
- Senior BI Consultant
Emark
GoodData
Notino
- Engineering Team Lead / .NET & React
- Product Owner pro oblast generativní AI 
FLO
- Data Analyst
- Data Engineer
Carl Data Company
- Senior/Medior Frontend/Full-stack developer
BigHub
CDN77
- Data Engineer

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.ai a vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery?

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!

Data Talk partnery jsou: intecs, SAZKA, BizzTreat, Colours of Data,

Revolt.BI, Keboola, EMARK, Carl Data Company, Data Mind, NOTINO, FLO