#54 Zase o krok blíž nepráci

Ahoj,
dneska pro vás máme pozvánku na první DATA mesh v Ostravě, působivého AI agenta - softwarového inženýra, nové čipy od NVIDIA, leak informací o GPT-5, open-source release Grok a mnoho dalšího. Je tady Data Talk newsletter.
Data Talk newsletter nyní odebírá 1028lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit! )
První DATA mesh v Ostravě!
Po spoustě DATA meshích v Praze a několika v Brně přichází konečně jeden i v Jirkově rodné Ostravě v klubu BUMBUMc.
Těšit se můžete krátké přednášky od Snowflake superhrdiny Tomáše Sobotíka, Michala Bočvarova, který vám ukáže, jaké cool věci dělají s daty vDopravním podniku Ostrava nebo Petera Fedoročka, který založil Understand Labs.

Chybět nebude ani pubquiz a tradiční turnaj v Atomic Bombermanovi.
Na přednášky máme pouze 60 míst, takže s registrací neotálejte, afterparty bude potom free pro všechny.
Partnerem tohoto DATA meshe je Dopravní podnik Ostrava, s jehož dataři jsme dělali minulou epizodu Data Talku.
.
📅 Kalendář datových akcí
Příští týden:
- The History of Jest, Yarn and Open Source at Meta (pondělí 25. března)
- DATA mesh Ostrava by DPO (středa 27. března v Ostravě)
- Microsoft Build: AI Day (středa 27. března)
- Miton AI Times: Utilizing Embeddings for Drug Discovery in Billion-Scale Databases(čtvrtek 28. března)
Pak:
- Data forBreakfast (čtvrtek 11. dubna)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- mDevCamp 2024 (úterý 23. dubna)
- Data Punkers 11: Jak Češi mění datový svět (čtvrtek 25. dubna))
- WebExpo (středa až pátek 29.-31. května 2024)
- DATA mesh #19 by MEWS (čtvrtek 6. června)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📰 Novinky, linky a drby
Cognition AI představili autonomního AI agenta Devin
Ten dokáže naplánovat a provést kompletní programátorské úkoly. Že jste už něco podobného viděli? Rozdíl je v jeho výsledcích. V benchmarku SWE, který spočívá v řešení reálných problémů na GitHubu, byl předchozí rekord úspěšně vyřešených problémů bez lidského zásahu pouhých 1,96 %. Devin zvládl 13, 86 %.
V tomhle působivém demu dokonce Devin autonomně vyřešil zakázku, kterou někdo zadal na Upwork. Z prvních reakcí těch, co měli možnost jeji vyzkoušet (zatím pouze přes waitlist) tohle techdemo není nijak zvlášť nafouknuté. Sice místy vyžaduje dohled či drobný zásah, ale za ručičku jej vodit rozhodně nemusíte. Devin asi zatím programátory nenahradí, ale rozhodně jim ulehčí dost práce.

NVIDIA představila tři AI procesory nové generace
Nová generace nese název Blackwell. V rámci ní představila NVIDIA procesory B100, B200 a superčip GB200, všechny s chipletovou architekturou. Jejich výkon a nízká spotřeba jsou přímo ohromující. Natrénovat model o velikosti GPT-4 (1.8T parametrů) za 90 dní vyžadovalo 8000 čipů předchozí generace Hopper se spotřebou 15 MW. Čipů Blackwell na to potřebujete jen 2000 a jejich spotřeba bude „pouze“ 4 MW. To z nich činí nejefektivnější AI čipy na světě.
Apple jedná s Googlem o využití jejich modelů, zároveň kupuje DarwinAI
Plánují totiž výrazně šlápnout do integrování AI do iPhonů, mělo by přijít ještě letos s upgradem na iOS 18. Na to ale potřebují co nejlepší, ale zároveň co nejúspornější model. Kde ho ale vzít?
Zdá se, že Apple v současné době počítá se dvěma možnými scénáři. Jedna možnost je, že si jej vyvine sám - a právě za tím účelem koupil kanadskou společnost DarwinAI, která se specializuje právě na vývoj malých výkonných modelů. Pokud by se mu to však včas nepovedlo, je na stole možnost využití Gemini Nano, o které jedná s Googlem.
Další novinky:
- Nesou se zvěsti o tom, že už existuje nějaký prototyp GPT-5, je značně lepší než GPT-4, využívá AI agenty a někteří enterprise zákazníci k němu dostali přístup
- Elon Musk a xAI vydali Grok-1 pod open-source Apache 2.0 licencí
- díky tomu teď víme, že je Grok model s 314B parametry a architekturou Mixture-of-Experts
- můžete si ho stáhnout na GitHubu, nebo vyzkoušet přes Hugging Face
- Microsoft najal spoluzakladatele DeepMind a Inflection, Mustafu Suleymana, aby vedl divizi Copilotu
- Institut plánování a rozvoje hl. m. Prahy vytvořil digitální dvojče Prahy, obsahuje i 3D model vytvořený šikmým leteckým snímkováním v kombinaci s 3D skenováním
- Jensen Huang (NVIDIA) tvrdí, že halucinování AI modelů lze vyřešit jednoduše tím, že budete požadovat po modelu, aby ke každému tvrzení našel zdroj a kontext. A taky že AGI je tak 5 let daleko
- GoodAI představili Charlie Mnemonic, prvního AI osobního asistenta s dlouhodobou pamětí
- GoodData implementovali do GoodData Cloud podporu Oracle MySQL
- V BigQuery přibyl statement DELETE, který vymaže vybrané řádky nebo oddíly
Články a papery:
- MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
- nový paper Applu o MM1, rodině multimodální AI modelů, které se učí na kombinaci obrazu, textu a jejich kombinaci
- testování zjistilo, že nejvíce rostla kvalita výstupů se zvyšujícím se počtem obrazových tokenů a rozlišením obrázků, na kterých se model učil
- How Livesport activates data and saves engineering resources with BigQuery and Dataddo
- Prof. Luciano Floridi: AI se neobávám, spíš se bojím lidí, kteří za ní stojí. Třeba šéfa OpenAI
Data gossip:
- Data Mind se stali novým členem Data Talk klubu. Jejich zakladatel Jan Matoušek byl u nás v Data Talku, určitě si tenhle díl pusťte, jestli jste ho ještě neslyšeli
- Ve Zlíně se rozjíždí Zlin.ai, brzy vám dáme další info
- Michal Nikodem se stal CTO Revolt.BI
- Jiří Havlíček je novým CEO Daktela
- Petr Glaser (BleedingDev, Nauč mě IT) napsal o tom, proč DevinAI vývojáře nenahradí
- Marek Rosa (GoodAI, Keen Software House) vysvětlil, proč má Gemini Pro 1.5 potenciál stát se game-changerem
Podcasty, videa, přednášky:
- Data Talk #79 s Ivem Plevou a Michalem Bočvarovem (Dopravní podnik Ostrava) o tom, jak se kluci snaží „zabít Excel“ v dopravním podniku
- Miton AI Times | Karel Minařík: Elasticsearch and Semantic Search
- Lex Fridman Podcast #419 | Sam Altman: OpenAI, GPT-5, Sora, Board Saga, Elon Musk, Ilya, Power & AGI
- pepe logic #110: Dominance Nvidie, české rozšíření pro OpenAI, vývoj high-end čipů v Praze
- SCRIPTease 079: Josef Starýchfojtů (CPTO MEWS)
❓Random trivia
Věděli jste, že tým Formule 1 Williams Racing používal na management dat o 20 000 součástkách jejich monopostů ještě v roce 2023 Excel? Součástky se jim neustále ztrácely, museli je často fyzicky hledat ve skladu, nedokázali pořádně určit, co vlastně potřebují nakoupit a které náhradní díly se jim kupí, v roce 2019 kvůli tomu dokonce zmeškali předsezonní testy. Nový šéf tohoto týmu James Vowles byl po svém příchodu v roce 2023 ze situace oprávněně zděšený a okamžitě začal pracovat na přechodu na nějakou rozumnou datovou platformu.
DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- intecs
- Emark
- GoodData
- Deepnote
- Slido
- futureproof consulting
- FLO
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play!
Pokud chcete sdílet svoje know-how, obsah od vás z firmy, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!