#61 Roboti v tom umí chodit

Ahoj,
gpt2-chatbot je zpět, v NVIDIA trénují roboty pomocí AI agentů a DeepMind udělali významný pokrok v predickích struktur léčiv. A taky máme pořádný nášup článků, paperů a drbů. Je tady další Data Talk newsletter.
Data Talk newsletter nyní odebírá 1064lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit! )
DATAmesh Brno
by Addvery
Kromě pražského DATAmeshe chystáme taky jeden v Brně - v ArtBaru na Štefánikově1.
Těšit se můžete na 3 krátké příspěvky, prvního se ujme Martin Prchal z Addvery, druhý si pro vás přichystá Jana Vargovčíková z Kiwi a třetí si zatím necháme jako překvapení.
Na talky máme omezenou kapacitu, takže s registrací neotálejte.
Začínáme v 6, od 8 startuje afterparty, kde můžete networkovat a taky se tradičně utkáme v pub quizu a Atomic Bombermanovi. Budeme se na vás těšit.


📅 Kalendář datových akcí
Příští týden:
- AI & ML Unconference 2024 (úterý 14. května v Brně)
- intecs webinář: začátek cestky k úspěšnému BI projektu (úterý 14. května)
- Flavours of Data Stack – Prague (středa 15. května)
- Machine Learning Meetup Brno: Intro to Gemini with Cesar Ilharco Magalhaes (DeepMind) (úterý 14. května v Brně)
- Czech Republic Snowflake Data Cloud Group Meetup #2 (čtvrtek 16. května)
- Open Source Science @ PyData Prague #20 (čtvrtek 16. května)
- AI & Byznys 3.0 (čtvrtek 16. května)
- DATA mesh #19 by Livesport(čtvrtek 16. května)
Pak:
- AI for body & soul (čtvrtek 23. května)
- GoodMeetup #5: What the Duck is Up with DuckDB? (středa 29. května)
- WebExpo (středa až pátek 29.-31. května)
- Data Point Prague (čtvrtek a pátek 30. a 31. května)
- AIinspiration (čtvrtek 30. května)
- DATA mesh #20 by MEWS (čtvrtek 6. června)
- DATA mesh #21 by Workday (čtvrtek 1. srpna)

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📰 Novinky, linky a drby
Výzkumníci z NVIDIA představili systém DrEureka, který používá LLM agenty k trénování robotů v simulaci
LLM agent napsal kód, který naučil robota pohyb bez toho, aby se sám musel učit metodou pokus-omyl a byl potřeba další fine-tuning.
Systém vyzkoušeli na chůzi robota po nafukovacím balónu. Tento netradiční usecase vybrali proto, že potřebovali takový, o kterém LLM nemůže mít předchozí znalosti a zároveň je kvůli jeho komplexitě prakticky fyzikálně nenasimulovatelný.
Pokud by vás zajímal paper k tomuto systému, najdete ho tady.

gpt2-chatbot se objevil v dvou nových iteracích
Tentokrát není na LMSYS dostupný přímo, ale může se objevit v „Arena (battle)” módu ve variantách im-a-good-gpt2-chatbot a im-also-a-good-gpt2-chatbot. Že se jedná o modely od OpenAI je nyní už zřejmé podle chybových hlášek při přetížení API. Kromě toho to defacto nepřímo potvrdil i Sam Altman:

DeepMind vydal AlphaFold 3, model určený k predikci struktur léčiv a jejich interakcí
Oproti předchozí verzi poskytuje přesnější výsledky, zejména v oblasti predikce ligandů a protilátek. Je tak dobrý, že dokonce poskytuje konzistentně lepší výsledky než doteď dominantní metoda fyzikálních predikčních modelů.
Na webu DeepMind si můžete přečíst detailnější blogpost.
Další novinky:
- Nesou se zvěsti, že OpenAI v pondělí představí AI vyhledávač, který má přímo konkurovat Googlu. Sam Altman tuto možnost zmiňoval už před nějakou dobou v podcastu Lexe Fridmana
- Microsoft údajně pracuje na vlastním LLM MAI-1, které se má vyrovnat těm nejlepším konkurenčním modelům
- Má mít 500B parametrů a jeho vývoj má řídit jeden ze zakladatelů DeepMind Mustafa Suleyman
- Stack Overflow a OpenAI uzavřeli partnerství
- Modely OpenAI se budou učit na kódu ze Stack Overflow, Stack Overflow využije technologie OpenAI při tvorbě svého asistenta OverflowAI
- Midjourney zpřístupnilo generátor obrázku kromě Discordu i přes svůj web, ale pouze pro uživatele, kteří vygenerovali aspoň 100 obrázků
- Wayve dělají velké pokroky v oblasti autonomních vozidel
- Pro nekvalitní AI generovaný obsah se začíná používat výraz „slop“
- Ataccama se chystá na burzu
- Deepnote přidali do svého notebooku reactive execution mode
- Startuje další ročník Vodafone Nápad roku. Nechcete pár milionů na váš startup?
Články a papery:
- Simon Willison: Making Large Language Models work for you
- Best practices, jak implementovat LLM včetně etických zásad
- A Careful Examination of Large Language Model Performance on Grade School Arithmetic
- Studie ověřující benchmary, které vydávají tvůrci LLMs
- GPT-4, Claude, Gemini a Llama vyšli podobně jako v oficiálních benchmarcích, zato Mistral a Phi podávali v tomto nezávislém horší výkony
- Machine Unlearning in 2024
- Skvělý článek o odstraňování dat z modelů bez jeho kompletního přetrénování
- Bizztreat: Řízení skladových zásob - chutně a zdravě
- Evropa Americe nestačí. Její způsoby řízení jsou dobré tak do minulého století, říká Staněk z GoodData
- Chocho's Keboola trick - Read only storage
- Recombee: Innovating Media with Prima & Recombee - A Story of AI-Driven Success (case study)
- Wired: Ondřej Vlček (Gen Digital) a důvěra ve věku AI
- Hrot: České startupy mají vítr v zádech, brzdí je naše právní prostředí, říká investor Vojta Roček
Data gossip:
- GymBeam oslavuje 10. narozeniny
- Emplify dostali od Atlassianu ocenění Work Differently, Together za jejich příkladnou dokumentaci
- Filipa Dřímalku dostala AI až do Žena a život
- Na prg.ai meetupu vystoupil Murray Campbell (IBM, jeden z tvůrců Deep Blue)
- Tomáš Sobotík (Telia) sdílí tip pro Snowflake
- Billigence dostali na British Data Awards ocenění Best Place to Work in Data
Podcasty, videa, přednášky:
- Data Talk #86 s Nielsem Verschatsem (intecs) o tom, jak se člověk dostane od soudního tlumočnictví k práci v datech a o jeho minimalistickém přístupu
- Stanford eCorner: The Possibilities of AI with Sam Altman (OpenAI)
- Beyond AI: The Future of Work
První hudební videoklip vytvořený pomocí Sora
Kapela Washed Out vytvořila ve spolupráci s režisérem Paulem Trillem z Trillo Films první klip, který používá čistě závěry vytvořené pomocí Sora od OpenAI. Klip má docela silný surrealistický podtón (je otázkou, jestli záměrně) daný limitacemi modelu, kdy například děj v některých scénách příliš dobře nenavazuje, postavy procházejí zdí a podobně. Čím pozorněji se díváte, tím víc je to zjevné. Letmým pohledem však vypadá jako běžný klip. Současná verze Sora zatím filmaře rozhodně nenahradí, ale uvidíme, kam se časem posune.

Káva AI-conic navržená AI není vůbec špatná
Helsinská pražírna Kaffa se spojila AI konzultační agenturou Elev Consulting a nechala AI navrhnout svůj nový kávový blend. Uvádějí pouze, že k tomu využili LLM, ale vzhledem k specializaci Elev Consulting pravděpodobně použili Microsoft Copilot.
Velkému jazykovému modelu popsali chutě jednotlivých kávových odrůd, které mají k dispozici, a ten přišel s netradičním poměrně netradičním blendem. Obvykle se používají dvě, maximálně tři odrůdy, AI použila rovnou čtyři:
Brazil, Fazenda Pinhal: 40%
Ethiopia, Geruke: 10%
Colombia, San Lorenzo: 25%
Guatemala, La Bolsa: 25%
A výsledek je víc než solidní. Kávová zrna mají příjemnou vůni, která kombinuje tóny ořechů a ovoce, chuťově pak dominují spíš ořechy, ovocná chuť je spíš vpozadí. Každopádně se jedná o nadprůměrný kávový blend, za který by se nemusela stydět žádná kvalitní pražírna.

❓Random trivia
Věděli jste, že první zaregistrovaná webová doména byla symbolics.com/? 15.března 1985 si ji zaregistroval výrobce počítačů Symbolics.

DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiaj.)
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- intecs
- Emark
- GoodData
- Bizztreat
- Nano Energies
- Yieldigo
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play!
Pokud chcete sdílet svoje know-how, obsah od vás z firmy, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!