#58 Roboti od Boston Dynamics a Googlu, pravda o Devin AI

Ahoj,
ukázalo se, že Devin AI vás o práci asi nepřipraví, roboti hrají fotbal, jiní roboti trochu děsí, Chronon a JetStream jsou open-source, vyšel BigQuery data canvas, Adobe se pustili do generování videa, Reka ve 20 lidech vytvořili skvělý jazykový model a v Googlu přišli na to, jak vytvořit model s téměř nekonečným kontextovým oknem. To je dnešní Data Talk newsletter.
Data Talk newsletter nyní odebírá 1060lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit! )
Notino je novým členem Data Talk klubu
Je nám ctí, že můžeme v Data Talk klubu přivítat tenhle český e-commerce zázrak, s neméně zázračným data oddělením.
S Notinem vznikly již dvě episody Data Talku, jedna s Head of Data Office Martinem Kavříkem a druhá se Lucií Pezlarovou, seniorní data scientistkou.
📅 Kalendář datových akcí
Příští týden:
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- mDevCamp 2024 + AppParade (úterý 23. dubna)
- PyData Prague #19 - Pandas in Heaven(úterý 23. dubna)
- Machine Learning Meetup Košice: DAM - Data in Maritime Domain (středa 24. dubna v Košicích)
- Data Punkers 11: Jak Češi mění datový svět (čtvrtek 25. dubna)
- Prague Gen AI Meetup #4 (čtvrtek 25. dubna)
- AI dětem: AI a dezinformace (čtvrtek 25. dubna)
Pak:
- AI transformace financí (středa 29. dubna)
- AI & ML Unconference 2024 (úterý 14. května v Brně)
- Czech Republic Snowflake Data Cloud Group Meetup #2 (čtvrtek 16. května)
- AI & Byznys 3.0 (čtvrtek 16. května)
- AI for body & soul (čtvrtek 23. května)
- WebExpo (středa až pátek 29.-31. května 2024)
- DATA mesh #19 by MEWS (čtvrtek 6. června)

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📰 Novinky, linky a drby
Tvůrci Devin AI při prezentaci zřejmě dost přifoukli jeho schopnosti
Ale kdo by si při odhalení nového AI produktu trochu nezapřeháněl, že?
YouTube kanál Internet of Bugs přišel s analýzou, která odhaluje, že Cognition si zapřeháněli pořádně. Konkrétně rozebral video, ve kterém Devin AI řeší honorované úkoly umístěné na Upwork.
V první řadě je rozdíl mezi zadáním na Upworku a tím, které zadali do Devina, které je značně zjednodušené a kvůli tomu výstup neodpovídá původnímu zadání. Lidský developer by navíc komunikoval s klientem a nechal si zadání upřesnit, což AI pochopitelně nedokáže.
V tech demu jsou pasáže, kde Devin debugguje a vypadá to opravdu působivě. Problém je ale v tom, že odstraňuje bugy, které sám nasekal. Oproti tomu bug, který byl v původním repozitáři, neodhalil.
Kód, který vygeneroval, byl také místy extrémně neefektivní nebo dokonce úplně nesmyslný, a navíc u toho nebyl ani časově efektivní. Carlovi z Internet of Bugs trvala tato úloha 36 minut. Devinovi podle timestampů 6 hodin a 20 minut.
Na začátku videa je navíc vidět, že ve vyhledávacím poli na Upworku je zadané „road damage.” To poukazuje na konkrétní výběr úkolu, při kterém Devin podal nejlepší výkon. Znamená to tedy, že obecně je to ještě horší?
AI agenti možná jednou nahradí softwarové inženýry, ale zatím se tomu ani neblížíme.
Vědci z Cambridgeské univerzity a Google DeepMind naučili roboty hrát fotbal
Na začátku je naučili základní pohyby jako chůzi, vstávání a kopání do míče a dále je nechali se učit pomocí AI. Roboti se nakonec naučili 3x rychleji chodit, 5x rychleji otáčet a o 63 % rychleji vstávat. Co je však nejzajímavější, roboti si sami vytvořili strategie jak co nejlépe hrát. Například když bránili, dělali spíš kratší rychlejší kroky - tak jako skuteční fotbalisté.
Boston Dynamics představili nový design robota Atlas
Oproti předchozí hydraulické verzi spoléhá plně na elektromotory a je vybaven klouby s rozsahem pohybu 360°, díky čemuž není omezen pouze na pohyby přirozené člověku. Osobně mě ale z toho pohledu mrazí.
Airbnb uvolnili Chronon jako open-source
Chronon je platforma pro management dat pro machine learning. Je navržena tak, aby co nejvíce zjednodušila práci s daty a umožnila se soustředit na tvorbu samotného modelu. Umí pracovat s celou škálou online i offline datových zdrojů, agregace a transformace jí nedělají nejmenší problém a zvládá i robustní automatický monitoring.
Google vydal BigQuery data canvas
Tento datový nástroj umožňuje díky integraci Gemini pomocí přirozeného jazyka vyhledávat v datech, generovat SQL dotazy a výsledky vizualizovat.

Adobe představili nové generativní AI funkce pro Premiere Pro
Jejich nový generativní AI model FIrefly Video umožňuje generovat video jako pokračování již existujícího klipu, přidávat nebo odstraňovat objekty ze záběrů nebo generoval B-roll záběry. Adobe také kromě vlastního modelu pracuje na integraci modelů od OpenAI, Runway a Pika Labs.

Reka vydali působivý multimodální model Reka Core
V týmu pouhých 20 lidí se jim podařilo vytvořit model, který se svými schopnostmi blíží
GPT-4 a Claude 3 Opus. Model má kontextové okno 128 000 tokenů a umí pracovat ve 32 jazycích.
Další novinky:
- Okolo 5 % tréninkových dat Adobe Firefly byly obrázky vygenerované konkurenčními modely. To je v rozporu s tvrzeními Adobe, že oproti konkurenci při trénování neporušuje právní předpisy a nejedná neeticky
- OpenAI představili Batch API, které umožňuje nahrávat požadavky hromadně. Ty jsou vyřízeny do 24 hodin, ale o 50 % levněji
- Google uvolnil JetStream jako open-source
- GPT-4 Turbo po posledním updatu zase o kousek vede v LMSYS žebříčku nad Claude 3 Opus
- Grok 1.5 dostal vision update
Články a papery:
- Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention
- Výzkumníci z Google přišli na způsob, jak téměř nekonečně prodloužit kontextové okno jazykových modelů. Tato metoda spočívá defacto vdočasném trénování modelu na předchozím kontextu konverzace.
- CC: Těží data z webů a je v zisku. Datové Apify má přes 200 tisíc uživatelů, teď nabírá 70 milionů
- 101 real-world gen AI use cases from the world's leading organizations
Data gossip:
- Workday přesunuli svoje kanceláře do Masaryčky
- Ivan Bartoš spolu se Svazem průmyslu a dopravy organizují podnikatelskou misi do Washingtonu DC a New Yorku. Stále je možnost se přidat.
- Purple Ventures rozjíždějí druhý fond investující do nadějných evropských technologických startupů
- Keboola zářila na Google Cloud Data Day
- Portál občana má apku
- 25. dubna se spustí public beta Langtail
- Livesporu pokořil rekord v počtu měsíčních zobrazení na jejich Flashscore webech a v aplikacích - 26,5 miliardy views!
Podcasty, videa, přednášky:
- Data Talk #83 s Alešem Moravcem (Head of Consulting v Carl Data Company) o jejich produktu Carl for Media, připravovaných produktech pro influencery a pro brandy a o tom, jak to vlastně spolu s konzultováním v tak malém týmu stíhají
- CZPodcast 316 - Každý problém má technické řešení s Vojtou Ročkem
- Kompletní záznam PyCon Slovakia 2024
❓Random trivia
Věděli jste, že si Google od roku 2009 místo sekání trávníku v okolí svého sídla Googleplex v kalifornském Mountain View pronajímá kozy, aby jim trávník spásly? Mimochodem, 250 koz zvládne spást denně jeden hektar trávníku.
DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiaj.)
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- intecs
- Emark
- GoodData
- BI Solution Architect
- Senior Product Manager
- Senior SW Engineer (Analytic Query Engine)
- Project Manager / Team Lead
- BI Solution Architect & Lead
- Frontend Developer (React)
- Sr. DevOps Engineer - Praha
- Sr. DevOps Engineer - Brno
- Sr. SW Engineer (Analytic Query Engine) - Brno
- Sr. SW Engineer (Analytic Query Engine) - Praha
- Sr. SW Engineer (Java/Kotlin)
- Sr. SW Engineer (Kotlin & Python)
- Sr. SW Engineer (Python)
- Sr. Product Manager
- Bizztreat
- ADDVERY
- Logio
- Mycroft Mind
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play!
Pokud chcete sdílet svoje know-how, obsah od vás z firmy, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!