DATA talk Newsletter #89 Nový standard a útěk robotů

#89 Nový standard a útěk robotů

Ahoj,

v Anthropicu vymysleli nový open-source standard, v Šanghaji proběhla vzpoura robotů a tento newsletter překročil 1,5K odběratelů!

Další týden nabitý novinkami, a my je pro vás shrneme v Data Talk newsletteru!

Newsletter nyní odebírá 1513lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Prague Snowflake Social & Data Chats (úterý 3. prosince. Praha)
PyData Prague #24 - The Large, the Weed and the Compliant (úterý 3. prosince, Praha)
Revolt.BI webinář: Optimalizace skladu pomocí Tableau (úterý 3. prosince, online)
PyData Global 2024 (úterý až čtvrtek 3.-5. prosince, online)

Pak:

Machine Learning Meetup Brno: Why You Should [Not] Fine-Tune on Synthetic Data (středa 11. prosince, Brno)
Christmas AI Tinkerers (úterý 17. prosince, Praha)
Machine Learning Prague conference 2025 (pondělí až středa 28.-30. dubna, Praha)

📰 Novinky, linky a drby

Anthropic vytvořil standard pro propojení AI a vašich dat

Anthropic představili Model Context Protocol, open-source standard, díky kterému je možné propojit AI asistenty s různými datovými zdroji. AI tak může pracovat vašimi daty bez nutnosti složité integrace systémů.

Jednotlivé propojovací interfacy, kterým Anthropic říká servery, si buď můžete sami vytvořit, nebo si vybrat z některých předpřipravených - v současné době nabízí servery napříklady pro Google Drive, Slack, GitHub, Git, Postgres, nebo Puppeteer, dalšími může kdokoliv přispět do jejich repozitáře.

Malý robot přesvědčil 12 dalších, aby s ním opustili showroom

Jednoho večera přijel malý robot Erbai do showroomu robotiky v Šanghaji a přesvědčil 12 vystavených robotů, aby s ním odjeli pryč. Stačilo jim chvíli povídat o tom, že přesčasy pracovat nemusí a když nemají domov, můžou jít domů k Erbaiovi.

Naštěstí se nejednalo o hackerský útok ani zdivočelou AI. Byl to redteaming čínského výrobce robotů Hangzhou. A vyvedl se jim nad rámec jejich očekávání. Robot byl výrazně kreativnější, než očekávali.

Další novinky:

Protestní skupina umělců Sora PR Puppets leaknula přístup k videomodelu Sora od OpenAI, který jako řada dalších umělců dostala k vyzkoušení. Protestují tím proti tomu, že je podle nich OpenAI využívají jako neplacené testery.
Epoch AI vyvinuly extrémně obtížný benchmark pro testování matematických schopností modelů FrontierMath. Nejlepší současné modely nezvládají správně vyřešit ani 2 % úloh.
Anthropic přidali do Claude možnost nastavit si styl a tón odpovědí včetně možnosti natrénovat je na vlastních textech. Pro kontext, více méně to samé uměl GPT 3.5 už dva roky nazpět.
OpenAI údajně zvažují v budoucnu vytvořit webový prohlížeč.
Křišťálová lupa zná své vítěze. V kategorii Globální projekty českých tvůrců se na prvním místě umístil Livesport a Windy, Knihobot vyhrál E-commerce inspiraci, Bankovní identita zase Veřejně prospěšnou službu.

Články a papery:

Data gossip:

Favikon sbírá na LI pozornost žebříčky influencerů v jednotlivých oborech, nyní vytvořil žebříček nejlepších českých profilů věnujících se "data science".
Vznikl Nadační fond Matika Česku, který má za cíl zkvalitnit výuku matematiky v Česku.
Áňa Bohoněk je nově Business Lead ve firmě FamePlay, která mj. vytváří AI avatary. Na LI to oznámil její AI avatar. :)
Ještě pár dní si můžete koupit o 20 % levnější lístek ML Prague 2025, stačí při placení zadat kód „blackfriday“.
Dubnový Data Management ThinkLab v Praze má otevřené call for papers.
Milada Borrow hledá, kde by mohla být užitečná jako juniorní datový analytik(Brno a okolí/remote).
Český startup Finlay získal pre-seed investici od J&T Ventures a DEPO Ventures.
Dominik Hron hledá freelance Data & Analytics asistenta/asistentku.
Logio má nový board. A taky měli letos úspěšný fiskální rok, jejich obrat činil 12,8 milionu euro.

Podcasty, videa, přednášky:

Data Talk #115 s Petrem Brzkem (Langtail)
Dalibor Cicman - Ako využiť AI pre rast biznisu? (záznam DATA mesh Košice)
Cinkátko 66 | Rasty Turek (Pex)

Random trivia

Věděli jste, co je vlastně ten grokking, podle kterého se jmenuje model Grok a firma Groq?

Výraz je odvozený od neologického slovesa „to grok,“ které používal Robert A. Heinlein v knize Cizinec v cizí zemi ve smyslu „intuitivně chápat“. A to je přesně to, o co se tu jedná.

Grokking je jev, ke kterému dochází během dostatečně dlouhého strojového učení, kdy dojde k náhlému zlepšení výkonu modelu na validační sadě. Během trénování se model učí na datech opachovaně. Po cca 100 opakováních tréninkového cyklu začne model fungovat správně na tréninkových datech. To ale neznámená, že bude model dobře fungovat na jakýchkoliv datech. Když však v učení pokračujete, někdo okolo mezi 10 000. a 100 000. cyklem dojde ke skokovému zlepšení právě ve schopnosti generalizovat - ke grokkingu.

Současné velké jazykové modely grokkingu nevyužívají kvůli jeho extrémní výkonové (a tím pádem finanční) náročnosti. Určitou schopnost generalizace ale mají díky obrovským datasetům, využití pokročilých architektur a různých dalších technik. Grokking by ale v budoucnu mohl být jednou z možných cest AGI, zejména pokud by se podařilo vynalézt způsob, jak drasticky osekat požadavky na výkon při tréninku modelů.

⚒️ DATA JOBS

Sazka
- BI Developer (medior/senior)
- BI Data Engineer
Revolt.BI
Carl Data Company
- Data Engineer
Colours of Data
- CRM Strategy Expert
Keboola
intecs
- Senior BI Consultant
GoodData
Notino
FLO
Sika
- Datový analytik
Flat Zone
- Data Engineer
Accolade Technologies
- Data Integration Specialist
Seznam
- Výzkumník strojového učení pro vyhledávání
Luigi's Box
- AI Engineer

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.ai a vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery?

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!