Newsletter

#89 Nový standard a útěk robotů

Ahoj,

v Anthropicu vymysleli nový open-source standard, v Šanghaji proběhla vzpoura robotů a tento newsletter překročil 1,5K odběratelů!

Další týden nabitý novinkami, a my je pro vás shrneme v Data Talk newsletteru!

Newsletter nyní odebírá 1513lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna. 

Máte memes nebo vtipné obrázky, o které se chcete podělit?  Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Pak:

📰 Novinky, linky a drby

Anthropic vytvořil standard pro propojení AI a vašich dat

Anthropic představili Model Context Protocol, open-source standard, díky kterému je možné propojit AI asistenty s různými datovými zdroji. AI tak může pracovat vašimi daty bez nutnosti složité integrace systémů.

Jednotlivé propojovací interfacy, kterým Anthropic říká servery, si buď můžete sami vytvořit, nebo si vybrat z některých předpřipravených - v současné době nabízí servery napříklady pro Google Drive, Slack, GitHub, Git, Postgres, nebo Puppeteer, dalšími může kdokoliv přispět do jejich repozitáře.

Malý robot přesvědčil 12 dalších, aby s ním opustili showroom

Jednoho večera přijel malý robot Erbai do showroomu robotiky v Šanghaji a přesvědčil 12 vystavených robotů, aby s ním odjeli pryč. Stačilo jim chvíli povídat o tom, že přesčasy pracovat nemusí a když nemají domov, můžou jít domů k Erbaiovi.

Naštěstí se nejednalo o hackerský útok ani zdivočelou AI. Byl to redteaming čínského výrobce robotů Hangzhou. A vyvedl se jim nad rámec jejich očekávání. Robot byl výrazně kreativnější, než očekávali.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

Random trivia

Věděli jste, co je vlastně ten grokking, podle kterého se jmenuje model Grok a firma Groq?

Výraz je odvozený od neologického slovesa „to grok,“ které používal Robert A. Heinlein v knize Cizinec v cizí zemi ve smyslu „intuitivně chápat“. A to je přesně to, o co se tu jedná.

Grokking je jev, ke kterému dochází během dostatečně dlouhého strojového učení, kdy dojde k náhlému zlepšení výkonu modelu na validační sadě. Během trénování se model učí na datech opachovaně. Po cca 100 opakováních tréninkového cyklu začne model fungovat správně na tréninkových datech. To ale neznámená, že bude model dobře fungovat na jakýchkoliv datech. Když však v učení pokračujete, někdo okolo mezi 10 000. a 100 000. cyklem dojde ke skokovému zlepšení právě ve schopnosti generalizovat - ke grokkingu.

Současné velké jazykové modely grokkingu nevyužívají kvůli jeho extrémní výkonové (a tím pádem finanční) náročnosti. Určitou schopnost generalizace ale mají díky obrovským datasetům, využití pokročilých architektur a různých dalších technik. Grokking by ale v budoucnu mohl být jednou z možných cest AGI, zejména pokud by se podařilo vynalézt způsob, jak drasticky osekat požadavky na výkon při tréninku modelů.

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, Cocumy, z newsletteru prg.aia vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!