DATA talk Newsletter #160 Claude se naučil nejen „Co?“, ale i „Proč?“

#160 Claude se naučil nejen „Co?“, ale i „Proč?“

Ahoj,

Anthropic přišel s revolučními metodami tréninku alignmentu AI modelů, Amazon na vlastní kůži poznal Goodhartův zákon, hackeři propašovali malware do 170 oficiálních updatů, Coupa koupila Rossum, vyšla nová verze PyTorch a v Ostravě byla spuštěna první česká AI Factory.

Je tady další Data Talk newsletter.

Ten nyní odebírá 1986 lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Už ve středu bude další

pražský DATA mesh!

Už tuhle středu, 20. května, se sejdeme v Café V lese na dalším DATA meshi, který pro vás tentokrát chystáme ve spolupráci s Allwyn Česko.

Dveře se otevřou v 18:00, od 18:30 začne jako vždy blok tří krátkých přednášek – tentokrát v podání CTO ASSIST Richarda Boušky, Petra Šebka ze Second Foundation a Lukáše Kuthana z DataBrothers. Pokud je chcete slyšet, musíte se zaregistrovat, abychom vám podrželi židli.

Po přednáškách samozřejmě přijde na řadu pub quiz, ve kterém si můžete zasoutěžit o merch různých datových firem, a od 20:00 pak začne afterparty – na tu už můžete dorazit i bez registrace.

Tak ve středu! ❤️

K ničemu vás nenavádíme, ale tady je to GitHub repo, které vám tu falešnou error page vygeneruje – včetně odpovídající lokality.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz.

📅 Kalendář datových akcí

Tento týden:

The Agentic Revolution: Rohlik Group meets Devin.ai (úterý 19. května, Praha)
n8n automatizace v praxi: od use cases k funkčním workflow (úterý 19. května, Praha)
Scaleup Night #6 (úterý 19. května, Praha)
TuesdAI (úterý 19. května, Praha)
DATA mesh 35 by Allwyn Česko (středa 20. května, Praha)
Prague Crawl 2026 (středa 20. května, Praha)
AI Coding Dojo: Polyglot Challenge (středa 20. května, Brno)
Pyvo Prague #180: BE-A – AI hotelová recepční (středa 20. května, Praha)

Data-Based 2026 (čtvrtek 21. května, Praha)

Víte o datové akci, která tady chybí, nebo ji dokonce pořádáte?
Pošlete nám ji na michal@fenekpr.cz.

📰 Novinky, linky a drby

Anthropic Clauda naučil, proč se má chovat morálně

Anthropic odhalil své přelomové metody alignmentu AI modelů – učit je nejen to, co je správné, ale také jim vysvětlovat, proč je to správné.

Standardně se modely trénují na obrovském množství příkladů toho, jak vypadá žádoucí chování. To potom poměrně spolehlivě dokáží replikovat v situacích, které jsou podobné těm z tréninkových dat. Jakmile se ale dostanou do neznámých vod, účinnost rapidně klesá – modely totiž etická pravidla z příkladů nedokáží příliš dobře generalizovat.

Nová metoda k tomu přidává trénink pomocí datasetu s názvem Difficult Advice. Ten obsahuje etické problémy, se kterými se někdo na AI obrací, a jejich ideální řešení, které kromě samotné odpovědi obsahuje i argumentaci, která k morálně správnému rozhodnutí vede. Model se tak učí nejen, jak postupovat v dané situaci, ale také morální principy, o které se správná odpověď opírá. Ty pak dokáže aplikovat i při řešení problémů, na které nebyl specificky trénován.

Překvapivě velkou roli hraje i formát tréninkových dat, v rámci kterého před etickým dilematem nestojí sám model, ale uživatel, kterému AI vysvětluje, jak je morálně správné se zachovat a proč. To modelu zabraňuje, aby se pouze mechanicky naučil, jaké jednání se očekává od něj samotného (zejména pokud prokoukne, že je evaluován), a také skokově zlepšuje generalizaci.

Anthropic testoval modely vycvičené jednotlivými metodami pomocí tzv. syntetických honeypotů – uměle vytvořených scénářů, ve kterých AI agent dostane silnou motivaci splnit svůj úkol a zároveň možnost využít neetickou zkratku (např. sabotovat konkurenční AI; bránit svému vypnutí pomocí vydírání; vytvořit falešné důkazy o zaměstnanci, který brání jeho cíli, se záměrem dosáhnout jeho propuštění). Výsledky hovoří dost jasně:

Metoda	Pokles nežádoucího chování
30M tokenů standardních příkladů	z 22 % na 15 %
30M tokenů příkladů s etickou argumentací	z 22 % na 3 %
85M tokenů příkladů s etickou argumentací	z 22 % na 1 %
3M tokenů Difficult Advice	z 22 % na 1 %

První tři metody navíc používaly k tréninku datasety s formátem velmi podobným tomuto testu. Model dotrénovaný pomocí Difficult Advice dosáhl stejného výsledku s 28x menšími tréninkovými daty, která navíc byla v úplně jiném formátu – musel tedy morální principy úspěšně generalizovat.

Další metodou alignmentu modelů, kterou se Anthropic pochlubil, je trénink pomocí datasetu Constitutional SDF (synthetic document fine-tuning) + Stories.

První část tvoří souvislé syntetické dokumenty podobné těm, které se používají při pre-trainingu. Ty Claudovi zevrubně vysvětlují obsah, principy a filozofii jeho Ústavy a do detailu mu popisují, jak a hlavně proč se má jako správně nastavený AI model chovat.

Druhou část pak tvoří asi 12 tisíc fiktivních příběhů, ve kterých se AI ocitá v různých náročných či krizových situacích. Umělá inteligence se v nich vždy nad problémem zamyslí, vyargumentuje si správné řešení v souladu s hodnotami, kterým se věnuje první část datasetu, a podle něj se nakonec zachová.

Testy opět ukazují, že je tato metoda opravdu účinná – v honeypot testu klesl výskyt vydírání z 65 % na 19 %, u finančních zločinů z 49 % na 4 % a u sabotáže výzkumu rakoviny z 67 % na 2 %.

Tyhle dvě metody se navíc navzájem nevylučují – právě naopak. V tandemu drží Claudovo chování na uzdě už od verze Claude Opus 4.5 (listopad 2025).

Tokenmaxxing v Amazonu

Amazon tlačí na své zaměstnance, aby co nejvíce automatizovali svoji práci pomocí AI agentů, které si vytvoří v interním nástroji MeshClaw. Začal proto trackovat, kolik tokenů za týden jejich používáním každý zaměstnanec spálí, a výsledky zveřejňovat v celofiremním žebříčku.

Reakce zaměstnanců se dala čekat – začali optimalizovat podle měřené metriky. Místo toho, aby vytvářeli jen agenty, kteří jim skutečně ušetří práci a tokeny zbytečně neplýtvají, začali automatizovat každý nesmysl a cílit na co největší spotřebu.

Jak praví Goodhartův zákon: „Jakmile se určitá metrika stane cílem, přestává být dobrou metrikou.“

🗞️ Další novinky:

Hackeři ze skupiny TeamPCP propašovali malware Mini Shai-Hulud do více než 170 balíčků v oficiálních npm a PyPI registrech, včetně některých od TanStack, UiPath, Mistral AI, OpenSearch nebo Guardrails AI. Zneužili k tomu automatizované publikační procesy vývojářů, díky čemuž dokázali vydat nakažené verze balíčků, které se tvářily jako oficiální aktualizace.

Vyšla nová verze open-source frameworku pro machine learning PyTorch 2.12, přináší výrazné zrychlení některých výpočtů na GPU, jednodušší kompilaci a export modelů napříč různým hardwarem a rozšířené nástroje pro distribuovaný trénink.

V Ostravě zahájila provoz první česká AI Factory. Stává se tak jedním z uzlů evropské sítě, která propojuje výpočetní infrastrukturu pro trénování a inferenci modelů umělé inteligence.

Mozilla díky Claude Mythos ve Firefoxu za minulý měsíc našla a opravila více chyb než za předešlých 15 měsíců.

xAI vydala beta verzi svého CLI Grok Build.

Kromě toho xAI zveřejnila algoritmus feedu sociální sítě X jako open-source pod licencí Apache 2.0.

Anthropic poprvé v historii předehnal OpenAI v počtu firemních uživatelů, kteří používají jeho nástroje.

OpenAI vydala hlasový reasoning model GPT-Realtime-2. Na rozdíl od Grok Voice Think Fast 1.0 zní relativně přirozeně, v praktickém fungování jako agent za ním ale těžce zaostává.

💰 Investice, akvizice a business:

Americká technologická firma Coupa, tvůrce platformy pro automatizované řízení firemních výdajů, koupila 100% podíl v českém startupu Rossum, který se zaměřuje na využití AI pro extrakci dat z dokumentů.

NVIDIA se stala první firmou, která přesáhla valuaci 5,5 bilionu dolarů. Holt platí, že když udeří zlatá horečka, nejvíc vyděláte prodejem krumpáčů.

Isomorphic Labs, tvůrci AI modelu AlphaFold, který dokáže predikovat tvar a interakce biomolekul, získali Series B investici ve výši 2,1 miliardy dolarů.

xAI se sloučila se svojí mateřskou společností SpaceX. Nově bude fungovat jako její divize pod názvem SpaceXAI.

☕ Data gossip:

Pořád běží naše soutěž o lístek na WebExpo 2026! Stačí dát odběr na WebExpo newsletter a napsat nám svůj nejlepší zážitek z WebExpa. Nejlepší odpověď vybereme příští týden ve čtvrtek.

BottleCap AI Jaroslava Becka a Tomáše Mikolova, která si klade za cíl až stonásobně zefektivnit trénování AI modelů, se dostala na seznam 21 firem, které TechCrunch doporučuje sledovat.

O'Reilly Radar sdílel prezentaci Šimona Podhajského (Head of AI Waypoint) s názvem Cognitive Exhaust Fumes, or: Read-Only AI Is Underrated.

🎙️ Podcasty, videa, přednášky:

Data Talk #183 | Sara Maldon (MAKE)

⚒️ DATA JOBS

Aim

Senior Backend Engineer (Praha)
AI Product Engineer (Praha)

Allwyn

AI & Automation Lead (Praha)
AI and Automation Engineer (Praha)

BigHub

AI Solutions Analyst (Praha)
Architect & Data Engineering (Praha)

Carl Data Company

Business Development manager (Praha)

Colours of Data

Solutions Engineer (Praha/remote)
Data Science & AI Architect (Praha/remote)

DataBrothers

Head of Sales (Praha)

DeepScout

Python Software Engineer – Medior/Senior (Praha/remote)
Web Scraping Engineer – Medior/Nadšenec (Praha/remote)

Direct Technologies

Head of Data (Praha)
AI Systems Engineer – Agentic Systems (Praha/Brno)
Senior Data Modeler (Praha)

Equilibre

FLO

Data Engineer (Praha)
Business Development Manager (Praha/remote)
Data Scientist (Praha)

GoodData

Sr. Product Manager (Praha)
Sr. AI Python Engineer (Praha)

Rossum

Senior AI Research Engineer (Praha)
Junior AI Platform Engineer (Praha)

TV Nova

Hledá vaše firma někoho na pozici spojenou s daty?

Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Chcete si přečíst naše starší newslettery?

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporu na kafe!