Newsletter

#72 Proboha, nerolloutujte updaty naráz

Ahoj,

Crowdstrike udělali obří průšvih, OpenAI vydali úsporný, ale extrémně výkonný model, Meta se svým Llama dotahuje a v Google vytvořili 100 000x úspornější model na predikci počasí.

Je tady DataTalk newsletter.

DataTalk newsletter nyní odebírá 1136lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Příští týden bude další DATA mesh

by Workday

Ve čtvrtek 1. srpna se uskuteční už 22. DATA mesh. Sejdeme se v kancelářích Workday vbudově Masaryčka na adrese Na Florenci 2139/2, Praha 1.

Klasicky vystoupí 3 speakeři: 

Marián ŽabkaBizzTreat,

Vojta KopalMEWS

a

Jan Lukány z Datamole.

Na talky máme omezenou kapacitu, takže s registrací neotálejte.

Začínáme v 6, od 8 startuje afterparty, kde můžete networkovat a taky se tradičně utkáme v pub quizu a Atomic Bombermanovi. Budeme se na vás těšit.

Máte memes nebo vtipné obrázky, o které se chcete podělit?  Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Přiští týden:

Pak:

📰 Novinky, linky a drby

CrowStrike způsobil celosvětový výpadek IT služeb

Minulý pátek došlo k největšímu výpadku IT služeb v historii. Kvůli chybě vsoftwaru Falcon společnosti CrowdStrike, který slouží k ochraně proti kyberútokům, se na 8,5 milionů zařízení objevila modrá obrazovka.

Falcon pracuje jako jeden z mála Microsoftem povolených softwarů na úrovni jádra operačního systému. Díky tomu může na nejnižší úrovni systému detekovat potenciální hrozby, ale zároveň to znamená, že pokud dojde k jeho selhání, nemůže ho systém „odstřelit” jako běžný program a celý spadne. Vzhledem k tomu, že kchybě docházelo konzistentně při bootování, počítače v podstatě nešlo úspěšně zapnout. Vzhledem k tomu, že na macOS a Linuxu software přístup k jádru systému nemá, týkal se tento problém pouze Windows.

Vydání opravy trvalo pouhých 78 minut, ale to už byly kvůli automatickým updatům Falconu postiženy miliony zařízení. Oprava nebyla až tak složitá, ale musela být provedena manuálně na každém zařízení. Docházelo tak dlouhodobým výpadkům, zejména ve společnostech s malými nebo outsourcovanými DevOps týmy. Podle stesků na sociálních sítí nebyly úplně vzácné případy, kdy každý DevOpsák ve firmě musel manuálně opravit přes 2000 strojů. Co si budeme povídat, není to úplně vysněná zábava na víkend.

Co se týče náhrady škody, je Crowdstrike z obliga. Ve smluvních podmínkách má totiž uvedeno, že ručí za škodu pouze do výše poplatků za službu. To je velmi nepříjemné například pro letecké společnosti, které mají ze zákona povinnost vyplácet náhrady za zrušené lety. Některé z nich jich zrušily i přes 5000. V kontextu toho je naprosto komické, že Crowdstrike poslal postiženým partnerům jako omluvu dárkové karty na Uber Eats v hodnotě 10 dolarů.

Snad se z tohohle incidentu do budoucna všichni poučí a už nikoho nenapadne roll-outovat updaty na kritické infrastruktuře na všechny zařízení naráz.

OpenAI vydali kompaktní verzi GPT-4o

Nový model OpenAI GPT-4o mini nahradil GPT-3.5 Turbo. Ačkoliv jeho velikost OpenAI tají, měla by se podle jejich vyjádření blížit Llama 3 8B, Claude Haiku a Gemini 1.5 Flash. Díky tomu je výrazně levnější na provoz, a jeho cena to odráží. Při ceně $0,15 za milion tokenů inputu a $0,60 za milion tokenů outputu je o 60% levnější než GPT-3.5 Turbo, cca 2x levnější než Gemini 1.5 Flash a Claude 3 Haiku a 20x levnější než GPT-4o. 

Model je zároveň překvapivě výkonný, v dané kategorii naprosto bezprecedentně. Blíží se GPT-4o, podle výsledků v LMSYS aréně dokonce poráží Claude 3.5 Sonnet a Gemini Advanced.

Jeho verze bez multimodálních funkcí je dostupná všem uživatelům zdarma.

Nový open-source model společnosti Meta se vyrovná GPT-4o 

Nový model Llama 3.1-405B pořádně otřásl dominancí OpenAI a Anthropicu. Jedná se o první open-source model, který dosahuje kvalit těch nejlepších uzavřených modelů. Podle benchmarků by měl být dokonce lepší než GPT-4o a Claude 3.5 Sonnet (interní benchmarky ale berme jako vždy lehce s rezervou, počkejme si na výsledky z LMSYS arény). Podle Marka Zuckerberga by také měla být jeho inference asi o polovinu levnější než u API GPT-4o.

Google vydal nový kompaktní model pro predikce počasí

Google vydal nový open-source AI model NeuralGCM pro predikci počasí a klimatu, který využívá kombinace strojového učení a neuronových sítí. Je o něco přesnější než v současnosti používané AMIP modely, ale hlavně vyžaduje přibližně 100 000x menší výkon k provozu. Pohodlně ho rozjedete i na slušnějším notebooku, narozdíl od AMIP modelů, které vyžadují superpočítač.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

Random trivia 

Věděli jste, že první spam byl odeslán už v 3. března 1978? Poslal ho marketér Gary Thuerk přes síť ARPANET cca 400 uživatelům jako propagaci nových počítačů DECSYSTEM-20 společnosti Digital Equipment Corporation, pro kterou pracoval.

Tehdy dostal od většiny uživatelů ARPANETu, kterým email přišel, slušnou čočku, ale také díky němu prodal nemalé množství těchto počítačů v celkové hodnotě okolo 14 milionů dolarů.

⚒️ DATA JOBS

Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Data jobs taky taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aia vlastě odkudkoliv se dá.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!