#75 Data, AI a layout kalkulačky?
Ahoj,
vyšla nová verze Airflow, na API callech Claude teď můžete pořádně ušetřit, s Grokem 2 pořádně zlobit, Bizztreat se stará o datovou scénu a doporučovací algoritmus na hudbu Googlu o to, co právě děláte.
Je tady DataTalk newsletter.
DataTalk newsletter nyní odebírá 1229lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.
Bizztreat podporujeData Talk
Naši oblíbení autoři datových mňamek budou [minimálě!] další rok členy Data Talk klubu, což je skupina našich nejvěrnějších podporovatelů! Díky nim můžeme dělat i tento newsletter.
Vážíme si toho a moc děkujeme!

Za meme děkujeme Johanovi ze SatoshiLabs.
Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz
📅 Kalendář datových akcí
Přiští týden:
- PyData Prague #22 - Summer Special Edition (středa 28. srpna)
- Akce, která se nedá vygooglit (29.-31. srpna)
Pak:
- MeasureCamp Czechia 2024(sobota 7. září)
- GoodMeetup #6: Databricks vs. Snowflake (úterý 10. září)
- Mindstone Prague AI Meetup (středa 11. září)
- DATA mesh Brno by Notino (čtvrtek 12. září)
- DATA mesh by Sazka (čtvrtek 19. září)
- Hackaton Když data promluví (pátek až neděle18.-20. října v Olomouci)
- Dny AI (pondělí až neděle 14.-27. října)
- KPMG Data Festival (úterý 5. listopadu)
- AI Awards (čtvrtek 21. listopadu)
- Kurz Práce s daty: Jak porozumět světu dat a být strůjcem pokroku (středa 9. 10. 2024 až pátek 31. 1. 2025)
📰 Novinky, linky a drby
Články a papery:
- Google Research | Transformers In Music Recommendation
- Google Research vyvinuli doporučovací algoritmus využívající tranformery k doporučování hudby. Zajímavé je, že algoritmus bere v potaz i co právě uživatel dělá - například při cvičení doporučuje jinou hudbu než večer před spaním. Činnost uživatele mapuje na základě vzorců, které berou v potaz například i čas a lokaci uživatele.
- Bizztreat | Mňamka #529: Vejde se váš dashboard na jednu stránku a proč by vlastně měl?
Data gossip:
- Děkujeme našim fanouškům a kamarádům Zdeňkovi Haníkovi a Monice Tesaříkové za koupení kafe.
- Daria Hvížďalová shání někoho z praxe, kdo by dal pro-bono studentům 42 London přednášku o best practices při generování kódu pomocí AI.
- Štěpán Hýbl přechází ze Salesforce do Googlua je „the Tableau guy“
- Spotflow, spin-off Datamole, předělali ve své platformě Data Flow designer
- Nemalému počtu z vás nechodil newsletter, snad jsme to fixli :)
Podcasty, videa, přednášky:
- Data Talk #101 s Petrem Václavkem (Colours of Data)o tom, jak se implementuje Bloomreach, jak úspěšně komunikovat se zákazníky a jak ktomu využít data.
Random trivia
Věděli jste, proč na číselníku telefonu čísla začínají jedničkou vlevo nahoře, kdežto na kalkulačce vlevo dole?
O rozložení tlačítek na telefonu se rozhodovalo v Bell Labs v 50. letech 20. století, když se hledal nástupce rotační číselnice. A protože v Bell Labs je to samý vědec, šli na to vědecky. Navrhli 16 možných layoutů a zkoumali, jak rychle a s jakou chybovostí na kterém šlo zadávat telefonní čísla.
Na základě těchto parametrů vybrali 5 variant - tu dnes používanou, 2 kruhové připomínající rotační číselnice a 2 se dvěmi řadami čísel. Těchto 5 pak nechali své pokusné králíky hodnotit čistě na základě uživatelské preference. Jenže z toho vyšla více méně plichta. V tu chvíli šel vědecký přístup stranou a prostě se rozhodli, že použijí rozložení 3x3+1 podobně jako na kalkulačce a číslice seřadí tak, jak se čte text - zleva doprava, seshora dolů. Tenhle layout se rychle ujal a zůstal nám dodnes.
A proč je to teda na kalkulačce jinak? Tady přišla ke slovu statistika.
Podle Benfordova zákona jsou v datech z reálného světa jako první číslice čísla statisticky výrazně více zastoupeny nízké číslice . Platí, že čím nižší číslice, tím vyšší statistické zastoupení. Toto pravidlo platí i pro další číslice čísla, ale s postupně slábnoucí statistickou vahou. Zároveň nad rámec tohoto pravidla je číslice 0 disproporčně více zastoupena na všech pozicích (kromě první číslice). Ve zkratce statistika říká, že čtyři nejčastěji zastoupené číslice jsou 1, 2, 3 a 0.
Zároveň jsou velmi často mačkanými tlačítky na kalkulačce operátory, nejčasteji plus a rovná se, a desetinná čárka. Proto dávalo ergonomicky smysl dát tato tlačítka co nejblíže sobě.

⚒️ DATA JOBS
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- intecs
- Emark
- GoodData
- Notino
- Upheal
- UD4D
- Coders Lab
Jestli vaše firma hledá někoho na pozici spojenou s daty, pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme.
Data jobs taky taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aia vlastě odkudkoliv se dá.
Chcete si přečíst naše starší newslettery?
Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?
Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!
A pokud vás naše práce baví a poskytuje vám hodnotu,
můžete nám poslat finanční podporuna kafe!