#41 Ocenění pro Tomáše Mikolova, lepší ruce pro Tesla robota

Ahoj,
Tesla pokročila s roboty, EU už ví, co chce mít v AI aktu, Google minulý týden trochu kecal, Mistral vydali skvělý model, vyšel Grok a ChatGPT je nějaký líný.
A dělo se toho ještě mnohem víc. Proto je tady DATA talk newsletter.
Data Talk newsletter nyní odebírá 898 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📅 Kalendář datových akcí
Příští týden:
- Pyvo Prague #151 - Christmas Hardware Edition (středa 20. prosince)
Pak:
- Snowflake Data Cloud Group Meetup #1(čtvrtek 18. ledna)
- Edge 1.0 - Generativní AI ve vizuální kultuře(pondělí 22. ledna)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- WebExpo (středa až pátek 29.-31. května 2024)
- International AI Summit (pondělí až středa 27.-29. května)
- GECOM Global Ecommerce Congress (pondělí až středa 27.-29. května)
- Global ESG & Sustainable Summit (pondělí až středa 27.-29. května)
- Global Investment Summit (středa 29. května)
📰 Novinky, linky a drby
Tesla představila novou verzi robota Optimus
Je o 30 % rychlejší, o 10 kilo lehčí, dostal prstové senzory, takže umí lépe manipulovat s předměty, a flexibilní krk, takže může otáčet hlavou podobně jako člověk.

Další novinky:
- Google přiznal, že si video představující Gemini trochu přibarvil
- místo videa a hlasu byli vstupem obrázky a text, přirozené reakce v reálném čase byly kompletní fabrikace
- benchmarky srovnávající ho s ChatGPT navíc nepoužívaly stejné techniky promptování (řetězení promptů u Gemini vs. 5 pokusů u ChatGPT), při srovnatelných technikách už Gemini tak jednoznačně nevítězí
- EU schválila finální znění AI aktu
- zakazuje biometrické analýzy osob, scraping obrázků obličejů, rozpoznávání emocí osob na pracovišti a ve vzdělávání, počítání sociálního skóre, využívání AI k manipulaci a zneužívání lidských slabin
- nese s sebou ale i množství nepříjemné byrokracie, zejména pro high risk aplikace
- samotnou tvorbu modelů nereguluje
- Mistral vydali open source LLM Mixtral 8x7B
- má 45 miliard paramentrů a je extrémně nenáročný na provoz
- podle benchmarků patří k tomu nejlepšímu mezi open source
- model poskytli k vyzkoušení prostřednictvím torrentu
- Uživatelé zaznamenávají, že je ChatGPT je kolem Vánoc línější
- poskytuje kratší odpovědi a častěji odmítá kooperovat
- jednou z hypotéz vysvětlující toto chování je, že se prostě od lidí naučil, že se kolem Vánoc nemaká tak tvrdě
- Grok je dostupný ve Spojených státech
- DeepMind představil novou verzi jejich generátoru kódu AlphaCode 2
- Už zase jde předplatit ChatGPT plus, OpenAI sehnali další GPUčka
- Google Signals budou od 12. února 2024 odstraněny z reporting identity
- Understand Labs udělali super tool, se kterým můžete za pár minut udělat profesionální data stories
- Tadyse můžete podívat na preview prvního AI generovaného televizního kanálu
Články:
- Evaluating and Mitigating Discrimination in Language Model Decisions
- v Anthropicu provedli studii toho, zda-li mají jazykové modely rasové předsudky a jak jim případně předejít
- předsudky se výrazně omezily, pokud bylo v promptu zmíněno, 1) že nemá brát v potaz demografické informace a 2) že rasová diskriminace je nelegální
- Is dbt's Hype Waranted?
- This cyborg cockroach could be the future of earthquake search and rescue
Data gossip:
- Tomáš Mikolov rekapituluje word2vec, který vyhrál NeurIPS 2023 Paper Awards
- Peter Krejzl bilancuje letošní rok AI týmu Emplify
- A bilancuje i Jirka - od února 2022 jsme pro vás připravili: téměř 70 podcastů, 41 newsletterů a přes 20 akcí
- Jan Koch se stal produkťákem v Pocket Virtuality
- Alžběta Solarczyk Krausová rozjela společnost Respectful AI zaměřující se na etické využití AI
- Ondřej Pavlů odchází z Rossum a od pomalu hledá, kde by mohl být od února užitečný
- Digitoo získali investici od Ondřeje Fryce
Podcasty, videa, přednášky:
- Data Talk #66 s Johnsonem Darkwahem (Gauss Algorithmic, Kapnetix) o tom, jak pomocí AI pomáhají herním studiím zlepšovat a zrychlovat tvorbu 3D animací tvořených pomocí motion capture
- Adastra podcast 47: Jeden testovací prokejt samořídících vozů může vygenerovat petabajty dat (Jan Zahradník z Valeo)
❓Random trivia
Věděli jste, že nejzobrazovanějším článkem na Wikipedii byl v tomto roce „ChatGPT”? V závěsu za ním se umístil článek „Deaths in 2023,” který shrnuje, kteří známí lidé letos zemřeli, a „2023 Cricket World Cup,” což je velice indická zálažitost (ostatně jako několik dalších z nejvíce zobrazovaných článků). Celý přehled si můžete přečíst tady.
DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)
- BigHub
Recombee
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
Apify
- Blindspot
Datamole
Datasentics
Gen
Mama AI
Valeo
Univerzita Karlova
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Jestli vám tenhle newsletter někdo přeposlal, můžete se k odběru přihlásit tady.
Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!