#46 Všeobecná, otevřená, ale hlavně Zuckerbergova

Ahoj,
tenhle týden se mimo jiné dočtete
- o plánech Marka Zuckerberga s AGI
- o revoluci v AI videu
- o tom, jak Microsoftu přijde ChatGPT trochu drahý na provoz
- nebo o tom, že má Nightshade možná mouchy.
Je tady Data Talk newsletter.
Data Talk newsletter nyní odebírá 940 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)
Data Science & AI Workshop with HPE
Rádi bychom vás pozvali na workshop HPE určený pro odborníky z oblasti Data Science, Machine Learning a Deep Learning, který se zaměří na téma umělé inteligence.
Workshop se uskuteční ve čtvrtek 29. února 2024 od 9:00 v Business Lounge v 7. patře budovy Visionary na Praze 7, Plynární 10.

Neočekávejte korporátní prezentace, akce je spíše prakticky laděná. Součástí workshopu bude nejen ukázka příslušných nástrojů a prostředí, ale možnost si je vyzkoušet (notebooky s sebou!).
Těšit se můžete na úvodní slovo Jana Romportla o stavu AI v Česku, příspěvek Tjerka Houwelinga o stavění AI enterprise řešení, diskuzi o customer AI, a live dema a workshopy s Christophem Menichettim.
Předpokládaný čas ukončení je v 15:00. Většina přednášek bude v anglickém jazyce.
📅 Kalendář datových akcí
Příští týden:
- PAPER JAM | Využití AI na pozici IT juniora (úterý 30. ledna)
Pak:
- Miton AI Times: Semantic Search with Elasticsearch (čtvrtek 8. února)
- Machine Learning meetups: ML Meets Machine (úterý 13. února v Brně)
- AI Restart 2024 (čtvrtek 15. února)
- Dype Business Talks 2 (úterý 20. února)
- DATA mesh #18 by Apify (čtvrtek 22. února)
- HPE Data Science & AI workshop (čtvrtek 29. února)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- WebExpo (středa až pátek 29.-31. května 2024)
- International AI Summit (pondělí až středa 27.-29. května)
- DATA mesh #19 by MEWS (čtvrtek 6. června)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📰 Novinky, linky a drby
Meta se plánuje pustit do vývoje AGI
Mark Zuckerberg v rozhovoru odhalil plány Meta do budoucna. Chystá se věnovat značné zdroje vývoji open-source AGI. Za tímto účelem spojil výzkumný tým FAIR a vývojářský GenAI, který pracuje na velkých jazykových modelech. Zároveň ale dodává, že tímto nepřestává práce na novém generativním modelu LlaMA-3.
Zuckerberg by rád vytvořil AGI, která nejen dosáhne lidské úrovně inteligence (nebo ji překoná), ale zároveň bude mít schopnost logického dovozování a intuice. Open-source přístupem pak chce zajistit, aby se moc, kterou s sebou nese kontrola nad takovým modelem, nekoncentrovala v jediných rukou.
Plánují také masivní investice do své výpočetní infrastruktury, do konce roku 2024 má využívat více než 340 000 AI akcelerátorů NVIDIA H100. To zní na první pohled při současné situaci na trhu jako neuvěřitelné množství, ale NVIDIA ve svých projekcích na příští rok počítá s výrobou 1.5 až 2 milionů kusů těchto grafických karet.
Google představil video generativní AI model Lumiere
Výzkumníci z Google Research vytvořili revoluční generativní AI model pro tvorbu videa Lumiere.
Dokáže tvořit pouze pětisekundové klipy a video pořád nevypadá stoprocentně přirozeně, ale přesto se jedná o obrovský pokrok. Využívá totiž kontinuálního generování namísto prostého spojování keyframů, což vede k zatím nevídané konzistenci videa.
Model umí vytvářet videa na základě textových promptů, rozpohybovat části, nebo i celé statické obrázky, využívat referenčních stylů z obrazu i videa, nebo upravovat části videí podobně jako Generative Fill od Adobe.
Kdyby vás zajímalo víc, vydali k modelu i paper.

Další novinky:
- Trellu unikla databáze uživatelů, zapněte si tam dvoufázové ověřování
- Microsoft vnímá nákladnost provozu ChatGPT jako překážku jeho využití pro určité use casy a plánuje vytvořit malý levný generativní AI model
- Nástroj Nightshade určený k „otrávení” AI modelů byl vypuštěn k užití zdarma
- podle zkušenosti některých uživatelů však moc nefunguje
- EU plánuje vybudovat ekosystém na podporu AI startupů
- ElevenLabs, zabývající se AI klonováním hlasů a vytváření syntetických, dostali investici od Credo Ventures a stali se jednorožcem
- Česká spořitelna nasazuje Microsoft Copilot. Slibuje si zvýšení produktivity o třetinu
- Na Amazonu se nám rozmohl takový nešvar s AI vygenerovanými (vlastně nevygenerovanými) popisky zboží
- Česko-slovenští Better Stack jsou v černých číslech a získali další investici ve výši 10 milionů dolarů
- Slovenský startup elv.ai bojující s dezinformacemi a nenávistným obsahem získal investici v výši 500 tisíc dolarů
Články a papery:
- Revolt.BI: Jak přejmenovat sloupec v Keboola
- Mysleli jste si, že to nejde? Tady máte hack
- Chris Warrick: Python Packaging, One Year Later: A Look Back at 2023 in Python Packaging
- Measuring data quality: bringing theory into practice
- Recombeelab's 2023 Research Publications
Data gossip:
- Na VŠE nasadili AI přepis scanů testů. Netrvalo dlouho a jeden ze studentů jim tam napsal SQL inject DROP TABLE
- Zdeněk Valut (CEO YDEAL.cz) vytvořil AI asistenta, který vám doporučí AI kurzy, na co si jen vzpomenete
- Jan Kohout dělá skvělý online kurz o využití AI při studiu
- děkujeme Kateřině, která nám anonymně koupila kafe
Podcasty, videa, přednášky:
- Data Talk #71 s Václavem Kouklíkem (Sazka) o rozjezdu BI reportingu v Sazce, regulatory reportingu a o tom, jak důsledná data governance odemkla self-service BI
- intecs insider #13: Cesta Martina Drába v intecs
❓Random trivia
Věděli jste, že slovem roku American Dialect Society vyhlásila slovo „enshittification”? Označuje proces, kdy určitá věc postupně čím dál tím víc a víc jde do... kopru. Slovo poprvé použil Cory Doctorow ve svém blogpostu o procesech úpadku technologických služeb, kdy jsou platformy nejdříve designované tak, aby byly užitečné pro uživatele, následně začnou prioritizovat své businessové zákazníky (inzerenty) a v poslední fázi přestanou brát ohledy i na ně a maximalizují svůj zisk, což vede k odlivu jak uživatelů, tak inzerentů, a platforma umírá.

DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)
- BigHub
Recombee
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- Livesport
- intecs
- Nano Green
- Emark
- GoodData
dDd
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!