#27 Dávejte si pozor, co píšete na Twitter. Učí se

Ahoj,
Google vytasil dost zajímavý generativní AI model (a my to minulý týden přehlídli), X sbírá vaše data pro strojové učení, OpenAI se brání žalobám, magazín Time sestavil AI žebříček a Google má čipy jako nikdo jiný. Je tady další Data Talk Newsletter.
Data Talk newsletter nyní odebírá 771 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
Kalendář datových akcí
Příští týden:
- Meetup Česko.Digital (středa 13. září)
- Gen AI: Transforming the Data Landscape Fireside Chat (středa 13. září)
- Konference SQL Server Bootcamp 2023 (středa 13. září v Brně)
- EDIHs & AI/Robotics Horizon Europe Calls 2024 (čtvrtek 14. září)
- PyCon (pátek až neděle 15.–17. září)
Pak:
- HPE Cybersecurity Rooftop Grill & Chill (pondělí 18. září)
- GoodMeetup#3: The Use of AI in ELT, BI, and Beyond (úterý 19. září)
- MAMA AI Academy (úterý a středa 19.-20. září)
- AI [ej:aj] Online Summit(úterý až čtvrtek 19.–21. září)
- Meet & Greet: A Day in ML Productionisation(čtvrtek 21. září online)
- 2023 #1 LLMs and AI agents (čtvrtek 21. září)
- KPMG Data Festival (pátek 6. října)
- Dny AI Brno (pondělí až neděle 9.-15. října v Brně)
- Google cloud akce, zatím nezveřejněna (úterý 10. října)
- Týden inovací (úterý 10. října)
- Dny AI Plzeň (pondělí až neděle 16.-22. října v Plzni)
- Better Data 2023 (středa 18. října)
- Measure Camp Bratislava (sobota 21. října v Bratislavě)
- Dny AI Ostrava (pondělí až neděle 23.-29. října v Ostravě)
- AWS Cloud Day Prague (úterý 24. října)
- Dny AI Praha (pondělí až neděle 30. října-5. listopadu)
- Low-code/No-code konference 2023 (čtvrtek 2. listopadu)
- GECOM Global Ecommerce Congress (středa 31. ledna 2024)
Novinky, linky a drby
- Google minulý týden oznámil generativní AI model Gemini
- s 5x větším výkonem má být přímou konkurencí GPT-4
- kromě textového výstupu také generuje obrázky
- je natrénovaný na multimodálním datasetu (text, obrázky, zvuk a video) o velikosti 65 bilionů tokenů
- k jeho trénování použil Google své nové TPU v5e čipy (viz níže v sekci články)
- X (ex-Twitter) si do svých Zásad ochrany soukromých údajů přidal klauzuli (pod bodem 2.1), která ho opravňuje využívat shromážděná data uživatelů ke strojovému učení
- předpokládá se, že tato data chce využít k učení modelů nového startupu Elona Muska xAI
- podle Muskova vyjádření se má jednat pouze o veřejná data, explicitně se nemá jednat o obsah odesílaných zpráv
- Na OpenAI byly podány dvě hromadné žaloby spisovatelů kvůli porušování autorského práva
- podle spisovatelů porušili OpenAI autorské právo tím, že na jejich dílech bez jejich souhlasu trénovali ChatGPT, jejichž derivativní kopie teď produkuje
- OpenAI se brání, že i kdyby díla těchto autorů byla drobnou součástí rozsáhlého datasetu, na kterém je model natrénový, nakládá s nimi natolik trasformativním způsobem, že se nejedná o plagiarizaci
- Magazín Time sestavil seznam 100 nejvlivnějších lidí v AI
- USA rozšiřuje omezení vývozu AI čipů i na některé země Blízkého východu
- Vědci vyvinuli AI model schopný předpovídat vůně na základě chemické struktury
Články:
- Google: How Cloud TPU v5e accelerates large-scale AI inference
- Ben Evans: Generative AI and intellectual property
- Meta: Evaluating the fairness of computer vision models
- How Midjourney’s Founder Built an AI Winner While Rejecting Venture Capital
Data gossip:
- Prg.AI chystají na 3. 11. zatím neoznámenou konferenci
- Senta Čermáková se stala výkonou ředitelkou Czechitas
Martin Fridrich začala pracovat v TD SYNNEX jako Senior Manager Data Science
- Proběhl 16. ročník ChannelWorld Awards
- GymBeam si nechali dát přednášku od Brain We Are
Podcasty, videa, přednášky:
- Data Talk #52: Jakub Šiler (HiCarl)
- intecs insider #9: Jak u nás funguje people developement
- The Data Stack Show 153: The Future of Data Science Notebooks with Jakub Jurových (Deepnote)
- The Guardian podcast | Weizenbaum’s nightmares: how the inventor of the first chatbot turned against AI
DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly* atd.)
- BigHub
- intecs
- Nano Energies
- Sazka
- BizzTreat
- Livesport
- Manta
- Data Engineer
- Productboard
- SAP
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Jestli vám tenhle newsletter někdo přeposlal, můžete se k odběru přihlásit tady.
Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!