#49 Tak co ten modern data stack? Žije ještě?

Ahoj,
tenhle týden dostanete:
- slevičku na The Art Of Smart
- rozřešení osudu modern data stacku
- lokální chatbot od NVIDIA
- AI proslov z vězení
- 52 vašich potenciálních nových kolegů
- a asi tak tunu dalších datových a AI novinek, článků, nabídek práce a všeho možného.
Je tady Data Talk newsletter.
Data Talk newsletter nyní odebírá 963 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)
The Art Of Smart se už blíží
Příští týden ve čtvrtek 22. února proběhne v Národní technické knihovně AI/business/data konference The Art Of Smart a je na co se těšit.
Hlavní hvězdou konference bude profesor Luciono Floridi, jeden z největších světových odborníků na AI a digitální etiku. Mimo jiné také pracoval jako etický konzultant pro Google, Evropskou unii, britskou vládu, britský parlament nebo UNESCO. V roce 2020 byl dokonce nejcitovanějším vědcem na světě. V tomhle čím dál tím relevantnějším oboru zkrátka platí za absolutní špičku.
Vystoupí ale i mnoho dalších řečníků, kompletní program najdete na webu The Art Of Smart.
Máme pro vás i slevový kód na 30% slevu na vstupenky DATATALK30.
📅 Kalendář datových akcí
Příští týden:
- Dype Business Talks 2: AI ve financích (úterý 20. února)
- data+vis meetup(úterý 20. února)
- GoodMeetup #4: The Modern Frontend: UX, AI, and Beyond (úterý 20. února)
- Data Science Day (středa a čtvrtek 21.-22. února)
- Pyvo Prague #153 - Specifications as a better way of development (středa 21. února)
- Prague Gen AI Meetup: Testability, and Evaluation Strategies for LLMs (středa 21. února)
- DATA mesh #18 by Apify (čtvrtek 22. února)
- The Art Of Smart (čtvrtek 22. února)
Pak:
- Rossum Aurora webinář (úterý 27. února)
- Bratislava Data Meetup #6: Python in Cloud (úterý 27. února v Bratislavě)
- Clubs Unity AI konference 2024 (úterý až čtvrtek 27.-29. února)
- HPE Data Science & AI workshop (čtvrtek 29. února)
- Data Punkers 10: Choose a home for your data (středa 6. března)
- AI Synergy Summit: H2O.ai & Billigence (středa 6. března)
- AI Safety seminář (pondělí 11. března)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- WebExpo (středa až pátek 29.-31. května 2024)
- International AI Summit (pondělí až středa 27.-29. května)
- DATA mesh #19 by MEWS (čtvrtek 6. června)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📰 Novinky, linky a drby
Je modern data stack mrtvý?
Určitě jste tyhle debaty zaregistrovali. Ještě před nějakou dobou nedotknutelný koncept, dnes přední terč pochybovačů. Zjednodušeně se jedná o architekturu, kdy je datový stack postaven z různých toolů, které mají každý určitý specifický účel. Výhodou je, že si každý dílek skládačky můžete zvolit takový, jaký vašim potřebám nejvíc vyhovuje. V čem je teda ten háček?
Skvělý článekna tohle téma napsal Tristan Handy (founder dbt). Modern data stack je vesrovnání s tooly z doby předcloudové naprosto geniální, o tom není pochyb. Jenže to není to, s čím teď soupeří. Vyzyvatelem jsou integrovaná řešení. Odpadá s nimi problém žonglovat se stackem s nástroji klidně i od 8-12 vendorů. Propojit 2-4 komplexnější služby je prostě jednodušší. Nedá se opominout ani faktor stability ekosystému - šance, že službu přestane poskytovat jeden z 12 malých vendorů (třeba kvůli krachu firmy) je značně vyšší, než že se vám to stane u velké společnosti.
Když modern data stack pomalu umírá, jak se bude říkat tomu, co přichází? Tristan navrhuje používat jednoduše termín analytics stack. Protože nic jiného to vlastně není.
V Data Talk podcastu na tohle téma mimo jiné mluvil Martin Fišer z Kebooly.
Nový (lokální) kohout na AI smetišti
NVIDIA poslední dobou šlape do AI výzkumu jako málo kdo, vyloženě uživatelský produkt jí zatím ale chyběl. Tomu je ale konec - zdarma vypustila chatbot/asistent Chat With RTX. Ten běží plně lokálně, k jeho provozu potřebujete jen grafickou kartu řady RTX 30 s minimálně 8GB VRAM.
K práci s textem využívá open-source LLMs Mistral a Llama 2, uživatel si může model zvolit, který model je mu po chuti. Pracovat umí s formáty .txt, .pdf, .doc/.docx a .xml. a s YouTube videi, což je v současné době jeho jediná forma práce s obsahem na internetu.
Protože veškerý processing probíhá lokálně, nemusíte se tedy bát toho, že se vaše citlivá data dostanou do nepovolaných rukou nebo se na nich bude nedej bože nějaká AI učit.
Další novinky:
- Andrej Karpath, jeden ze zakladatelů OpenAI, se z něj rozhodl odejít
- drama se ale nekoná, prostě se chce chvíli věnovat osobním projektům
- ElevenLabs nabízejí dabérům možnost vydělávat za využití jejich naklonovaného hlasu
- OpenAI testuje mezichatovou paměť ChatGPT
- V USA zakázali využívání klonovaných hlasů v automatických telefonátech, vadilo zejména využívání při politických kampaních
- Podvodníci pomocí AI klonu CFO přesvědčili zaměstnance k převedení 25 milionů dolarů
- Billigence získali status Snowflake Premier Partner v Evropě (vedle Elite Premier Partner v regionu Asia-Pacific). V České republice jsou aktuálně jediným Premier partnerem
- Čeští CDN77 mají nový 400Gb/s link Miami-Sao Paolo
- Virtuální AI přítelkyně o vás (ne úplně překvapivě) sbírají obrovské množství dat, zároveň s nimi uživatelé běžně sdílí hodně osobobní informace
Články a papery:
- Navigating the AI Wave: Challenges and Opportunities for Boutique Data Consultancies
- Francesco Puppini o Unified Star Schema
- Co je těžší, kilo peří, nebo půl kila železných šroubů?
- test logického uvažování GPT-4, Gemini Ultra a Claude 2.1
- Kechlibar: Čtyři bloky můžou být málo
- o tom, jak důležitá je energetika pro rozvoj AI
Data gossip:
- Spustili jsme registrace na DATA mesh #18 by Apify
- Mark Zuckerberg má poměrně jasný názor na Apple Vision Pro
- Podle Michala Illicha (founder Zuri) používá Dipsy pro řazení studentů na střední školy nevhodný algoritmus
- Viet Anh Chu se stal Customer Success Managerem v Optimics
- Jakub Rajský přechází do Apify
- Áňa Bohoněk nám koupila kafe, děkujeme!
Podcasty, videa, přednášky:
- Data Talk #74 s Michalem Bláhou (Hlídač státu) o tom, proč je český stát s daty tolik na štíru
- Sam Altman at the World Government Summit
- U Kulatého Stolu | Speciál o umělé inteligenci s Davidem Grudlem: Falešná videa, rozpoznávání reality, ChatGPT a halucinace AI
S AI můžete vést politické proslovy i z vězení
Bývalý pákistánský premiér Imran Khan byl odsouzen v přinejmenším podezřelém korupčním procesu k 10 letům vězení. To mu ale nezabránilo vést předvolební kampaň. Využil AI avataru a naklonovaného hlasu, kterým promlouval ke svým voličům. A zafungovalo to. Volby vyhrál a vítěznou řeč pronesl, jak jinak, prostřednictvím AI.

❓Random trivia
Věděli jste, že za masivní rozšíření thajských restaurací může gastrodiplomacie? V roce 2002 thajská vláda spustila program Global Thai, v rámci kterého trénovala kuchaře, nastavila standardy a certifikace a poskytovala výhodné půjčky na zřízení restaurací v zahraničí. A taky jmenovala pad thai národním jídlem Thajska. Cílem programu bylo zlepšení image Thajska ve světě a přilákání turismu do země.

Kandidát zdarma
(Sdílíme datové specialisty, kteří hledají, kde by mohli být užiteční. Klidně se nám ozvěte, jestli chcete zasdílet, na michal@fenekpr.cz)
- Zuzana Kropáčová - ex IT Project Manager Czechitas
- 51 (!!!) talentů z Kiwi.com, kteří hledají novou roli po restrukturalizaci firmy
DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)
- BigHub
Recombee
- Sazka
- Revolt.BI
- Colours of Data
- Livesport
- Keboola
- intecs
- Nano Green
- Emark
- GoodData
- Operátor ICT, a. s.
- DataSentics
- UBS
- Data Scientist (Curych)
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!