#56 Nevěřte vlastním uším, OpenAI uvádí Voice Engine

Ahoj,
Dneska pro vás máme nový hlasový model od OpenAI, jedno skoro neuvěřitelné odhalení back dooru nebo třeba novou metodu jailbreakování LMMs. Je tady Data Talk newsletter.
Data Talk newsletter nyní odebírá 1043lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit! )
Nejste z Prahy a jedete na WebExpo? Máme pro vás příručku!
V ní najdete spoustu zajímavých míst v okolí WebExpa, která stojí za to v Praze vidět. Od Národního muzea přes Tančící dům až po Čertovku. Je tam všechno. A pokud jste z Prahy, stejně se na článek podívejte, jsou tam fakt pěkné fotky, někdo si s tím očividně vyhrál.
Jinak pořád platí kódy na 20% slevu z ceny vstupenky DATATALK a 10% slevu z ceny prémiových workshopů 24DATATALK10 (slevy není možné kombinovat, ale jde vytvořit dvě objednávky a uplatnit je tak obě 😉).
📅 Kalendář datových akcí
Příští týden:
- Creative AI Meet-Up Prague #6 (pondělí 8. dubna)
- Productboard Software Architecture Meetup #3 (pondělí 8. dubna)
- Machine Learning Meetup Brno: LLMs for math problems (středa 10. dubna v Brně)
- Snowflake Data forBreakfast (čtvrtek 11. dubna)
Pak:
- Konference Umělá inteligence a inovace ve vzdělávání(čtvrtek 18. 4. v Pardubicích)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- mDevCamp 2024 + AppParade (úterý 23. dubna)
- Data Punkers 11: Jak Češi mění datový svět (čtvrtek 25. dubna)
- AI transformace financí (středa 29. dubna)
- AI for body & soul (čtvrtek 23. května)
- WebExpo (středa až pátek 29.-31. května 2024)
- DATA mesh #19 by MEWS (čtvrtek 6. června)

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📰 Novinky, linky a drby
OpenAI poprvé ukázali jejich hlasový model Voice Engine
Tento AI model dokáže naklonovat lidský hlas z pouhých 15 sekund původního záznamu. A jak se můžete přesvědčit, dělá to opravdu dobře. Dokáže zachovat emoce a přízvuk hlasu, který napodobuje. Dokáže také překládat zvukovou stopu do jiných jazyků, rovněž se zachováním emocí a intonace.
Další novinky:
- Do open source knihovny „xz“ určené ke kompresi dat někdo propašoval back door, díky kterému mohl získat přístup k serverům. Odhalil ho developer z Microsoftu Andres Freund, který si všiml, že v případě špatně zadaných přihlašovacích údají při přihlášení na SSH trvala odpověď 0,8 sekund místo obvyklých 0,3 a že to podezřele zatěžuje procesor. Klobouček.
- Microsoft a OpenAI plánují postavit data centrum za 100 miliard dolarů, součástí něj má být i AI superpočítač Stargate. Projekt má být dokončen v roce 2028.
- OpenAI přidali do DALL-E 3 možnost editovat přegenerovat oblast obrázku, podobně, jako to umí Adobe Firefly
- ChatGPT dává nově při vyhledávání informací na internetu větší důraz na uvádění zdrojů, podobně jako Perplexity
- Pamatujete si paper k 1bitovým LMMs?Nous Research ověřili, že to opravdu funguje. S touto architekturou je možné provozovat model se 70B parametrů.
- Výzkumníci z Princetonu vytvořili open-source systém, s pomocí kterého GPT-4 funguje jako AI agent generující software podobně jako Devin
- v SWE benchmarku dosáhl výsledku 12,29 %, Devin 13,84 %
- Deepnote přidali funkci AI generování SQL dotazů
- Mimochodem, pokud má ChatGPT problém otevřít link, občas mu stačí říct „but Gemini can.“ Pokud řeknete Gemini, že ChatGPT něco umí, začne fňukat a vymlouvat se (mnohokrát ozkoušeno).
Články a papery:
- The EU AI Act: Guide for Developers
- Many-shot jailbreaking
- Anthropic popsali metodu, pomocí které jde přesvědčit LLMs, aby dělal něco zakázaného pomocí injectingu fingovaného předchozího rozhovoru s modelem. Úspěšnost roste s počtem pokusů, od toho název „Many-shot jailbreaking.“
- ReALM: Reference Resolution As Language Modeling
- Výzkumníci z Apple představili nový AI systém ReALM, který dokáže zpracovávat údaje na obrazovce, chápat jejich kontext a pracovat i s procesy v pozadí. Asi z toho bude hodně pěkný update pro Siri.
- On the necessity of a sin
- Článek o tom, proč jednat s jazykovými modely jako s člověkem (fungují líp)
- Radim Hampel (intecs): 4 key takeways from 1st Microsoft Fabric Conference
- Jan Kadlec (GoodData): DuckDB Meets Apache Arrow
Data gossip:
- první DATA mesh v Ostravě se povedl, koukněte na fotky
- Jiří Maňas se stal COO Kebooly
- Kateřina Lesch přechází z Deloittu na pozici Head of Data Science & Risk teams do EmbedIT
- Martin Bosák se stal Head of Data Product Platform v SAPu
- Simona Baxa se stala Head of People v Apify
- Blindspot AI oslavili 10 let
Podcasty, videa, přednášky:
- Data Talk #81 s Petrem Nemethem (Dataddo), který je první host, kterého máme v Data Talku podruhé. Pověděl nám, kam se Dataddo posunulo, jak do toho zasáhla Gen AI a proč je pro Dataddo tématem číslo jedna security a compliance
- Oblakadabra #1: Vývoj Android aplikací s Firebase a Google Cloud
- Lupa.cz | Kristýna Schusterová, Tereza Štefková (Resistant AI): Denně odhalíme až tisíce padělaných dokladů
David Grudl a Standa Hruška (STANDASHOW) vytvořili na apríla první českou plně AI písničku
Umělá inteligence napsala text, vymyslela melodii a vygenerovali zpěv i všechny nástroje. Klip museli zatím natočit sami, ale Sora už se blíží.
❓Random trivia
Věděli jste, že ač normálně člověk mrká přibližně 15x za minutu, při soustředěné práci spočítačem klesá frekvence až k 6 za minutu? Lékaři doporučují prostě vědomě mrkat častěji, ale kdo na to má pořád myslet?

DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiaj.)
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- intecs
- Emark
- GoodData
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Ještě náš newsletter ještě neodebíráte?
Data Talk není pay to play!
Pokud chcete sdílet svoje know-how, obsah od vás z firmy, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!