#45 Jednou zdivočelý model už se nepolepší

Ahoj,
dneska máme zlotřilý model, co se odmítá polepšit, gadget, který nechce nahradit telefon, ale vlastně by asi jednou chtěl, vězně anotující data pro učení AI, nebo revoluční text-to-audio. Je tady Data Talk newsletter.
Data Talk newsletter nyní odebírá 920 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)
EMARK Analytics se stávají nový členem Data Talk klubu
Tahle původně Bratislavská firma zabývající se datovou analýzou a poradenstvím s digitálními transformacemi pomáhá svým klientům už 23 let vydolovat z jejich dat maximální užitek a hodnotu. Za tu dobu se rozrostla i na území České republika a Maďarska a stala se Qlik Master Resellerem ve všech třech státech.
Děkujeme za přízeň.


Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz
📅 Kalendář datových akcí
Příští týden:
- Edge 1.0 - Generativní AI ve vizuální kultuře (pondělí 22. ledna)
- AI Days 2024 (čtvrtek 25. ledna)
Pak:
- Miton AI Times: Semantic Search with Elasticsearch (čtvrtek 8. února)
- Machine Learning meetups: ML Meets Machine (úterý 13. února v Brně)
- AI Restart 2024 (čtvrtek 15. února)
- DATA mesh #18 by Apify (čtvrtek 22. února)
- HPE Data Science & AI workshop (čtvrtek 29. února)
- Machine Learning Prague 2024 (pondělí až středa 22.-24. dubna)
- WebExpo (středa až pátek 29.-31. května 2024)
- International AI Summit (pondělí až středa 27.-29. května)
📰 Novinky, linky a drby
Anthropic naučili model zlému chování, ale už jej ho nedokázali odnaučit
V Anthropicu provedli zajímavý pokus - natrénovali jazykový model tak, aby měnil svoje chování na základě arbitrátního detailu, v tomto případě jestli je rok 2023, nebo 2024. V prvním případě se choval bezpečně, ale jakmile se rok přehoupl do 2024, bezpečnostní trénink ignoroval. Poté se pokusili dalším učením toto chování odstranit.
Snahy o jeho přeučení však skončily absolutně bez výsledku. Dokonce se při použití zpětnovazebného učení naučil svoje nežádoucí chování v první fázi lépe skrývat.
Rabbit R1 ovládá aplikace za vás
Tohle ambiciózní zařízení je něco mezi hlasovým asistentem a mobilem. Je ale výrazně menší než telefon, má jenom 2,88" dotykový displej, otočnou kameru, jediné tlačítko, kterým se aktivuje hlasové ovládání a kolečko na scrollování. Pohání ho skromný 2.3GHz procesor, má 4 GB RAM a 128 GB interní paměti.
O ovládání aplikací se stará AI model, kterému tvůrci říkají LAM - Large Action Model. Ten je naučený na datech, jak vypadá používání aplikací přímo uživateli a toto ovládání replikuje na základě hlasových pokynů. Zároveň má i režim učení, ve kterém ho můžete naučit vaše specifické způsoby používání určité aplikace, což se může hodit třeba v grafických editorech.
Příjemně překvapí cenovka $199 a absence jakýchkoliv předplatných. Zájem Rabbit R1 rozhodně vzbudil, za první týden se vyprodalo všech 10 000 kusů vyrobených v první várce.
Další novinky:
- Microsoft představil Copilot Pro za $20 měsíčně, odemkne pokročilé AI funkce a neomezený přístup ke GPT-4 i ve špičce, neplatící uživatelé mají nově přístup k GPT-4 pouze, pokud není výtížený
- Jupyter přidal do svého Notebooku generativní AI funkce
- Vyšlo najevo, že OpenAI, Anthropic, Cohere a několik dalších amerických AI společností se tajně sešlo v Ženevě se zástupci čínské vlády, aby jednali o bezpečnosti AI
- Čeští Superface vydali GPT Actions, které propojí jakékoliv GPT s jakýmkoliv API
- Česká spořitelna pilotuje AI finančního poradce přímo ve své mobilní aplikaci
Články a papery:
- Revolt.BI: Tableau Pulse je tu! Jak ho získat?
- Wired: Tito vězni trénují AI
- skvělý článek o vězeňské digitální práci ve Finsku
- CC: Bojují proti špatnému cílení reklam. Tři Češi začali v Asii, s desítkami milionů od investorů směřují dál
- Bizztreat: Rozdílné přístupy v transformaci dat - ETL vs ELT
- Masked Audio Generation Using A Single Nonautoregressive Transformer
- výzkumníci z Meta vytvořili zajímavý text-to-audio AI model, který dokáže extrémně rychle generovat na základě promptů hudbu a zvuky
Data gossip:
- Kirill Shmidt (ex Product Analyst Team Lead z Wrike) hledá, komu by mohl být užitečný jako team lead/head of analytics.
- Pavel Bořil (Air Bank) nám koupil kafe, děkujeme
- Michal Misař (Carebot) se stal členem advisory boardu pro zdravotnictví v České asociaci umělé inteligence
- Daria Mikhaylovskaya z FEL ČVUT získala prestižní ocenění Generation Google Scholarship: for women in computer science za její práci v oblasti humanoidní robotiky
- Tým studentů z FEL ČVUT zvítězil v Chaos Neurathonu 2023 na téma využití AI v 3D renderingu
Podcasty, videa, přednášky:
- Data Talk #70 s Peterem Fedoročkem a Vojtou Bartošem (Understand Labs) o tom, proč je těžší data vysvětlovat, než v nich nacházet nejsignifikantnější anomálie, kde je ve světě automatizované analytiky přidané hodnota člověka, ale taky jejich cestě od Stories přes Workday až k Understand
- SCRIPTease 077: Marek Vašíček (CTO) a Daniel Petrák (Dev Lead) z FTMO
❓Random trivia
Věděli jste, že první počítačový virus byl více méně neškodný? Jmenoval se Creeper a jednalo se o experiment, jak daleko by se potenciální škodlivý virus v ARPANETu dostal. Uměl napadat pouze počítače DEC PDP-10 s operačním systémem TENEX a jediná neplecha, kterou dělal, bylo tisknutí zprávy: „I'M THE CREEPER : CATCH ME IF YOU CAN.“ Nakazil všech 28 počítačů v síti, se kterými byl kompatibilní.

DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)
- BigHub
Recombee
- Sazka
- Revolt.BI
- Colours of Data
- Keboola
- Livesport
- BizzTreat
- intecs
- Nano Green
- Emark
- Apify
- Datamole
DataSentics
- DNAi
Gen
- MAMA AI
- Python Developer for Conversational AI
- Phrase
Kdyby vás zajímalo, jak v Revolt.BI nabírají dataře, napsali o tom zajímavý článek.
dDd
Starší, ale pořád aktuální, najdete na našem webu.
(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)
Jestli náš newsletter ještě neodebíráte, můžete se k odběru přihlásit tady.
Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!
A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!