Newsletter

#50 Vygenerovanému mamutovi na kly nehleď

Ahoj,

tenhle týden dostanete:

- pozvánku na top workshop

- revoluci v generování videa

- update kontextového okna jazykového modelu na 1 milion tokenů

- další release Mistralu (oznámený zase někde v komentáři)

- nový hardware, na kterém open-source modely sviští nevídanou rychlostí

- dva články o optimalizaci

- a hromadu dalších věcí jako vždycky.

Je tady Data Talk newsletter.

Data Talk newsletter nyní odebírá 980 lidí, které zajímají datové technologie a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit!)

Data Science & AI Workshop with HPE už je za rohem!

Už příští čtvrtek 29. února proběhne workshop HPE určený pro odborníky z oblasti Data Science, Machine Learning a Deep Learning, který se zaměří na téma umělé inteligence.

Začínáme už v 9:00 v Business Lounge v 7. patře budovy Visionary na Praze 7, Plynární 10.

Neočekávejte korporátní prezentace, akce je spíše prakticky laděná. Součástí workshopu bude nejen ukázka příslušných nástrojů a prostředí, ale možnost si je vyzkoušet (notebooky s sebou!).

Těšit se můžete na úvodní slovo Jana Romportla o stavu AI v Česku, příspěvek Tjerka Houwelinga ostavění AI enterprise řešení, diskuzi o customer AI, a live dema a workshopy s Christophem Menichettim

Předpokládaný čas ukončení je v 15:00. Většina přednášek bude v angličtině.

📅 Kalendář datových akcí

Příští týden:

Pak:

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz

📰 Novinky, linky a drby

OpenAI vydali generativní video model Sora

Tenhle AI difúzní model je schopen generovat realistické a konzistentní video až o délce 60 sekund. Jako vstup mu poslouží buď textový prompt, nebo obrázek.

Ač jsou jeho výstupy více než působivé, filmaři a animátoři se o svoji práci zatím bát nemusí. Vzhledem k tomu, že tyto modely nechápou video jako set objektů, ze kterých je scéna složena, je velmi obtížné dělat ve vygenerovaném videu jakékoliv editace scény nebo detailů.

Sora ještě není přístupná veřejnosti, zatím byla poskytnuta pouze red teamerům a vybraným tvůrcům k testování. Obavy ze zneužití takto realistického generátoru videa jsou bezpochyby na místě.

Google Gemini dostal update 1.5

Tenhle masivní update přináší revoluční kontextové okno o velikosti 1 milion tokenů (pro srovnání GPT-4 Turbo - 128K tokenů, dosud největší Claude 2.1 - 200K tokenů). V praxi to znamená, že dokáže „v paměti” udržet až 700 000 slov (v angličtině, v češtině to bude o něco míň), 30 000 řádků kódu, 11 hodin audia, nebo 1 hodinu videa. Veřejně dostupná verze však bude ještě nějakou dobu pracovat „pouze” s 128K tokenů, zpřístupnění 1M verze bychom však měli čekat v brzké budoucnosti.

Došlo také velkému nárustu kvality výstupů, Gemini Pro 1.5 je na srovnatelné úrovni jako Gemini Ultra 1.0. Pravděpodobným důvodem je mimo jiné přechod na novou Mixture-of-Experts architekturu.

Existuje i research verze, která podporuje až 10 milionů tokenů, o její budoucí dostupnosti se však Google nezmiňuje. Pokud bych si měl vsadit, řekl bych, že to je proto, že tahle verze má naprosto nerentabilní spotřebu výpočetní síly.

Pokud vás zajímá dokumentace ke Gemini 1.5 i s benchmarky, najde ji tady.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

❓Random trivia

Věděli jste, že QWERTY klávesnice byla původně nadesignovaná tak, aby zpomalila psaní? Bylo to proto, že pokud jste na psacím stroji rychle zmáčkli dvě klávesy vedle sebe, zasekl se. Proto má QWERTY nejběžnější dvojice kláves v angličtině co nejdál od sebe. Paradoxně to způsobuje to, že česky se píše na QWERTY o něco rychleji než anglicky.

Mimochodem, pokud hledáte rozložení klávesnice, které psaní naopak co nejvíc zrychlí, zkuste rozložení Dvorak.


DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)

Starší, ale pořád aktuální, najdete na našem webu.

(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)

Ještě náš newsletter ještě neodebíráte?

Data Talk není pay to play, pokud chcete sdílet svoje know-how nebo nám pomoci jinak, napište nám!

A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!