Newsletter

#52 Elon žaluje OpenAI a OpenAI žaluje na Elona

Ahoj,

tenhle týden tady máme pořádné drama mezi OpenAI a Elonem Muskem, ale taky sesazení GPT-4 z trůnu. Kromě toho trochu Skynetu, hackování LLMs pomocí ASCII artu nebo průlom v jaderné fúzi. A Jirka napsal long-read report z HPE Data Science & AI workshop, tak čtěte až do konce! Je tady Data Talk newsletter.

Data Talk newsletter nyní odebírá 1004 lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.(Nechcete jej dostávat? Omlouváme se! Nechceme spamovat, chceme dělat boží obsah, TADY se můžete odhlásit! )

Jestli máte nějaké memes nebo vtipné obrázky, pošlete je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Pak:

📰 Novinky, linky a drby

Elon Musk žaluje OpenAI kvůli tomu, že se odchýlili od svých původních neziskových záměrů

Když bylo OpenAI v roce 2015 založeno, Elon Musk byl u toho. V roce 2018 však společnosti opustil kvůli neshodám se Samem Altmanem. Teď chce žalobouOpenAI donutit, aby se vrátilo ke své původní misi a vypustili své modely do světa jako open-source.

Jádrem žaloby jsou tři tvrzení: 1) GPT-4 dosahuje úrovně AGI, 2) OpenAI se stalo dceřinou společností Microsoftu a 3) OpenAI se vykašlalo na svoji misi vytvořit AGI ve prospěch lidstva. První odporuje obecně přijímané definici AGI, druhé je z právního hlediska nesmysl, ale o tom třetím už se dá minimálně polemizovat.

OpenAI Muskova tvrzení odmítá a přináší zajímavé dokumenty - třeba emaily, ve kterých Elon Musk v rané fázi vývoje říká, že je třeba sehnat investici ve výši minimálně $1B dolarů a také že Tesla by měla koupit OpenAI, aby společně mohli lépe konkurovat Googlu. Nakonec právě to, že se mu OpenAI touto cestou nepodařilo převzít, mělo vést k jeho odchodu.

Nelze si nevzpomenout na někdejší prohlášení Ilyi Sutskevera, jednoho ze spoluzakladatelů OpenAI, který řekl, že ono „Open“ v názvu OpenAI znamená, že benefitovat z jejich umělé inteligence bude celé lidstvo, nikoliv že budou zveřejňovat své modely jako open-source. Elon Musk na konto toho prohlásil, že žalobu stáhne, pokud se OpenAI přejmenuje na ClosedAI.

Anthropic vydal Claude 3, který drtí GPT-4 na všech frontách

Ano, čtete správně. Nezpochybnitelná dominance GPT-4 je u konce. Anthropic vydal hned tři multimodální modely a nejsilnější z nich, Opus, si GPT-4 hravě namaže na chleba. Prostřední Sonnet je výsledky hodně podobný Gemini 1.0 Ultra. Nejmenší Haiku je nejvíc úsporný, ale pořád lepší než Gemini 1.0 Pro nebo GPT-3.5.

Kontextové okno má 200K tokenů, ale měl by do nějaké míry zvládat pracovat až s 1M tokenů. Co se týče ceny, Opus stojí $15/1M tokenů, pro srovnání GPT-4 Turbo stojí $10/1M tokenů.

Jako tradičně model zatím není napřímo dostupný v EU a budeme si na nějak pár dní až týdnů muset počkat, ale pokud už se nemůžete dočkat, je přístupný přes placenou verzi Poe.

Další novinky:

Články a papery:

Data gossip:

Podcasty, videa, přednášky:

Longread:HPE představila svoji AI platformu, Romportl temnou vizi budoucnosti

Minulý týden uspořádalo HPE v Prazi skvělou akci o Data Science & AI. Data Talk byl partnerem a proto vám přinášíme exkluzivní report.

Varování na úvod


Celý den vykopl Honza Romportl s tématem AI v Česku. Více než o Česku mluvil o revoluci, kterou nové AI technologie znamenají pro svět, pracovní trh a společnost, ale zároveň konkurenceschopnost Evropy. A nebyl to vůbec optimistický výhled, spíš důrazné a hlasité varování před deep-fakes, velkou vlnou propouštění a nepřipraveností Evropy na budoucnost.

Když se totiž podíváme na inovace v oblasti Gen AI, Evropa brutálně zaostává. V nejdůležitější oblastí - vývoji samotných foundation modelů (česky se to podle Wiki řekne “základní modely”)  má Evropa nyní v podstatě dva projekty - francouzský Mistral a německý Aleph Alpha (který mimochodem využívá právě HPE železo i platformu na trénování NLP modelů).

V čem jsme, zejména u nás v CEE regionu, relativně silní je druhá kategorie - tradiční machine learning. A právě Honzův pohled na to, že disciplína strojového učení a “klasické” AI implementace má díky příchodu Gen AI velmi krátkou trvanlivost, byl jedním z nejdepresivnějších insightů. Pokud patříte stejně jako většina účastníků mezi ML profesionály, máte dle výhledu jen pár let než tento trh udělá “nová AI” zastaralým.

Poslední kategorie jsou AI aplikace a produkty. Ta globálně poroste, část zisků a přidané hodnoty však vždy spolkne infrastruktura - tzn. základní modely.

Samotný konec přednášky pak patřil naději, že lidi budou stále potřeba, protože vzniknou nová pracovní místa, typicky v oblasti péče o stárnoucí populaci.

Umělá inteligence, ale zodpovědně!

Na Romportla navázal Tjerk Houweling, AI solution architect z HPE. Ten uvedl téma potřeby QA v AI a začal nechvalně známým příkladem Apple Card. Tento projekt Apple a Goldman Sachs krátce po vydání schytal kritiku a obžalobu z diskriminatorního chování. Američtí spotřebitelé si stěžovali, že je AI systém skóruje na základě pohlaví, reportovali totiž, že ženy dostávají menší limit pro útratu než jejich mužské protějšky. Úřady nakonec oznámily, že k žádné diskriminaci nedošlo, že systém funguje správně a spravedlivě. Ale obhájit a prokázat spravedlivost systému trvalo a podle některých zdrojů vedlo ke ztrátám v řádech stovek milionů dolarů, miliard pokud započítáme újmu na pověsti obou firem a samotného produktu.


Tjerk proto mluvil o tom, jak zařídit, aby vaše AI splňovala stále přísnější kritéria v oblasti bezpečnosti, lidských práv. Aby byl jakýkoliv AI systém zodpovědný (Responsible AI), je potřeba splňovat tři podmínky:
1)musí být reprodukovatelný, tzn. mít možnost ukázat na jakých datech byl systém trénován, za pomocí jakého kódu,
2) vysvětlitelný, tzn. s možností ukázat, jak má nastavené váhy a jak moc halucinuje,
3) a taky odpovědný, což znamená potřebu rozhodnutí člověka a jasnou odpovědnost ve firmě za to, když model/systém dělá neplechu


Potřebu řídit kvalitu pak dle Tjerka umocní ještě legislativa, typicky EU AI Act.


Tjerk měl také můj nejoblíbenější slide dne, kde přirovnal současný stav ve vývoji AI k vývoji softwaru v 80. letech - chybí nástroje na QA, debugging, monitoring. V tuhle chvíli ještě většina firem staví MLops stack a mezitím tady přilétlo téma LLMops. To znamená zajimavé časy a spoustu příležitostí pro nové produkty. Třeba ty od HPE. :)

HPE Machine Learning Platform 


Pak přišla hlavní část programu, kterou měl na starost Christophe Menichetti, také HPE AI solution Architect, který si získal celé publikum svou energií, francouzským šarmem, ale hlavně zkušenostmi a vhledem do reality současné data science. Christophe měl na starost představení HPE platformy pro datové vědce. Ta nevznikla na zelené louce, naopak je výsledkem akvizic HPE z posledních let. V roce 2021 totiž HPE akvírovala open-source nástroj Determined AI.

Na základě Determined vznikl tzv. HPE Machine Learning Development Environment (MLDE) - prostředí pro data scientisty, kde si můžete pouštět Jupyter notebooky, modely vyvíjet, benchmarkovat, optimalizovat. V roce 2022 pak HPE začalo nabízet produkt, který integruje jejich nabídku železa s MLDE a dalšími vychytávkami - HPE Machine Learning Development System. A právě pomocí něj trénují své multimodální, multijazykové modely například v již zmiňovaném Aleph Alpha.

Tím ale náš příběh nekončí. Na začátku loňského roku totiž HPE akvírovalo další populární open-source projekt, Pachyderm. Pachyderm je mnohem víc na data engineering straně celého AI a je vlastně první částí celého MLops, místem pro řešení data processingu a stavění pipeline. ETL, data lineage atp.

K Pachyderm přidejte SLAčka a všechno ostatní, co potřebuje zákazník jako Lockheed Martin, aby pustil software k sobě do produkce, a máte HPE Machine Learning Data Management (MLDM). Zároveň je skvělé, že oba projekty, Pachyderm (MLDM) i Determined.AI (MLDE), nejsou jen v licencované podobě, ale zůstavají k dispozici komunitě i ve formě open-source!

A pokud se už ve zkratkách ztrácíte, nevěšte hlavu,  pro vás obrázek z Githubu:

Na něm jde také vidět, že deployment může následně probíhat v libovolném Kubernetes prostředí. Většina slidů zmiňovala konkrétně KServe. Právě na poslední části celého cyklu - deployment a monitoring, v tuto chvíli HPE pracuje (a já jsem zvědav na jméno). Je to logický další krok k tomu nabízet kompletní end-to-end enterprise platformu.

Když hands-on znamená hands-on!

Po obědě následovala praktická část, kde si účastníci mohli zmiňované tooly, hlavně MLDE (=trénovací, data science část postavenou na Determined AI) vyzkoušet na vlastním notebooku.

A přestože o datech a AI umím možná mluvit a psát, mé reálné praktické schopnosti skončily u *SELECT. Proto jsem raději  před workshopovou částí zmizel po anglicku. Kdo však zůstal byl Tomáš Trnka, a právě jeho hodnocením odpolední části bych chtěl svůj mini-report uzavřít. Je za mě totiž tou největší pochvalou organizátorům.

Pokud vás HPE AI platforma zaujala a/nebo byste nechtěli přijít o pozvánku na příští HPE event, doporučuju sledovat globální HPE na LinkedInu, CZ/SK newsletter Novinky z HPE nebo přímo HPE Blog, Czechia & Slovakia.

❓Random trivia

Věděli jste, že Slováci vyráběli létající auta? Společnost Aeromobil od roku 1990 vyvíjela prototypy létajících aut poháněných tlačnou vrtulí v zadní části karoserie se zatažitelným nosným křídlem. Něco jako létající auto Fantomase. Během více než 30 let vytvořili 4 prototypy, přičemž ten poslední už vypadal hodně nadějně.

Bohužel však minulý rok ukončila svoji činnost. Nesehnala investory, kteří by zaplatili start sériové výroby, a to i přes to, že měli stovky předobjednávek a docela působivou reklamu.


DATA JOBS
(taháme ze stránek partnerů, Startupjobs, od Elišky z Kebooly, z newsletteru prg.aiatd.)

Starší, ale pořád aktuální, najdete na našem webu.

(Hledá vaše firma někoho na pozici spojenou s daty? Pošlete nám odkaz na inzerát na michal@fenekpr.cz a my ho rádi zveřejníme)

Ještě náš newsletter ještě neodebíráte?

Data Talk není pay to play!
Pokud chcete sdílet svoje know-how, obsah od vás z firmy, napište nám!

A pokud vás naše práce opravdu baví, a náš obsah vám dává opravdovou hodnotu, pošlete nám opravdové peníze, na kafe!