Jaké budou trendy v roce 2024 ve světě: Umělá inteligence nejenom v médiích

Organizátoři známého veletrhu IBC v Amsterdamu vydali přehled o nejdůležitějších směrech ve světě médií a predikci hlavních událostí roku 2024, na které bude v mediálním světě upřena pozornost. Rok 2024 bude rokem zájmu o ženské sporty, Olympijské hry a umělou inteligenci. Na ni a vysvětlení, jak vlastně pracuje se zaměří tento článek.

Rok 2023 byl rušný rok, a bez přehánění média, vysílání a technologie patřila mezi nejrušnější sektory ve všech oblastech. Témata, jako je cloud, AI, 5G, VR/AR/XR, metaverse, hraní her a edge computing, byla v popředí zájmu všech předváděcích sálů a výstavních síní, včetně ověřování koncepcí z projektů IBC Accelerator Media Innovation Program, prosazující spolupráci napříč odvětvími a průkopnické nové případy užití. O technologiích na zářijovém IBC jsme podrobněji psali v článku

Kam směřuje vývoj mediální zábavy? Technické novinky z IBC 2023 v Amsterdamu

včetně odkazů na technické přednášky o většině nových technologií. Zastavme se u ještě již vícekrát zmiňované metaverzi, která se má stát podle představ ITU jednou z budoucích možností technologického pokroku.

Loňské trendy

I když existuje několik verzí metaverze, rok 2023 jistě zaznamenal určitý konkrétní vývoj jak z pozitivního, tak i negativního pohledu. Kritici poukazují na nedostatek využití, přičemž Meta Marka Zuckerberga viděla, že její pobočka pro virtuální a rozšířenou realitu Reality Labs od roku 2022 prodělala ohromujících 21 miliard dolarů. Přišla však s verzí Meta Okulus 3, která pomocí náhlavní soupravy umožňuje kromě hraní her projekci připojeného počítače do prostoru rozšířené reality, což znamená, že si mohu vytvářet svůj vlastní počítačem přenesený prostor do reálného prostředí, ve kterém se nacházím. Současně velmi očekávaná náhlavní souprava Apple Vision Pro Augmented Reality Headset byla oznámena již v polovině roku 2023 a do prodeje se má dostat na začátku tohoto roku.

Není možné ani pominout cloud a edge-computing, které se po mnoha letech přijímání a odmítání nyní stal akceptovaným základem mediálního a vysílacího průmyslu, což je skutečnost, která se v průběhu roku 2023 stala zcela zřejmou. Jak přehlídky IBC2023 i NAB tuto změnu patřičně zdůraznily. Ekonomika cloudu figurovala v NAB na začátku roku ve velkém, zatímco rostoucí strategická hodnota přesunu lokálních pracovních zátěží do cloudu byla klíčovým tématem na IBC2023.

Umělá inteligence na postupu

Pokud někdy existoval rok umělé inteligence, byl to rok 2023, kdy tato technologie převzala konverzaci téměř na všech úrovních mediálního a technologického průmyslu. Je však zajímavé, že tam, kde byly předchozí roky všechny o příslibech a potenciálu (a také o humbuku) umělé inteligence (UI), rok 2023 zaznamenal mnohem lidštější reakci na tento odvážný nový svět.

Televizor se mění na inteligentní centrum chytré domácnosti, připojených kamer, platformu elektronického obchodu a interaktivní a nelineární sledování zábavy (zdroj: CES 2024, CTO)

Už i lednové prezentace na CES v Las Vegas ukázaly, jak umělá inteligence, udržitelnost a inkluzivní technický design posouvají technologie zítřka, jako je mobilita, digitální zdraví, obsah, hry a zemědělsko-potravinářské technologie. Podívejte se, kde všude se dá umělá inteligence použít v našem článku o CES 2024

Skončil možná zlomový CES 2024 Poukázal na UI a další vylepšení obrazu a zvuku u TV

Co je AI (Artficial Intelligence / česky UI umělá inteligence)

Umělá inteligence (AI/UI) je technologie, která napodobuje lidskou inteligenci k provádění různých činností. Využívá strojové učení (ML), hluboké učení (DL) a neuronové sítě k dosažení vyšších úrovní. Byla kategorizována jako úzká, obecná a super umělá inteligence. Základní, první kategorie cílí na provedení konkrétního úkolu. Příkladem mohou být virtuální asistenti typu Siri u Applu, překladače jazyků nebo upkonverze z nižšího na vyšší rozlišení u televizorů, kterou používá například Samsung pro dopočítání a zostření různých rozhraní nebo přizpůsobení pleťové barvy na základě datového souboru nejrůznějších obličejů.

Druhá kategorie obecné UI je dalším krokem rozvoje a je schopná provádět jakoukoli intelektuální úlohu jako lidská bytost pomocí autonomních programů (robotů). Může napodobovat intelektuální chování se schopností učit se a řešit různé problémy. Třetí kategorií je Super UI, která bude přesahovat lidskou inteligenci a schopnosti ať je to matematika, věda nebo medicína. Prozatím je to vzdálená realita a její potenciál se teprve musí využít.

Zatímco první kategorie UI (úzká umělá inteligence) se soustředí na jeden úkol a je omezena omezeními, aby nepřekročila tento rámec, takže není schopna řešit neznámé problémy, obecná umělá inteligence však dokáže provádět širokou škálu úkolů pomocí lidských kognitivních schopností. Všechny kategorie UI vycházejí ze stejného základu: strojového učení, zpracování přirozeného jazyka, hlubokého učení a umělých neuronových sítí.

Dnešní stav vývoje UI, generativní umělá inteligence (GAI) je podmnožinou umělé inteligence, která se zaměřuje na vytváření nebo generování nového obsahu, jako jsou obrázky, text, hudba nebo videa, na základě vzorů a příkladů ze stávajících dat. Zahrnuje trénovací algoritmy pro pochopení a analýzu velké datové sady a následné použití těchto znalostí k vytvoření nového, originálního obsahu podobného stylu nebo struktuře jako trénovací data.

Nástroje generativní umělé inteligence

Neexistuje jediný postup k vytvoření nového obsahu. Podle cílového zaměření jsou použity různé techniky (GAN, VAN) a jejich varianty pro vytvoření generativních modelů. Tyto modely jsou trénovány na masivních souborech dat, aby porozuměly vzorcům a základním strukturám. Modely se učí vytvářet nové instance, které zrcadlí trénovací data tím, že zachycují statistické rozložení vstupních dat během trénovací fáze.

Textové generativní modely mohou vytvářet koherentní a kontextově relevantní text s použitím rekurentních neuronových sítí (RNNs), což umožňuje vznik aplikací, jako jsou chatboti, virtuální asistenti, jazykové překlady a generování obsahu pro psaná média.

Ilustrační obrázek (zdroj: simplylearn.com)

Modely generování textu pomáhají při generování personalizovaných doporučení a cílených reklam. Na základě analýzy uživatelských preferencí a chování tyto modely generují textová doporučení, která jsou relevantní a poutavá. I když nejde o generování textu, generativní modely mohou převádět psaný text na přirozeně znějící řeč. Generováním zvukových vln na základě textového vstupu umožňují tyto modely aplikace, jako jsou hlasoví asistenti, audioknihy a hlasové komentáře.

Generativní umělá inteligence dokáže syntetizovat videa změnou a kombinováním existujících videozáznamů. I když má tato technologie kreativní potenciál, vyvolává také etické obavy týkající se zneužití syntetických médií a hluboce falešných videí.

Generativní umělá inteligence je výkonná technologie, která umožňuje generování různorodého a kontextově relevantního obsahu, včetně obrázků, textu a hudby. Přichází však také s výzvami a obavami, včetně etických úvah, nedostatečné kontroly nad výstupy, potenciálních zkreslení, požadavků na zdroje a problémů s kvalitou.

V umělé inteligenci nyní trh ovládá vědu

Jak bylo řečeno výše pro vytvoření každého cíle je nutno použít různých technik a modelů, a proto vznikly i nejrůznější nástroje. Jejich už značný počet od různých společností včetně nástrojů pro editaci videa (Rephrase.ai nebo Type Studio) nebo vytváření vysoce kvalitní hlasového komentáře pro videa, prezentace a potřeby převodu textu na řeč (Murf.ai). Překlady a převod řeči na text s vytvářením titulků umí i český beey.io společnosti Newton Technologies a.s.

Dnes se za nejlepší považuje společností OpenAI vyvinutý nástroj generativní UI GPT-4, vynalézavější a přesnější a zároveň bezpečnější a stabilnější než předchozí generace, avšak může poskytovat chybné odpovědi a může být extrémně neobjektivní. Nejznámějším je bezplatný ChatGPT stejné společnosti určený pro široké publikum a vydaný již v roce 2022. Jeho zásadní nevýhodou je, že nemá přístup k datům a současným událostem po září 2021.

Rok po vydání ChatGPT společností OpenAI je jasné, že umělá inteligence byla velkým příběhem roku 2023 a bude velkým příběhem i na příští rok a pak ještě další. Samotný ChatGPT udělal mnoho věcí, včetně zvýšení hlavního proudu povědomí o samotné AI, ale jeho největší dopad byl pravděpodobně ve vytvoření trhu, v podstatě od nuly, pro generativní nástroje AI.

ChatGPT nebyl technický úspěch, ale skok v použitelnosti, přístupnosti a uživatelské zkušenosti. Ukázalo se, jako žádný jiný nástroj v historii, že umělá inteligence již není funkcí zabudovanou do větších softwarových produktů, ale celým průmyslem. Na druhé straně to odstartovalo zlatou horečku, jakou jsme neviděli od aplikací pro chytré telefony. Pro OpenAI se tak tak naplňuje ambiciózní vize, prodávat specificky zaměřené technologické nástroje přímo spotřebitelům. Doposud to byla věda, nyní se vývoj AI řídí už pravidly trhu. Vědecký vývoj zůstává v dalších oblastech neuronových sítí a kvantových počítačů směrem ke třetí kategorii UI.

Mnoho otázek a legislativní výhled

Bojištěm pro rok 2024 bude ale místo, kde se trh střetává s regulačními orgány, přičemž klíčová legislativa v GDPR a zákon o AI prochází EU a je pravděpodobným měřítkem pro ochranu nebo omezení rizik zneužití AI na celém světě.

Používání umělé inteligence k vytváření falešného nebo hluboce falešného obsahu jako propagandy by rozhodně mělo být regulováno. Mezi tím je však ještě šedá zóna – UI sloužící k vytvoření něčeho ve stylu práce konkrétního člověka. Kdy je to už plagiát? Dobrá žurnalistika a dobrý živý obsah jsou poháněny kreativitou, je důležité, aby vlády pečlivě zvážily, jak chránit práci kreativců ve světě s umělou inteligencí, stejně jako by to udělaly ve světě bez ní.

Ačkoli se legislativa nyní v mnoha zemích připravuje, je to právě navrhovaný zákon EU o UI – označovaný jako „první komplexní zákon o AI na světě“ – který dosud vytvářel hlavní podíl na diskusích, zda „Zákon o UI“ nebude brzdou technologického vývoje a inovací. Koncem minulého roku bylo po konzultacích dosaženo dohody a v současné době je návrh „AI ACT“ předkládán Parlamentu a Komisi.

Zákon EU o AI tak, jak to dosud neučinily žádné jiné navrhované právní předpisy, klade důraz na etický a udržitelný přístup k AI bez ohledu na odvětví. Prioritou je „zajistit, aby systémy umělé inteligence používané v EU byly bezpečné, transparentní, sledovatelné, nediskriminační a šetrné k životnímu prostředí. Na všechny systémy by měli dohlížet spíše lidé než automatizace, aby se předešlo škodlivým výsledkům.“

Zákon navrhuje dosáhnout této vize umělé inteligence rozdělením systémů do čtyř hlavních skupin. Ty, které jsou považovány za „nepřijatelné riziko“ – včetně systémů biometrické identifikace v reálném čase a na dálku, jako je rozpoznávání obličeje, nebo těch, které zahrnují „kognitivně behaviorální manipulaci lidí nebo specifických zranitelných skupin“ – budou (až na několik možných výjimek) zakázány přímo.

Druhá úroveň, „vysoké riziko“, bude zahrnovat posouzení takových systémů před tím, než budou zpřístupněny, a v určitých oblastech činnosti budou muset být zaregistrovány v databázi EU.

Bude také existovat úroveň pro systémy s „omezeným rizikem“, podléhajícím „minimálním požadavkům na transparentnost“, které uživatelům umožní činit informovaná rozhodnutí. Pro zákazníky médií budou mít největší bezprostřední význam pravděpodobně opatření týkající se generativní umělé inteligence. Zde bude navrhovaná legislativa vyžadovat zveřejnění, že obsah byl vytvořen AI, a bude vyžadovat, aby modelování bylo navrženo tak, aby se zabránilo generování nelegálního obsahu.

Mimo EU jsou to ještě USA, kde v současnosti probíhá největší aktivita kolem regulace AI. Na konci října prezident Biden vydal dalekosáhlý výkonný příkaz, který – kromě jiných opatření – „stanovuje nové standardy pro bezpečnost a zabezpečení umělé inteligence“ a zároveň podporuje „inovaci a hospodářskou soutěž“.

Co si o využití AI myslí technologické firmy?

IBC365 požádala různorodý výběr prodejců a poskytovatelů služeb o jejich názory na regulaci AI, a přestože panoval konsensus, že tato výkonná nová technologie musí být účinně řízena, existovaly také obavy z potenciálního dopadu špatně navržené legislativy.

Rick Allen je generálním ředitelem end-to-end vývojáře video platformy ViewLift. „Příslib umělé inteligence a rizika z neuvážené regulace jsou dvě strany téže mince,“ řekl. „AI je požehnáním, když urychluje úkol a/nebo komplexněji poskytuje odpovědi.“

Ve světě streamování vede personalizace obsahu k delší době sledování a spokojenějšímu spotřebiteli. Umělá inteligence může být velmi užitečná při poskytování přesnější personalizace, ale může se dostat do rozporu se zákony na ochranu soukromí, které mají chránit před zneužitím dat, aniž by byly prozrazeny spotřebiteli nebo aby pro něj měly hodnotu. K určení hranic pro tyto akce bude zapotřebí další právní a soudní přezkum

MediaKind, výrobce profesionálních video kodérů a dekodérů, již začal začleňovat AI do svých produktových řad, včetně aplikace AI ke zlepšení videa a použití generativní AI k vytváření detailů obsahu během konverze obrazu na vyšší rozlišení. Kromě obav ohledně ověřování obsahu Tony Jones zdůraznil potřebu opatření na ochranu kreativního a duševního vlastnictví.

Navzdory nepochybným úskalím autenticity a vlastnictví sdílí Jones nadšení mnohých ze schopnosti generativní umělé inteligence vytvářet nový obsah, který by jinak mohl být neúměrně drahý, včetně komplexnějších titulků, překladatelských služeb a popisu specifických titulků pro sluchově postižené. „Existuje mnoho potenciálních příležitostí, kde může GAI něco změnit, a myslím si, že budeme i nadále překvapeni novými schopnostmi, které nám v budoucnu pomůže vyřešit,“ řekl Jones.

„Prostřednictvím umělé inteligence zabere kalibrace potřebná pro virtuální umístění jen několik okamžiků, nikoli hodiny,“ řekla Carol Bettencourt, podle které se společnost Chyron zaměřuje na „vývoj umělé inteligence, která pomáhá technikům, operátorům a návrhářům dělat více, aby mohli sdílet příběhy, na kterých záleží.“ Ve společnosti Chyron se dívají na každý aspekt produktového plánu, zejména na časově nejnáročnější nebo opakující se úkoly, a ptají se: ‚Je to něco, co by umělá inteligence mohla nebo měla dělat?‘“

Požehnání nebo prokletí?

Z technického hlediska mnoho společností, které tyto systémy umělé inteligence vytvářejí, nemá úplnou kontrolu nad tím, co umělá inteligence nutně dělá za některých okolností. „Povahou umělé inteligence obecně je, že určitými způsoby dělá věci sama pro sebe; prostě do ní vložíte spoustu dat a ona se z těchto dat poučí a pak se rozhodne, co s nimi udělá. Je to tedy zajímavý inflexní bod, ve kterém se nacházíme, protože existuje obrovské množství schopností a funkcí, které každý chce a které budou přínosem pro mnoho různých průmyslových odvětví po celém světě“ říká Jason Perr CTO ve společnosti Perifery.

Vzhledem k potenciálně seismickým volbám na příští rok v USA, Německu a jinde je nezbytností zavést účinné kontroly, aby umělá inteligence zastavila šíření dezinformací, které už samy o sobě ve věku sociálních sítí dostaly nový děsivý závan života. Nezbývá než doufat, že zákonodárci berou na vědomí priority vyjádřené kreativci a těmi v jiných klíčových odvětvích, protože důsledky neúčinných zákonů jsou předmětem těch nejčernějších představ.

Třicáté třetí OH 2024

Poté, co se poslední letní hry díky pandemii odehrály v osamocení, bychom se měli těšit na atmosféru olympiády na evropské půdě, která se bude konat od 26. července do11. srpna 2024. Nejikoničtější místa a pamětihodnosti Paříže poslouží jako jeviště XXXIII. Olympijských her. Francouzské úřady však budou v pohotovosti kvůli bezpečnostním obavám v hlavním městě.

Olympijské hry jsou vždy příležitostí pro uvedení nových technologií. OBS, hostitel vysílání, plánuje vyprodukovat více hodin než kdy předtím – asi 11 000 – včetně pokrytí více zaměřeného na sportovce, zákulisních materiálů, před a po soutěži.

OBS také poprvé nasadí filmové objektivy s mělčí hloubkou ostrosti, která pomůže zprostředkovat emoce sportovců. Zvýší využití dat, včetně počtu systémů přehrávání více kamer a také dynamické grafiky, jako jsou živá biometrická data a překryvy rozšířené reality (AR).

Mapa olympijských soutěží a přenosových míst (zdroj: paris2024.org)

Cloudové nástroje umožňující distribuci živého signálu a vzdálenou produkci umožní OBS dosáhnout „více za méně“. Budou použity 5G sítě s využitím satelitů Starlink. Cloud nabídne provozovatelům vysílání „chytřejší, agilnější a vysoce efektivní řešení“ a zároveň sníží nároky na fyzický prostor a energii v místech konání a v Mezinárodním vysílacím centru. V důsledku toho může Paříž 2024 těžit ze značných úspor nákladů a uhlíku, tvrdí MOV.

Jsou obavy z umělé inteligence i u nás na místě?

A vraťme se ještě k UI na CES 2024. Z výzkumu, který provedla CTO (Asociace spotřební technologie) mezi americkými spotřebiteli vyplynulo, že největší obavy mají Američané o soukromí (65 %), desinformace (63 %), bezpečnost (60 %) a ze ztráty zaměstnání (59 %) a 74 % že federální vláda by měla být zodpovědná za regulaci bezpečnostních opatření okolo umělé inteligence.

Poznámky

Zkratka UI v tomto článku znamená vždy jen „Umělou Inteligenci“ v souladu z oficiálním českým překladem dokumentů EU a nevyjadřuje její obvyklé použití v technické mluvě „Uživatelské rozhraní“ (User Interface). Uvítáme názor čtenářů, zda používat anglickou AI nebo českou zkratku UI.
Odstavce o Umělé inteligenci vycházely z článku Artificial Intelligence Tutorial for Beginners, který tak může čtenářům dát mnohem širší a hlubší pohled na otázky okolo UI. Z tohoto cyklu je i úvodní obrázek.

Štítky