k47.cz

twitter RSS
««« »»»

Až se z umění stane jen další aplikace

25. 2. 2021 — k47

Podívejte na to, vyšla mi jedna předpověď. V kontextu vývoje umělé inteligence jsem tu spekuloval, že si není těžké představit že za další tři roky budou generativní algoritmy tak efektivní, že dokážou generovat fotorealistické scény jen z krátkého slovního popisu. To bylo před třemi roky. Teď tu máme tohle. Nesplňuje to kritérium fotorealističnosti, ale jde o první krok směrem k průmyslově produkované nerealitě. V oblasti AI platí jediné: od okamžiku prvních jakž-takž výsledků se k perfektnímu zvládnutí daného úkolu programem dostaneme za pár let. Pak už člověk nemá šanci. Už nikdy nemůže vyprodukovat cokoli lepšího, kvalitnějšího nebo hodnotného. Na posledním kvalifikátoru záleží nejvíce. Jeden aspekt lidského snažení ztratí smysl, stane se z něj jen další aplikace. Klikněte a nechte si vygenerovat nekonečnou plejádu uměleckých děl. Dříve v jejich produkci lidé nacházeli formu vlastní realizace. Už ne. Nikdy více. Tvořit můžou nadále, to jo, jen to nikoho nezajímá. Stroje poskytnou lepší výsledky, přizpůsobené pro vás, nekonečně rychleji. Kdo by se zdržoval s tím, jak se to dělalo postaru?

Jako příklad si vezměte včerejší článek. Když jsem pořádně v ráži, od prvních písmen do poslední úpravy může zabrat hodinu času, přibližně. Koho něco takového bude zajímat, když z plně automatizované tajmlajny, vyjede podobný, ale lepší text na kliknutí, speciálně personalizovaný, aby přesně zabrnkal na nervová vlákna každého čtenáře specificky? Žádný. Nebude mít žádnou hodnotu. A teď jsme AI utopii, kdy nic nemá smysl a všechno lidské snažení je přinejlepším zbytečné hobby, zase o kousek blíž.

Tohle zaměření na realizaci prostřednictvím tvorby, někdy kreativní, nevypadá jako velká ztráta. Přínosy pro většinu vyváží ztrátu smyslu života pár bláznů, žejo. Kreativní destrukce a tak. Problém je jen v tom, že progres AI se nezastaví. Všechno může být a bude vykonáváno stroji mnohem lépe, než by dokázal člověk. Včetně konverzace, mezilidských vztahů, společnosti. Moje vize budoucnosti, blízké budoucnosti mimochodem, je absolutní krize, kdy nikdo (kromě hrstky ultra-miliardářů, kteří všechno vlastní) nemůže už nikdy nic změnit, jeho činy z podstaty nemůžou mít dopad na svět nebo životy kohokoli jiného, nikdo se o vás nezajímá, protože k tomu není důvod, služby (a abstraktním měřítku), které mu můžete poskytnout – empatii, porozumění, blízkost – dostane strojově v mnohem čistší podobě. Bude to atomizovaná doba, plebs proti plebsu, sémantický konec světa, kdy žijeme jako opice v kleci, máme přibližně stejnou moc cokoli na vlastní situaci změnit jako zavření primáti a jediní šťastní se houpu na provazu. Kdy? Kdybych chtěl být provokativní, řekl bych 5 let; kdybych se chtěl držet stébla optimismu, dal bych deset. Možná se budu šeredně mýlit a to by bylo skvělé, ale nechovám žádné naděje o budoucnosti. Lidstvo vyvražděné roboty je vždy ta lepší varianta.

Vtip je v tom, že umělá inteligence nemusí být perfektní, aby dokázala rozvrátit život na planetě a urychlila koncentraci bohatství a absolutní moci do rukou několika giga-nenasytných kapitalistů. Zatím to nevypadá dramaticky, ale kráčíme tím směrem.

GPT-3 dokáže generovat koherentní texty. Jiné sítě generují kód programů, fotorealistické lidské tváře, kočky, waifu, inzeráty ubytovánímnoho dalšího. Vypadá to neškodně a možná i trochu roztomile. Rozhodně pokud nic z toho není vaše živobytí. Díte udělalo první krůčky, jak rozkošné. Ale pak z něj vyroste genocidní diktátor a situace se změnila. Z krůčků se stal rytmus pochodujících holin.

Za pět let jsme se od robotů, kteří stěží udělají pár kroků, aniž by nespadli, k k tomuhle. Pět let a nikdy se není možné vrátit zpátky.

GPT-3 bot se na redditu celkem úspěšně vydával za člověka, objevují se nástroje pro efektivní konstrukci falešné reality, deep fake nudesvirtuální meetingy. Ten poslední je perfektní ve své dvojakosti – prezentované přínosy vs. skutečné možnosti, které to nabízí.

Jde o technologii pro video-hovory. Na jedné straně software z obrazu vyextrahuje klíčové informace o tváři volajícího a posílá jen ty na druhou stranu. V porovnání s proudem video dat jde o zanedbatelné množství informací. Software na druhé straně z těchto dat syntetizuje vaší tvář, jak by vypadala v daný okamžik. Na druhé straně linky není váš obraz, ale fotorealistická syntéza lidské tváře, která vypadá skoro přesně jako vy. (Drobný rozdíl, zajímavý jen filosoficky ve stylu Don Quixote vs. Pierre Menard.) Počin je prezentován jako způsob, jak ušetřit datový tok, což je v podstatě trivialita. Nahlas nevyřčený rub spočívá v tom, že se nemusí mapovat jen na vaši tvář, ale jakoukoli jinou. Stejně tak podobný mechanismus může mapovat jeden hlas na jiný. V takové situaci máme perfektní nástroj manipulace a vytváření falešné reality. Kdokoli může prohlásit cokoli, máme video, které to potvrzuje. Ale stejně tak kdokoli může cokoli popřít. Video bylo podvržené, jde o automatickou manipulaci. Pravda se rozloží v nejistotě, zmatku a informačním přetížení. Ruští propagandisté ví už pěknou řádku let, že tohle zabírá. Příliš informačního šumu nevede lidi k hledání pravdy, ale zavržení konceptu pravdy jako takového. A tady mají efektivní nástroj, zabalený jako triviální pomůcka pro video-hovory. Stavíme zeď a kopeme jámu, cihlu za cihlou, lopatu za lopatou.

O tom, že se něco děje, svědčí fakt, že informační dělníci googlu chtějí založit odbory.

píše k47 & hosté, ascii@k47.cz