Tyto webové stránky používají soubory cookies, které nám pomáhají zlepšovat naše služby, personalizovat reklamy a analyzovat návštěvnost. Používáním našich stránek s tímto souhlasíte.
Více informací
DOK.REVUE

Jediný český časopis o dokumentu

Umělý hlas, cizí tvář. Deepfake a dokumentární filmVítejte v Čečensku

Blog

Umělý hlas, cizí tvář. Deepfake a dokumentární film

2. 9. 2021 / AUTOR: Martin Šrajer

Jak počítačově generovaný obraz a zvuk mění hranice mezi reálným a virtuálním? A jak je tomu u současných dokumentů?

Naše životy jsou čím dál úžeji semknuté s digitálními technologiemi. Organizujeme podle nich svůj program, zakoušíme skrze ně svět. Kromě toho, že rozšiřují a proměňují naši realitu, podněcují k promýšlení hranice mezi reálným a virtuálním.

V posledních letech probíhají vzrušené diskuze o tzv. deepfakes. Pojem se poprvé objevil v roce 2017. Nepřekvapivě v souvislosti s pornografií. Jeden z uživatelů sociální sítě Reddit nahradil tvář pornoherečky tváří své oblíbené celebrity. Technologie je založena na umělé inteligenci fungující po vzoru neuronových sítí lidského mozku. Poté, co jsou do ní nahrána videa, proběhne proces „učení“, po kterém dokáže program nasbírané informace využít k překrytí jedné tváře druhou, uměle vytvořenou. Totéž lze provést se zvukovou stopou. Vznikají tak videa, na nichž lidé dělají něco, co nikdy neudělali, a říkají, co nikdy neřekli. V současnosti existuje řada uživatelsky nenáročných programů, pomocí nichž může falšovat skutečnost prakticky kdokoliv.

Deepfake jako ochrana

Jako filmoví diváci jsme na počítačově generované obrazy zvyklí. Dnešní hollywoodské blockbustery by bez nich nemohly existovat. Obvykle je ale nečekáme v dokumentárních filmech. Když se dokumentarista David France rozhodl zmapovat čistky namířené v Čečensku proti queer lidem, věděl, že bude muset identitu vypovídajících lidí zamaskovat. Jinak by jim hrozilo vězení, mučení a v krajním případě i smrt. Nechtěl se ale spokojit s rozmazanými obličeji a upraveným hlasem. Bylo pro něj důležité zachovat lidskost sociálních herců, aby se s nimi diváci mohli snáz identifikovat. Během náročné postprodukce svého dokumentu Vítejte v Čečensku (2020) proto nahradil obličeje třiadvaceti pronásledovaných osob tvářemi jiných lidí (konkrétně newyorských queer aktivistů). Pro každého byla počítačem vytvořena uvěřitelná digitální maska, která zakrývá jeho pravou tvář, ale současně věrně napodobuje mimiku dotyčného a nebrání našemu emocionálnímu napojení.

Vítejte v Čečensku představuje jedno z prvních rozsáhlejších, plně profesionálních využití deepfake technologie v dokumentárním filmu. Cílem bylo upozornit na varovné porušování lidských práv na území bývalého Sovětského svazu a ochránit natáčené gaye a lesby. Všichni zúčastnění na tuto formu anonymizace dobrovolně přistoupili. Také diváci jsou hned na začátku filmu zpraveni o počítačových zásazích do reality. „Aura“ kolem digitálně upravených tváří nás navíc upozorňuje na proběhnuvší manipulaci s obrazem. Vítejte v Čečensku je ale svým pozitivním využitím stále oblíbenějšího procesu výjimkou. Mnohem častěji jsou tváře lidí, převážně žen, nahrazovány bez jejich souhlasu. Podle nedávného výzkumu je naprostá většina takto upravených videí tvrdou pornografií. Ještě škodlivější může být zapojení deepfake v rámci dezinformačních kampaní, kdy jsou státníkům do úst vkládány nikdy nevyřčené věty. Samozřejmě bez upozornění, že nesledujeme záznam opravdového vystoupení.

Falšování reality

Jiný nedávný dokument vyvolal kontroverzi mimo jiné právě kvůli faktu, že deepfake používá bez předchozího informování diváků. Roadrunner: Film o Anthonym Bourdainovi (2021) se nejdříve dočkal velmi vřelého přijetí. Pak ovšem režisér Morgan Neville v rozhovoru pro časopis The New Yorker mimoděk utrousil, že jeho emotivní portrét oblíbeného šéfkuchaře obsahuje několik výroků, které Bourdain sice napsal, ale nikdy nepronesl. Neville při realizaci vycházel z desítek tisíc autentických audio a video nahrávek. Kvůli třem mimoobrazovým komentářům ale použil Bourdainův hlas vygenerovaný umělou inteligencí. Protagonista dokumentu se k tomuto kroku nemohl nijak vyjádřit. V roce 2018 spáchal sebevraždu. Také kvůli pochybnostem, zda by portrétovaný slova nepronesl jiným tónem, s jinak položeným důrazem, čelil Neville smršti nařčení z falšování reality.

<b><i>Roadrunner: Film o Anthonym Bourdainovi</i></b>

Jde o pochopitelnou kritiku, v níž hrají signifikantní roli dva faktory. V první řadě obava z vytvoření predecentu, který v budoucnu povede k hanebnějšímu zneužití deepfake technologie. Pokud lze pro účely dokumentárního filmu zfalšovat pár vět, aniž by o tom diváci předem věděli, proč nenasimulovat celou událost nebo rovnou něčí život? Druhým faktorem je přetrvávající přesvědčení, že dokumenty předkládají nezkreslenou skutečnost. Skládání něčích výroků z různých vět je ale běžnou dokumentaristickou praxí. Stejně tak například žádost tvůrce, aby natáčení lidé „přehráli“ dialog, u něhož nebyla přítomna kamera, případně se jeden z jeho účastníků zakoktal. Kvůli kontinuitě vyprávění bývá střihem překlenována velká vzdálenost v čase i prostoru. Není to sice pravidlem, ale obecně platí, že v dokumentech „pravda“ není jen zaznamenávána, ale stejně jako ve fikci vytvářena.

Digitální technologie představují pouze nový nástroj k odnepaměti probíhajícímu upravování skutečnosti v kinematografii. Mohou pomáhat i škodit. Namísto jejich apriorního odmítnutí nebo zákazu bychom měli pokračovat v debatě, kterou oba výše zmíněné filmy vyvolaly, a ptát se, nakolik transparentní tyto úpravy jsou, nebo zda k nim došlo s vědomím osob, jichž se týkají. Vždy totiž záleží na daném kontextu a použití, protože i manipulace může být provedena tak, aby se diváci necítili zrazeni. Vzhledem k tomu, že se z deepfake díky snazší dostupnosti stává běžná součást mediálního mainstreamu a náš kontakt s vnějším světem stále více zprostředkovávají umělé obrazy, je zároveň dobré trénovat svůj zrak, sluch a kritické myšlení, abychom byli obezřetnější vůči pravdivosti toho, co vidíme a slyšíme. Dokumenty, svádějící k větší důvěřivosti, jsou pro podobné tříbení audiovizuální gramotnosti ideální.