Článek
Článek si také můžete poslechnout v audioverzi.
Každoročně 16. dubna si připomínáme světový den hlasu. Jeho cílem je upozornit na důležitost lidského hlasu pro komunikaci a kvalitu života. Lidé si ovšem často význam hlasu uvědomí až ve chvíli, kdy se jim ze zdravotních důvodů zhorší nebo o něj úplně přijdou.
Dnešní AI technologie však v takových případech nabízejí řešení. Běžní lidé by je mohli využít k záchraně svého hlasu. Například u nemocí, jako je amyotrofická laterální skleróza – ALS, kterou trpěl i slavný fyzik Stephen Hawking. Tato nemoc postihne časem celé tělo, včetně hlasového ústrojí.
Magazín Seznam Zpráv
Cestování | Jídlo | Životní styl | Architektura | Historie
- Heydrichův mercedes našli ve stodole. Po 18 letech se dočkal opravy
- Tady si chození zamilujete. Vzhůru na skotskou West Highland Way
- Gastroprůvodce hodnotil restaurace v Česku. Tohle je 12 nejlepších
- Sezona hradů a zámků začíná: 10 novinek, které byste si neměli nechat ujít
- Chlapce zachránily v koncentračním táboře slupky od brambor
Právě Hawking byl znám využitím syntetického hlasu, který však zněl spíše jako robot. Dnes by i tento slavný vědec měl úplně jiné možnosti. Takzvané hlasové otisky dokážou nabídnout postiženým možnost mluvit plným, zdravým hlasem.
Lidé, kteří mají zhoršenou kvalitu hlasu nebo nemohou mluvit vůbec, by mohli využít již rozšířenou technologii takzvaného TTS, text-to-speech. Díky ní může uměle vytvořený či zrekonstruovaný hlas číst psaný text.
„Buď by ti lidé psali na klávesnici a hlas by v podstatě byl TTS. Anebo by jim šlo implantovat mikrofony k hlasovému ústrojí, pokud by měli hlas jen velmi slabý,“ popisuje Josef Vopička, expert na tvorbu syntetických hlasů z českého technologického startupu MAMA AI. Cena takového otisku ovšem není úplně nízká. Podle experta by se dnes mohla pohybovat kolem sta tisíc korun.
Jsou přitom už známy případy, kdy takto syntetický hlas využily i známé osobnosti. K nejviditelnějším patří americká hvězda country music Randy Travis. Po mrtvici, kterou utrpěl v roce 2013, zpěvák trpí afázií. Tato porucha vzniklá poškozením mozku výrazně omezuje jeho schopnost mluvit a zpívat.
Díky technologii vyvinuté v Británii se mu ovšem vloni podařilo vydat novou píseň Where That Came From, která zní, jako by ji opravdu nazpíval.
Také nedávno zesnulý herec Val Kilmer, který přišel o hlas kvůli rakovině hrtanu a následné tracheotomii, si nechal digitálně zrekonstruovat hlas. Některé zprávy v médiích přitom naznačovaly, že díky této technologii herec promluvil ve filmu Top Gun: Maverick. Distributor filmu však později informoval, že při natáčení nebyla AI použita.
Forma zmrtvýchvstání
Syntetické hlasy se přitom nemusí omezovat jen na hlasy žijících lidí. Mohou i „zrekonstruovat“ hlas zemřelých. Stačí k tomu jen několik hodin zvukových záznamů. Nedávno se o to pokusil Český rozhlas v projektu „Gott navždy“. Rozhlasu se s pomocí nahrávek hlasu slavného zpěváka podařilo zrekonstruování jeho hlasu. Tento umělý Gott vám následně může předčítat jeho autobiografii.
Podle Jana Kleindiensta z firmy MAMA AI se zrekonstruované hlasy nemusí vyrábět pouze pro celebrity. „Pokud máte třeba zemřelého dědečka, lze z nahrávek jeho hlasu vytvořit avatara, se kterým si můžete povídat,“ tvrdí.
Příbuzným zemřelého by tak mohli avataři pomoci se vyrovnat se smrtí a třeba prodloužit okamžiky strávené s blízkou osobou. „Výhodou té technologie dnes je, že ji nemusíte mít na počítači, ale stačí vám už pouze chytrý telefon,“ dodává.
Umělí moderátoři
Syntetické hlasy mají i další uplatnění. Běžně je dnes využívají třeba média, včetně těch českých, při převodu psaného slova na to mluvené. Sama společnost MAMA AI vyrobila pro Seznam.cz a Seznam Zprávy sérii syntetických hlasů, z nichž jeden namlouvá i tento článek.
Prvním z takových hlasů byla Hacsiko na rádiu Express FM. Její hlas by modelován podle moderátorky Báry Hacsi a dnes nejčastěji moderuje v nočním vysílání.
Také server iRozhlas.cz využívá syntetické hlasy. Momentálně vám články může přečíst umělý hlas Pavla Prouzy a v budoucnu se můžete těšit také na další hlas.
S podobnou technologií se tedy můžete setkávat denně, aniž byste o tom vůbec věděli. Hlasové asistenty můžete dále najít u bank či telefonních operátorů, na webových stránkách soukromých společností, ale i třeba na webových stránkách armády ČR.
Josef Vopička také uvádí, že lze hlasy kombinovat. Například se dá spojit český hlas s anglickým modelem a najednou umí český hlas mluvit perfektní angličtinou, i přesto, že původní majitel hlasu anglicky nemluví. „Tohle jde udělat v podstatě s každým jazykem,“ říká Vopička.
Lidský hlas už není unikát
Jak už ovšem padlo v úvodu tohoto článku, technologie umožňující vytvořit umělý hlas jsou také zneužitelné, což vyžaduje ostražitost. Už v roce 2018 varoval americký komik Jordan Peele, že je možné se „vtělit“ do známé osobnosti a jejími ústy říkat cokoliv.
Sám Peele, ve spolupráci se serverem BuzzFeed, k tomu využil podobu bývalého prezidenta USA Baracka Obamy. Tehdy k tomu jeho tým potřeboval zhruba 56 hodin práce a program zvaný FakeApp. Dnešní AI nástroje však dokážou celý proces zkrátit na minimum.
K něčemu podobnému už dnes nepotřebujete dny práce. Stačí vám jen krátký záznam vašeho hlasu a některý z veřejně dostupných nástrojů na tvorbu umělých hlasů.
„V současné době jsou na trhu firmy, které nabízí takzvané klonování hlasů. Do služby nahrajete vzorek svého hlasu a ona začne mluvit, přitom má stejnou barvu hlasu a moduluje hlas jako vy - má takzvaně podobnou prozodii,“ říká Josef Vopička.
Přístup k řadě takových hlasů umožňuje třeba společnost TTS Labs. Ta poskytuje již zmiňované TTS – hlasy předčítající psaný text i řadě influencerů na platformách Twitch nebo YouTube.
Zprávy vám tak může číst například herec Chistopher Judge v roli Kratose z herní série God of War. Ve své knihovně však firma nabízí řadu známých hlasů, včetně například Barta Simpsona, kačera Donalda nebo chlupatého Chewbaccy (Žvejkala) ze Star Wars.
Falešný hlas na telefonu
I díky takovým službám je dnes internet plný falešných videí a zvukových záznamů, ve kterých vám známé osobnosti říkají něco, co by nikdy neřekly, nabízejí produkty či investice nebo se snaží vyvolat paniku.
„Dnes si vytvoříte umělý hlas z pěti, deseti minut nahrávky. Ten hlas bude znít jako vy, barva hlasu bude stejná, ale ta prozodie nebude dobrá. K opravdu kvalitnímu hlasu budete potřebovat kolem deseti hodin záznamu,“ tvrdí Vopička. To ale stále není nic proti dnům práce, které dříve zabrala tvorba minutových videí.
Je proto důležité si dávat pozor, na co se díváte nebo co posloucháte. Což se ovšem dnes týká také toho, když vám někdo volá z neznámého čísla. Hovorů s falešným hlasem totiž přibývá. „Dříve to byly e-maily a SMSky. Zprávy, které nezní věrohodně, je nutné si ověřovat. Rozhodně nezačněte jednat na základě jedné zprávy,“ varuje Josef Vopička.
Expert také poukazuje na ještě zákeřnější falešné telefonáty nebo hlasové zprávy. Podvodníci se vám totiž mohou pokusit zavolat i hlasem vašich blízkých. V tu chvíli je nutné se mít extra na pozoru. Pokud vám volají blízcí z neznámých čísel a tvrdí věci, které by nikdy neřekli osobně, nejlepší cestou je zavěsit.