Článek
V září se fanoušci firmy Apple dočkají nových iPhonů, už nyní si ale mohou vyzkoušet betaverzi nového operačního systému iOS 17. Nabídne celou řadu nových možností, jak si telefon přizpůsobit.
Většinou jde o vizuální vylepšení, ale nejvíce se nyní mluví o možnosti naklonování vlastního hlasu.
Jmenuje se „Personal Voice“ a je skrytá v Nastavení – Usnadnění mezi dalšími nástroji, jako je čtečka textu na displeji nebo možnost přiblížení. Funkci klonování hlasu zmínil šéf Apple, Tim Cook, už v květnu. Nyní si ji mohou vyzkoušet všichni, kdo si nainstalují novou betaverzi iOS 17.
Takhle vypadá hlas, který iPhone vytvořil na základě mých nahrávek. Poznáte, která ukázka je vygenerovaná neuronovou sítí a která vznikla v mém hrdle?
Tentokrát to není tak těžké, jako minule s naklonovaným hlasem moderátorky. Jenže zatímco na profesionální klon se obvykle využívají silné grafické karty kdesi na serveru, iPhone v zájmu zachování soukromí natrénuje váš hlas přímo na zařízení.
Trénink přes noc přímo na zařízení
Napřed ale musíte iPhonu dodat 150 ukázek svého hlasu. Aby firma zajistila pestrost nahrávek – a také aby zabránila možnému zneužití funkce k „ukradení“ cizího hlasu – budete číst do mikrofonu dosti neobvyklé a nudné věty. Občas jsou tam čísla, vlastní jména nebo třeba různé formy vedlejších a tázacích vět.
Poté musíte nechat telefon v klidu – tedy zamknutý a připojený k nabíječce – a on využije svého silného integrovaného čipu k tomu, aby natrénoval model pro syntézu řeči.
Podívejte se, jak probíhá trénink a jaký je výsledek:
Musím říci, že mne překvapilo, jak moc hlas zněl jako ten můj. Ze všech bezplatných projektů, které jsem zkoušel, je to rozhodně nejlepší výsledek. Navíc vytrénovaný nikoli někde na vzdáleném serveru, ale přímo u mne na mobilním zařízení.
Pořád je ale v hlasu náznak „robotičnosti“ a strojové chraplavosti, která se projeví hlavně u delších ukázek. Když jsem ale hlas zkoušel k nahrávání zpráv do telefonu (musel jsem k tomu použít druhý telefon), i lidé, kteří mne dobře znají, měli místy problém rozeznat, zda to jsem, či nejsem já.
K čemu to je?
V současné implementaci bude možnost vytvoření osobního hlasu spíše taková zajímavá hračka. Využití najde momentálně hlavně ve funkci Live Speech, kterou lze aktivovat v Nastavení – Usnadnění a poté zapnout trojitým stisknutím tlačítka pro zapnutí.
Můžete si svým naklonovaným hlasem nechat číst různé texty, které napíšete na klávesnici. Připravit si také můžete texty vlastní. Apple zmiňuje třeba možnost „zálohovat“ svůj hlas pro případ, že by vás nějaká nemoc v budoucnu o hlas připravila. Zároveň jde samozřejmě i o ukázku toho, že Apple v oblasti neuronových sítí nespí.
Do budoucna si umím představit celou řadu možných využití, od tvorby hlasových komentářů přes čtení zpráv až třeba po komunikaci s hlasovými automaty.
Není však vůbec jisté, zda Apple takové využití umožní. Firma si dává velký pozor na to, aby všichni věděli o důrazu, který klade na soukromí. Alespoň prozatím tak klon vašeho hlasu žije zašifrovaný pouze ve vašem zařízení.