În timp ce unele celebrități se arată absolut încântate de posibilitatea de a face bani prin simpla închiriere a vocii, guvernele care se bazează pe propagandă pentru rămânerea la putere și grupurile infracționale jubilează la ideea că pot clona vocea alături de imagine, apelând la tehnologia deepfake audio.
Justificarea pe care se bazează tehnologia deepfake audio este cât se poate de simplă: ca vedetă, nu poți fi deranjat să participi la un eveniment anume sau crearea unui clip publicitar, dar poți sa-ți licențiezi vocea pentru cine e interesat.
Dacă până acum, tehnologia Deepfake s-a limitat doar la falsificarea clipurilor video, atribuind identitatea cuiva unor fapte sau evenimente la care aceasta nu a participat, de acum falsul poate fi dus până la capăt, atribuind unui clip Deepfake atât imagine, dar și coloana sonoră potrivită, redând întocmai timbrul vocii presupusului protagonist. Totul se face cu ajutorul algoritmilor de inteligență artificială.
Profitând de ultimele progrese tehnologice, software-ul ghidat de inteligență artificială poate imita nu doar accentul specific al vocii tale, ci și ci timbrul, tonalitatea, cursivitatea și chiar tiparele de respirație. Mai mult decât atât, tiparul vocii clonate poate fi manipulat pentru a reda o emoție anume, cum ar fi nervozitate, furie, fericire, dragoste sau plictiseală, dând credibilitate falsului creat.
Performanțele noilor tehnologii de sintetizare vocală sunt recunoscute de Tim Teller, un actor profesionist specializat în dublarea producțiilor cinematografice, recunoscut pentru abilitatea sa de a imita tot felul de voci. Potrivit acestuia, rezultatul obținut prin sintetizare vocală este atât credibil încât nimeni nu poate deosebi falsul de realitate. Cel puțin, nu fără o analiză temeinică a fluxului audio, desfășurată apelând la software specializat.
Susținând tehnologia, Teller a permis dezvoltatorului VocaliD să-i preia vocea, în ideea de a o închiria diverșilor clienți.
Cert este că tehnologia bazată pe inteligență artificială este ușor adaptabilă, putând prelua o sumedenie de alte voci, folosite de actori, politicieni sau oameni de rând.
Clonarea vocală poate fi, de asemenea, utilizată pentru a traduce cuvintele unui actor în diferite limbi, ceea ce înseamnă, de exemplu, că un film va putea fi tradus în principalele limbi de circulație fără ajutorul traducătorilor, păstrând intact timbrul vocal al actorilor din film.
Firma canadiană Resemble AI spune că poate transforma vocile englezești clonate în alte 15 limbi. Iar genera o copie de calitate a vocii cuiva, software-ul are nevoie de o înregistrare a protagonistului în care acesta vorbește timp de doar 10 minute.