Computerele îţi pot reproduce vocea aproape perfect. Rezultatele acestei tehnologii ar putea fi extrem de periculoase

20.05.2019
Computerele îţi pot reproduce vocea aproape perfect. Rezultatele acestei tehnologii ar putea fi extrem de periculoase

Compania Dessa, specializată în AI, a dezvolat un algoritm machine learning numit RealTalk care poate „învăţa” să vorbească. În funcţie de mostre, acesta poate reproduce aproape perfect vocea celui care a fost folosit pentru „antrenament”, iar demonstraţia tehnologiei este cel puţin impresionantă. Dessa a folosit vocea lui Joe Rogan, faimos comediant şi actor, cu o voce greu de confundat pentru a prezenta tehnologia RealTalk.

Joe Rogan este popular printre fanii show-urilor de comedie de pe internet, dar şi printre cei care ascultă podcast-uri. Acesta a lansat aproape 1.300 de episoade ale emisiunii sale Joe Rogan Experience, iar Dessa a folosit toate episoadele pentru a pune bazele unui model vocal. Astfel, folosind texte scrise, algoritmul îl poate imita pe Joe Rogan aproape perfect, vocea fiind redată exact aşa cum se aude în emisiunea sa. Practic, dacă nu ai şti în prealabil, ai putea spune că vocea a fost înregistrată în studioul său, fiind imitate perfect chiar şi micile defecte de sunet caracteristice microfoanelor.

Desigur, vocea lui Joe Rogan a fost folosită şi pentru că există foarte mult material disponibil pentru a fi folosit pentru învăţarea algoritmului. În cazul altor persoane care nu apar atât de mult în înregistrări audio publice, acurateţea ar putea fi mult mai limitată. Totuşi Dessa spune că în viitor un computer ar putea să înveţe să vorbească precum o persoană reală folosind doar câteva secunde de înregistrare, folosind modelele precedente pe care le are la dispoziţie pentru a compensa.

Această tehnologie ridică însă multe semne de întrebare: cum vor putea fi combătute situaţiile în care aceasta este folosită în scopuri negative, precum utilizarea vocii unui utilizator pentru a păcăli membri ai familiei celui a cărui voce o foloseşti, sau pentru a truca declaraţiile unui politician? Momentan, este greu de spus, însă pot fi evidente avantajele: pot fi realizaţi în prezent asistenţi virtuali folosind voci celebre, sau poţi realiza aplicaţii care să răspundă mai natural la cerinţele utilizatorilor, fără a avea replici înregistrate în prealabil.

Dessa spune însă că nu va lansa acest model de machine learning public, întrucât tehnologia este momentan destul de periculoasă.

 

Tags:
Urmărește Go4IT.ro pe Google News
Cătălin Niţu
Cătălin Niţu
Redactor-șef Go4it.ro. Lucrează în presa de tehnologie și gaming din 2008. Absolvent al Facultății de Jurnalism și pasionat de gadget-uri, PC-uri și console de gaming. citește mai mult