Meta lansează ”EnCodec”, un format de compresie audio asistat de AI, de 10x mai eficient decât MP3

02.11.2022
Meta lansează ”EnCodec”, un format de compresie audio asistat de AI, de 10x mai eficient decât MP3
foto: Meta

Mult mai eficient decât bătrânul format MP3, EnCodec folosește coprocesorul de accelerare neurală prezent pe telefoanele moderne pentru a recupera detaliile altfel pierdute la compresia audio, reducând de până la 10x lățimea de bandă necesară.

Potrivit Meta, EnCodec poate îmbunătăți în mod dramatic fidelitatea audio pentru apelurile de voce preluate prin conexiuni cu lățime de bandă sever limitată, spre exemplu, în zonele cu acoperire foarte slabă a rețelei de telefonie mobilă. Astfel, de la 64kbps cât este lățimea de bandă unei conexiuni standard bazată pe compresie MP3 ai putea reduce chiar și la 6.4kbps fără degradare notabilă a fidelității audio.

De asemenea, EnCodec poate funcționa la fel de bine și pentru streaming de melodii, ridicând fidelitatea unui MP3 de 64kbps până la nivelul unuia de 640kbps, aproape la nivelul unui codec din categoria lossless.

foto: Meta

Potrivit descrierii furnizate de Meta, compresia EnCodec funcționează ca un sistem în trei etape, codecul transformând datele necomprimate într-o reprezentare de tip „spațiu latent” cu rata de eșantionare redusă. „Cuantificatorul” comprimă apoi reprezentarea la dimensiunea dorită în timp ce ține evidența celor mai importante informații care vor fi ulterior folosite pentru a reconstrui semnalul original. (Acest semnal comprimat este ceea ce este trimis conexiunea la internet sau salvat într-un fișier local.) Pentru redare, decodorul transformă datele comprimate înapoi în audio, reconstrucția asistată de acceleratorul NPU (neural processing unit) al telefonului funcționând în timp real.

„Cheia compresiei cu pierderi este identificarea modificărilor care nu vor fi perceptibile de oameni, deoarece reconstrucția perfectă este imposibilă la rate de eșantionare foarte scăzute. Pentru a face acest lucru, folosim discriminatori pentru a îmbunătăți calitatea perceptivă a mostrelor generate.” Principala provocare este ca porțiunile audio reconstruite să se asemene cât mai mult cu mostrele originale păstrate la compresia inițială, fără ca ascultătorul să poată sesiza diferențe (artefacte audio). În modul cel mai ridicat de calitate, EnCodec poate comprima sunet stereo cu fidelitate de 48KHz, reducând dramatic lățimea de bandă necesară prin conexiunea la internet.

Tags:
Urmărește Go4IT.ro pe Google News
Aurelian Mihai
Aurelian Mihai
Aurelian Mihai este cel mai vechi redactor al site-ului Go4it.ro. Are 14 ani de experienţă în presa IT şi cunoștințe ample din sfera tehnologiei. Înainte de a ajunge la Go4it, Aurelian a fost redactor pentru revista XtremPC, acoperind rubrica de știri, desfășurarea de teste comparative și ... citește mai mult