S-a ajuns și aici: Pot fi scoase sunete din imagini!

Avînd în vedere că apelurile video devin din ce în ce mai frecvente în era locurilor de muncă la distanță și a locurilor de muncă hibride, cuvintele "puneți-vă pe silențios" și "cred că sunteți pe silențios" au devenit parte din vocabularul nostru zilnic. Dar se pare că faptul de a te pune pe mut s-ar putea să nu fie atît de sigur pe cît crezi.

Kevin Fu, profesor de inginerie electrică și informatică și de informatică la Northeastern University, a descoperit o modalitate de a obține sunet din imagini și chiar din videoclipuri dezactivate. Folosind Side Eye, un instrument asistat de învățare automată pe care Fu și echipa sa de cercetare l-au creat, Fu poate determina sexul unei persoane care vorbește în camera în care a fost făcută o fotografie și chiar cuvintele exacte pe care le-a rostit, conform news.northeastern.edu, în preluare stiripesurse.ro.

"Imaginați-vă că cineva face un videoclip TikTok și îl dezactivează și dublează muzica", spune Fu. "Ați fost vreodată curios să aflați ce spun cu adevărat? A fost 'Pepene verde pepene verde' sau 'Iată parola mea'? Vorbea cineva în spatele lor? Puteți capta de fapt ceea ce se vorbește în afara camerei."

Sună ca o poveste științifico-fantastică și chiar este. Ideea pentru Side Eye a fost inspirată de un episod din serialul SF "Fringe", în care personajele principale, o echipă de investigatori științifici care lucrează pentru FBI, extrag înregistrări audio dintr-un geam topit.

Cînd episodul a fost difuzat, un critic pentru Den of Geek a numit-o "o tehnică pseudoștiințifică ridicolă". Fu nu a fost de acord.

"Mi-am zis: "Pun pariu că putem face asta", spune Fu. "Laboratorul meu este specializat în imposibil. De obicei, ne așteptăm ca prima reacție la orice lucru pe care îl facem să fie "Nu puteți face asta", iar noi spunem: "Ei bine, am făcut-o deja"".

Side Eye profită de tehnologia de stabilizare a imaginii, care este acum practic standard în majoritatea camerelor foto ale telefoanelor. Pentru a se asigura că o mînă tremurîndă nu duce la o fotografie neclară, aparatele foto au mici arcuri care țin obiectivul suspendat în lichid. Un electromagnet și senzori împing apoi obiectivul în direcții egale și opuse pentru a reduce tremurul camerei.

Cu toate acestea, Fu spune că ori de cîte ori cineva vorbește în apropierea obiectivului unei camere foto, acesta provoacă mici vibrații în arcuri și îndoaie lumina foarte ușor. Unghiul luminii se schimbă aproape imperceptibil, "cu excepția cazului în care îl cauți", spune Fu.

În mod normal, ar fi greu să extragi frecvența sonică din aceste vibrații microscopice. Dar Fu spune că rolling shutter-ul, o metodă de fotografiere pe care o folosesc majoritatea camerelor de telefon din ziua de azi, face de fapt mai ușor să se realizeze imposibilul.

"Modul în care funcționează astăzi camerele foto pentru a reduce costurile este, practic, că nu scanează simultan toți pixelii unei imagini – o fac rînd pe rînd", spune Fu. "Acest lucru se întîmplă de sute de mii de ori într-o singură fotografie. Ceea ce înseamnă, în esență, că poți amplifica de peste o mie de ori cantitatea de informații de frecvență pe care o poți obține, practic granularitatea audio."

02.11.24 - 13:23
03.11.24 - 12:09
05.11.24 - 00:15
01.11.24 - 13:35
01.11.24 - 19:19
10.11.24 - 08:42
01.11.24 - 19:20
01.11.24 - 13:38
04.11.24 - 10:57
02.11.24 - 13:20
04.11.24 - 16:28
05.11.24 - 00:02
01.11.24 - 13:41
02.11.24 - 13:26
01.11.24 - 13:40