Cercetatorii de la Universitatea Cornell au dezvoltat ochelari inteligenti care pot ajuta la îmbunatatirea comunicarii persoanelor mute sau cu dificultati de vorbire. Interfata de recunoastere a vorbirii silentioase utilizeaza detectarea acustica si inteligenta artificiala pentru a recunoaste pâna la 31 de comenzi nevorbite, pe baza miscarilor buzelor si ale gurii. FOTO: Ruidong Zhang, student la doctorat în domeniul stiintei informatiei, purtând ochelarii EchoSpeech Interfata portabila, botezata EchoSpeech, necesita doar câteva minute de date de antrenament pentru utilizator înainte de a recunoaste comenzile si poate fi rulata pe un telefon inteligent. Ochelarii vor fi prezentati la conferinta Societatii pentru dispozitive computationale privind factorii umani în sistemele informatice (CHI), care va avea loc luna aceasta la Hamburg, în Germania. „Pentru persoanele care nu pot vocaliza sunete, aceasta tehnologie pentru vorbirea silentioasa ar putea fi un input excelent pentru un sintetizator de voce. Ar putea sa le redea vocea pacientilor”, a declarat Ruidong Zhang, doctorand în stiinta informatiei si autorul principal al lucrarii, despre potentialul de utilizare a tehnologiei în dezvoltari ulterioare. În forma sa actuala, EchoSpeech ar putea fi utilizat pentru a comunica cu alte persoane prin intermediul unui smartphone în locuri în care vorbitul este incomod sau nepotrivit, cum ar fi un restaurant zgomotos sau o biblioteca linistita. Interfata vocala silentioasa poate fi, de asemenea, cuplata cu un stilou si utilizata cu un software de proiectare, cum ar fi CAD, eliminând practic necesitatea unei tastaturi si a unui mouse. Dotati cu o pereche de microfoane si difuzoare mai mici decât o guma de sters, ochelarii EchoSpeech devin un sistem sonar portabil alimentat de inteligenta artificiala, care trimite si primeste unde sonore si detecteaza miscari ale corpului, fetei si gurii. Un algoritm de învatare profunda analizeaza apoi aceste profile în timp real, cu o precizie de aproximativ 95-. Dispozitivul miniatural are un consum redus de energie si este sensibil la confidentialitate, toate acestea fiind caracteristici importante pentru implementarea de noi tehnologii purtabile în lumea reala, spun autorii. Majoritatea tehnologiilor de recunoastere a vorbirii silentioase se limiteaza la un set de comenzi prestabilite si necesita ca utilizatorul sa se afle cu fata sau sa poarte o camera, ceea ce nu este nici practic, nici fezabil, spune Cheng Zhang. Exista, de asemenea, preocupari majore legate de confidentialitate care folosesc camerele portabile, atât pentru utilizator, cât si pentru cei cu care acesta interactioneaza. Tehnologiile de detectare acustica, precum EchoSpeech, elimina necesitatea camerelor video portabile, iar datele audio necesita o latime de banda mai mica pentru a fi procesate si pot fi transmise în timp real catre un smartphone prin Bluetooth, a declarat François Guimbretière, profesor în stiinta informatiei. Si pentru ca datele sunt procesate local, pe smartphone, în loc sa fie încarcate în cloud, „informatiile sensibile din punct de vedere al confidentialitatii sunt în controlul vorbitorilor”, potrivit profesorului.
