Sviluppata nuova tecnologia per la lettura labiale

Una nuova tecnologia per la lettura del labiale sviluppata in Inghilterra all'University of East Anglia (UEA) potrebbe essere d'aiuto nel risolvere crimini e nel fornire assistenza nella comunicazione alle persone con disturbi all'udito o di linguaggio.

Una scultura di sabbia raffigurante numerose e diverse bocche
Fonte: Flickr

La nuova tecnologia per la lettura labiale

La dottoressa Helen L. Bear e il professor Richard Harvey dell'University of East Anglia hanno sviluppato una tecnologia per il riconoscimento visivo del linguaggio parlato che potrebbe essere utile in diversi ambiti. Qual è la particolarità di questa tecnologia? Secondo la dottoressa, tale tecnologia può essere applicata "in qualsiasi luogo in cui l'audio non è abbastanza buono per determinare costa stanno dicendo le persone.". E quindi si rivelerebbe particolarmente adeguata in ambienti piuttosto rumorosi, come nelle auto, nelle cabine di pilotaggio degli aerei o in qualsiasi altro luogo in cui non è facile ascoltare e capire le conversazioni.

Secondo il professor Bear, gli unici problemi nell'identificare un linguaggio sorgono quando il suono non è disponibile o se l'audio non è adeguato e non ci sono indizi per contestualizzare la conversazione. Le pronunce delle lettere /p/, /b/ ed /m/ appaiono molto simili tra loro sulle labbra, ma grazie a questo dispositivo è possibile fare una distinzione tra i diversi suoni per una traduzione migliore.

La dottoressa Bear ha spiegato: "Stiamo ancora imparando la scienza del discorso visivo e di cosa hanno bisogno le persone per creare un modello di riconoscimento infallibile per la lettura del labiale, ma questo sistema di classificazione migliora sui precedenti metodi di lettura del labiale usando un metodo di allenamento innovativo per i classificatori.".

Si tratta dunque di una tecnologia abbastanza efficiente, ma che dovrà essere potenziata per offrire risultati ancora più soddisfacenti. Il professor Harvey è comunque contento dei traguardi finora raggiunti: "La lettura labiale è uno dei problemi più difficili nel campo dell'intelligenza artificiale quindi è grandioso fare progressi su uno degli aspetti più complicati, ovvero come addestrare le macchine a riconoscere l'aspetto e la forma delle labbra umane.".


Applicazioni ed eventuali rischi per la privacy

Per quanto riguarda invece gli ambiti di applicazione, la dottoressa Bear ha detto: "Fondamentalmente, mentre ci sono ancora miglioramenti da fare, tale sistema potrebbe essere adattato per una serie di scopi - per esempio, per le persone con invalidità dell'udito e del linguaggio. In alternativa, una buona macchina per la lettura labiale potrebbe essere parte di un sistema di riconoscimento facciale.".

Nel primo caso i vantaggi sono evidenti: un sistema del genere potrebbe essere di grande aiuto per le persone sorde e per quelle con difficoltà di comunicazione, migliorando le loro interazioni. Nel secondo caso, invece, è facile che possa nascere qualche perplessità. Perché un sistema di riconoscimento facciale potrebbe diventare uno strumento di supporto per le indagini di polizia, ma allo stesso tempo, se non adeguatamente regolamentato, potrebbe sollevare problemi che interferirebbero con la tutela della privacy.

Queste tecnologie diventano sempre più precise: per questo motivo assume ancora più importanza il come e il quando adottarle. Immagina la capacità di una macchina per la lettura labiale con il 76% di accuratezza insieme a un sistema di riconoscimento facciale che funziona anche al buio. Un giorno queste caratteristiche saranno tutte integrate in un unico sistema che probabilmente verrà adottato per la sorveglianza di luoghi pubblici e privati. E allora basterà una violazione del sistema o una condotta illecita da parte di chi vi ha accesso per mettere a rischio la vita privata delle persone.

È il progresso dell'intelligenza artificiale. Abbiamo il doppio lato della medaglia: da una parte la possibilità di rintracciare e incastrare criminali, dall'altra il pericolo dell'archiviazione di immagini del proprio volto e delle ricostruzioni delle conversazioni avute con altre persone anche nel caso in cui non fossimo coinvolti in alcun misfatto. Non è sicuramente uno scenario auspicabile e ormai sappiamo benissimo che queste tecnologie, purtroppo, possono essere utilizzate per scopi ostili anche da chi meno ce lo aspettiamo (vedi lo scandalo Datagate dell'NSA).

Fin dove riusciremo ad arrivare?

Tuttavia, queste minacce sono ancora lontane. Il sistema sviluppato dall'UEA al momento, possiede una percentuale di accuratezza nel riconoscimento delle singole parole che oscilla tra il 10 e il 20%. È ancora poco e inoltre dobbiamo considerare che il modello adottato dai ricercatori si basa solo sulla lingua inglese. Ogni linguaggio possiede le sue peculiarità: ciò rappresenta una grande sfida per gli scienziati che sviluppano sistemi di lettura del labiale e per il settore dell'intelligenza artificiale in generale.

In futuro la tecnologia dell'UEA verrà combinata con altre tecniche predittive di linguistica per migliorare ulteriormente la lettura labiale tramite dispositivi digitali. Lo ha confermato proprio la dottoressa Bear: "È esattamente ciò che amerei essere capace di fare. Avere qualcosa di così forte sarebbe incredibile, ma ci vorrà ancora più lavoro. Non andrà sul mercato in tempi brevi.". Quindi, è solo questione di tempo. Prima o poi avremo a che fare con queste tecnologie, con tutti i loro vantaggi e i loro rischi.


Fonti:
uea
techcrunch

Etichette: ,