El problema de la fiesta de cóctel




Puede que en breve los ordenadores consigan descifrar las voces de varias personas que hablan al mismo tiempo.

BRYAN CHRISTIE (ilustración); FUENTE: «SINGLE-CHANNEL MULTITALKER SPEED RECOGNITION», POR S. J. RENNIE ET AL. EN SIGNAL PROCESSING MAGAZINE, IEEE, VOL. 27, Nº 6, NOVIEMBRE DE 2010

Inicio artículo

Imagine que se encuentra en una fiesta multitudinaria y que Álex le está contando una historia soporífera. Al mismo tiempo, oye cómo Daniel le refiere a Gloria un chismorreo que a usted le interesa mucho más, por lo que decide ignorar a Álex y concentrarse en el relato de Daniel. ¡Enhorabuena! Acaba de demostrar la capacidad humana para resolver el problema de la fiesta de cóctel: cómo separar un discurso de entre varios que tienen lugar al mismo tiempo.
Hoy en día los ordenadores carecen de tal facultad. Aunque el reconocimiento informático del habla constituye una técnica cada vez más asentada, todavía falla cuando dos personas hablan a la vez. Lograr que un ordenador distinga entre varias voces no solo mejoraría los sistemas de reconocimiento del habla, sino que supondría un gran avance en otros campos en los que también es necesario separar señales, como la interpretación de los escáneres cerebrales, por ejemplo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *