Estamos donde tú estás. Síguenos en:

Facebook Youtube Twitter Spotify Instagram

Acceso suscriptores

Viernes, 19 de Abril de 2024
Sistemas de reconocimientos vocal

Las ventajas y peligros de la voz humana como fuente de información

Diego Ortiz

Al analizar la voz de una persona se pueden obtener datos acerca de su estatura, peso, edad, estructura facial e índice de masa corporal. “La voz que incluso puede reemplazar a la huella digital como sistema de identificación", asegura Rita Singh, experta en estudios de perfilamiento humano a través del habla, que expuso sus avances durante el Congreso de Futuro.

Admision UDEC

Cuando Rita Singh expuso el viernes 18 de enero en el Congreso Futuro el silencio fue total. Su exposición sobre los usos del análisis forense de la voz fue seguida de manera muy atenta por el público. Investigadora del Instituto de Tecnologías del Lenguaje de la Universidad de Carnegie Mellon, Estados Unidos, Singh centra sus estudios en el análisis de la voz como forma de perfilar física y psicológicamente al humano. La investigadora dice que el habla de cada persona pareciera decir mucho más que palabras. La expositora de la charla "Humano y Máquina, una dupla poderosa" explica que la voz es más singular y contiene más información que las huellas digitales, pudiendo incluso reemplazarlas como método de identificación en el futuro.

Y justo cuando Rita Singh explicaba que, por ejemplo, a partir de la simulación telefónica de un aviso de bomba se pueden obtener importantes características del autor de la amenaza, de pronto, el audio y video del evento sobre ciencia y tecnología más importante tuvo un inesperado fallo. "Esto no funciona. Vamos a esperar unos minutos a que se solucione el problema". Y así fue. Singh estuvo alrededor de un minuto y medio parada, seria y en silencio esperando que la tecnología respondiera para poder, irónicamente, explicar un importante avance en un área que le jugó una mala pasada.

En su intervención, la experta reveló que el sistema de reconocimiento en el que trabaja necesita hacerse de las ondas sonoras de una llamada telefónica para detectar, por ejemplo, el país de procedencia, color de piel, altura, peso, facciones y hasta el consumo de cocaína en quien amenazaba con hacer estallar una bomba en un lugar determinado. En conversación con INTERFERENCIA, la académica contó cómo funciona y qué implicancias tiene una tecnología en la que trabaja hace más de 20 años.

¿Qué significa perfilar humanos a partir de su voz?

Esto implica deducir todo tipo de parámetros a partir solo de la voz. Esos parámetros incluyen características físicas y de ánimo como la altura, el peso, la edad, estado de salud física y psicológica, comportamiento, personalidad y características del ambiente donde está la persona. También puede obtenerse la estructura de la cara y posiblemente el cuerpo completo.

"Esto implica deducir todo tipo de parámetros a partir solo de la voz. Esos parámetros incluyen características físicas y de ánimo como la altura, el peso, la edad, estado de salud física y psicológica, comportamiento, personalidad y características del ambiente donde está la persona".

Entiendo que a través de la fisiología de la garganta - su estructura- se pueden determinar los rasgos faciales. Pero, ¿del cuerpo completo?

Es realmente muy simple. Cuando me hablas escucho tu voz, escucho tu resonancia vocal. Tus cuerdas vocales están en la laringe y están vibrando, produciendo un sonido y resonando. La resonancia, en tanto, depende de la dimensión de tus cámaras vocales: la cámara oral y la nasal. También influye la faringe, posicionada atrás. Hay muchos lugares en las cámaras vocales donde la voz resuena, escuchándose el efecto combinado de estos. La forma de esas cámaras depende de la estructura del cráneo.

Entonces, a partir de las resonancias puedo deducir la forma de las cámaras vocales, y de las cámaras vocales puedo obtener las dimensiones del cráneo. El cráneo no está desconectado del cuerpo. Con esta información se puede deducir las proporciones del esqueleto completo. Ahora ya puedo deducir la edad y dependiendo de estos factores se puede deducir la altura y el peso, información que me permite obtener el índice de masa corporal. Y ahí ya tienes el cuerpo humano de una persona, todo a partir de su voz.

foto_voz_texto.jpeg

Rita Singh
Rita Singh

Perfilar humanos a través de la voz puede traer algunos problemas. Por ejemplo, la industria del marketing telefónico o de las aseguradoras son dos negocios que ya manejan mucha información sobre sus clientes, y a veces información bastante sensible. ¿Cómo será regulada esta nueva tecnología?

Tiene que ser regulada. Como científica estoy muy preocupada por la ética y el mal uso de la voz y la información que proporciona. Esta es la cuestión de otros tipos de biométricas como la sangre, el ADN o la huella digital: si te pido esa información, tú tienes la elección de no dármela. Pero no puedes dejar de hablar. No puedes vivir sin hablar. Entonces esto es algo que no puedes esconder.

Y para mí, sacar toda esta información de una persona a partir de la voz está mal. Tiene que haber consentimiento. Pero, al mismo tiempo, no se puede dar el consentimiento todo el tiempo que uno está hablando. Está este asunto de cuándo empiezas a recabar esta información y qué haces con esta información. Estamos preocupados, pero como científicos no podemos hacer nada al respecto. Lo único que podemos hacer es que la gente esté consciente del potencial que tiene la voz y el nivel de información que lleva. Si esto es sabido, entonces se pueden tomar decisiones correctas y así influenciar a los políticos para que legislen.

Ahora, las compañías de seguros pueden ocupar esta tecnología y decir "oh, tú tienes este tipo de propensión a este tipo de enfermedad, entonces no te daré un seguro". Esa es una de las razones por las que hablo sobre perfilar humanos a través de la voz, para generar conciencia sobre la potencialidad de esta tecnología.

 ¿Puede la regulación ir de la mano con el avance frenético de nuevas tecnologías como ésta?

La regulación no ocurre por sí misma. La regulación ocurre porque las personas obligan a que suceda. Creo que es una responsabilidad enorme, en especial para los medios. Los medios tienen que hacer que las personas estén conscientes de lo que la voz puede entregar con esta nueva tecnología. Protégela, no la entregues así no más. Si la gente no sabe, las regulaciones correctas no se harán. Es una gran responsabilidad para los medios de comunicación.

En este artículo



Los Más

Ya que estás aquí, te queremos invitar a ser parte de Interferencia. Suscríbete. Gracias a lectores como tú, financiamos un periodismo libre e independiente. Te quedan artículos gratuitos este mes.

En este artículo



Los Más

Comentarios

Comentarios

Añadir nuevo comentario