Seleccione su idioma

Hablando claro el sistema entiende

altDesde 1990 comenzaron las investigaciones sobre los sistemas controlados mediante comandos de voz. En los últimos años se han conocido sistemas con aplicaciones útiles y comercialmente viables para desarrolladores y consumidores.

Por Richard Santa


En este mundo cada vez más convulsionado, en el cual el tiempo no alcanza y las personas buscan realizar varias actividades a la vez, la tendencia en desarrollos tecnológicos es hacer más fácil la vida de todos. Por eso, ahora los fabricantes apuntan a equipos y sistemas que puedan controlarse mediante la voz.

Google es uno de los principales jalonadores de esta tecnología. En su más reciente Conferencia de desarrolladores realizada en mayo, presentó el sistema de reconocimiento por voz para el buscador, mediante el cual permite realizar preguntas y obtener las respuestas habladas.

- Publicidad -

Este nuevo sistema de búsqueda requiere el uso del navegador Google Chrome versión 27 o superior para su funcionamiento y autorización para que el programa pueda usar el micrófono del computador.

Y aunque ésta ha sido toda una novedad, las críticas no le han faltado. Una es por el idioma, debido a que solo está disponible para inglés, sin importar qué idioma sea el predeterminado en la cuenta de Google. Otro problema reportado es que muchas veces al intentar usarlo sale error en la página, pero los directivos de la compañía han indicado que se debe al exceso de uso de la plataforma en sus primeros días.

Uno de los anuncios más esperados de la Google I/O 2013 por parte de los adictos a la tecnología, eran los detalles de las Google Glass. Se conoció que éstas también incluyen un comando de voz para ejecutar acciones como tomar fotos, ubicar en mapas o usar internet.  

Otra de las aplicaciones del gigante tecnológico que también usa comandos por voz es Google Now, un asistente personal inteligente disponible para el sistema operativo Android e iOS, que utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer recomendaciones, y actuar al delegar las solicitudes a un conjunto de servicios web.

Los tres productos de Google con funciones a través de comandos de voz comparten la misma dificultad, actualmente solo funcionan con el idioma inglés, y los que tienen opciones en español, como Google Now, presentan problemas con el reconocimiento del lenguaje. Pero muy seguramente esta restricción del idioma será superada en los próximos meses.

No es el único
Google no es el único desarrollador tecnológico que está trabajando en comandos de voz. La compañía NEC informó hace poco que sus investigadores desarrollan actualmente un sistema de control de voz para smartphone que permitirá superar uno de los principales problemas que tienen estos sistemas, el ruido ambiente.

NEC encontró una solución a las situaciones con intenso ruido que no permitían el uso de los comandos de voz. Su sistema funcionará mediante dos micrófonos, uno captará el ruido ambiente y otro exclusivamente los diferentes tipos de voz. De esta forma se evita tener que acercarse demasiado el micrófono a la boca para que el dispositivo pueda funcionar bien.

- Publicidad -

En el mismo sentido trabaja Sherpa, un asistente virtual que permite ejecutar y agendar las tareas mediante órdenes de voz. Este desarrollo español ha sido muy bien acogido debido a que su idioma nativo es el español. En sus primeros seis meses alcanzó el medio millón de descargas.

Expertos han señalado que es una mejor versión que el Google Now por su manejo del idioma español. Por eso, sus creadores decidieron aprovechar este éxito y actualmente se encuentran trabajando en la aplicación que les permitirá tener presencia en las Google Glass.



Por su parte, Apple tampoco se ha quedado atrás y durante 2011 lanzó su teléfono iPhone 4S con la aplicación Siri, que utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de las solicitudes a un conjunto de servicios web que va en aumento. Una de sus ventajas es que se adapta a las preferencias individuales del usuario con el paso del tiempo y personaliza los resultados, así como realizando tareas como reservar mesa para cenar o pedir un taxi.

Otras aplicaciones
Los comandos por voz han sido beneficiados por el auge de los dispositivos móviles, debido a que la mayoría de las aplicaciones están dirigidas a estos equipos. Pero no son los únicos. Como vimos anteriormente, las aplicaciones de voz para Google ya se pueden usar en su buscador desde cualquier dispositivo o computador.

También, el sistema en el que trabaja NEC pretende ser de utilidad para otras industrias, como las fábricas o tiendas, las cuales podrán verse beneficiadas con el manejo de las máquinas mediante voz permitiendo a los empleados realizar otras actividades a la vez usando las manos.

Windows 7 también trajo por primera vez comandos de voz para algunas de sus aplicaciones, como la administración de música tras la configuración del sistema y la grabación de los comandos a utilizar. Incluso, las consolas de juegos, como el Xbox 360, hoy cuentan con este tipo de servicios.

- Publicidad -

Algunos de los más beneficiados con los comandos por voz han sido las personas que tienen algún tipo de discapacidad, quienes han encontrado soluciones para facilitar la accesibilidad, sobre todo cuando tienen dificultades motrices o de movilidad.

Tipos y usos
En general, los comandos de voz buscan permitir una comunicación entre los humanos y las máquinas, pero algunos teóricos aseguran los principales retos de estos sistemas están en las formas del lenguaje (fonética, semántica, acento, entre otras) para tener una aceptación del mensaje correcto y una respuesta adecuada.  

Actualmente las soluciones de comando por voz están clasificadas en varias opciones. Por ejemplo, si requiere un entrenamiento previo antes de empezar a usarse, o si es accesible para cualquier persona o solo está en capacidad de reconocer solo un usuario.

También se deben diferenciar si el sistema permite que el usuario hable de corrido o debe pronunciar palabra por palabra, dando un corto espacio de tiempo entre cada una para facilitar el reconocimiento. Y un factor fundamental, es tener claro cuáles son las funciones que reconoce el sistema, si tiene algunas frases predeterminadas o un lenguaje extenso.

Aunque muchos ven en los comandos de voz soluciones a problemas cotidianos e incluso facilitando la vida en acciones comunes, es claro que esta es una tecnología en proceso de investigación y desarrollo para lograr una funcionalidad óptima. Un caso particular sería el de los conductores.

Muchos han hablado de lo útil que pueden resultar los comandos de voz para las personas cuando están frente al volante. Pero hay estudios académicos que han llamado la atención sobre el riesgo que éstos podrían traer para los conductores. El instituto de transporte de Texas, dependencia de la Universidad A&M, sostuvo en una reciente investigación que estas funciones podrían ser más peligrosas que chatiar cuando se está al volante.

Señalan que estos sistemas requieren mucha más atención, porque en la mayoría de las ocasiones se debe corregir la orden dada al dispositivo, lo que reduce el tiempo de reacción del conductor ante un imprevisto en la vía. Este sería un problema más que se le suma al conflicto que tiene combinar el volante con los dispositivos móviles.

Pero al ritmo que avanzan hoy las investigaciones y con el interés de tantas compañías por desarrollar sus aplicaciones, es posible que en un par de años su funcionalidad sea mayor, sobre todo, solucionando problemas como la distorsión que puede generar el sonido ambiente, los usos en diferentes idiomas, el reconocimiento de las diferentes características del hablante y hasta las distracciones para los conductores.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No hay comentarios

Deje su comentario

En respuesta a Some User
MEXDC renueva su apuesta por IntegraTec México

MEXDC renueva su apuesta por IntegraTec México

México. IntegraTEC, la feria para los integradores tecnológicos de Latinoamérica, se complace en anunciar la ampliación de su convenio de colaboración con la Asociación Mexicana de Data Centers...

L-Acoustics fue el encargado del sonido en el Super Bowl LIX

L-Acoustics fue el encargado del sonido en el Super Bowl LIX

Internacional. El Caesars Superdome en Nueva Orleans fue sede del Super Bowl LIX el domingo 9 de febrero, su octavo Gran Juego de la NFL desde que se inauguró el icónico recinto abovedado en 1975. 

Powersoft adquiere el 51% de K-Array, con opción del 100%

Powersoft adquiere el 51% de K-Array, con opción del 100%

Internacional. Powersoft firmó un acuerdo de inversión vinculante para adquirir de H.P. Sound Equipment el 51% del capital social de K-Array. El Acuerdo también prevé la concesión mutua de opciones...

Directividad acústica variable

Directividad acústica variable

El también conocido en la industria como Beam Steering, es un concepto alternativo de diseño de sistemas de audio. Diego Cárdenas*

Nuevo procesador de videowall de AVPro Edge

Nuevo procesador de videowall de AVPro Edge

Latinoamérica. AVPro Edge presentó el procesador de videowall Fresco 8K, el cual cuenta con ancho de banda 8K Ultra HD de 48 Gbps, así como con el rendimiento y la longevidad del formato 8K en...

OSO Colmenero tendrá su tercer encuentro en México

OSO Colmenero tendrá su tercer encuentro en México

México. Este 25 y 26 de febrero, el representante de marcas de iluminación y AV, OSO Colmenero, tendrá en Ciudad de México su tercer encuentro anual “Face to Face”, un evento de networking y...

Christie lanzó proyector híbrido RGB láser puro y fósforo

Christie lanzó proyector híbrido RGB láser puro y fósforo

Latinoamérica. Christie lanzó el proyector Sapphire 4K40-RGBH, que combina iluminación RGB láser puro de estado sólido con un sistema de láser fósforo dual, creando el primer proyector híbrido RGB...

Q-SYS VisionSuite ahora está certificado para Google Meet

Q-SYS VisionSuite ahora está certificado para Google Meet

Latinoamérica. El acelerador de IA Q-SYS VisionSuite para el seguimiento de presentadores se suma a la lista de soluciones Q-SYS certificadas para Google Meet, incluidos los procesadores Q-SYS Core,...

Panduit cierra 2024 con crecimiento y prepara expansión

Panduit cierra 2024 con crecimiento y prepara expansión

Latinoamérica. En un año marcado por la aceleración tecnológica y la transformación digital en América Latina, Panduit concluyó 2024 como su sexto año consecutivo con incremento en demanda de...

Presidente global de Epson visitó México y Brasil

Presidente global de Epson visitó México y Brasil

Latinoamérica. Yasunori Ogawa, presidente y CEO global de Epson, visitó las oficinas de la compañía en Brasil y México, presencia que reforzó la relevancia estratégica de Latinoamérica para Epson,...

Suscribase Gratis
SUSCRÍBASE AL INFO-BOLETIN
¿REQUIERE UNA COTIZACIÓN?
ENTREVISTAS DESTACADAS
PATROCINADORES










ULTIMO BOLETIN
Ultimo Info-Boletin