Seleccione su idioma

Hablando claro el sistema entiende

altDesde 1990 comenzaron las investigaciones sobre los sistemas controlados mediante comandos de voz. En los últimos años se han conocido sistemas con aplicaciones útiles y comercialmente viables para desarrolladores y consumidores.

Por Richard Santa


En este mundo cada vez más convulsionado, en el cual el tiempo no alcanza y las personas buscan realizar varias actividades a la vez, la tendencia en desarrollos tecnológicos es hacer más fácil la vida de todos. Por eso, ahora los fabricantes apuntan a equipos y sistemas que puedan controlarse mediante la voz.

Google es uno de los principales jalonadores de esta tecnología. En su más reciente Conferencia de desarrolladores realizada en mayo, presentó el sistema de reconocimiento por voz para el buscador, mediante el cual permite realizar preguntas y obtener las respuestas habladas.

- Publicidad -

Este nuevo sistema de búsqueda requiere el uso del navegador Google Chrome versión 27 o superior para su funcionamiento y autorización para que el programa pueda usar el micrófono del computador.

Y aunque ésta ha sido toda una novedad, las críticas no le han faltado. Una es por el idioma, debido a que solo está disponible para inglés, sin importar qué idioma sea el predeterminado en la cuenta de Google. Otro problema reportado es que muchas veces al intentar usarlo sale error en la página, pero los directivos de la compañía han indicado que se debe al exceso de uso de la plataforma en sus primeros días.

Uno de los anuncios más esperados de la Google I/O 2013 por parte de los adictos a la tecnología, eran los detalles de las Google Glass. Se conoció que éstas también incluyen un comando de voz para ejecutar acciones como tomar fotos, ubicar en mapas o usar internet.  

Otra de las aplicaciones del gigante tecnológico que también usa comandos por voz es Google Now, un asistente personal inteligente disponible para el sistema operativo Android e iOS, que utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer recomendaciones, y actuar al delegar las solicitudes a un conjunto de servicios web.

Los tres productos de Google con funciones a través de comandos de voz comparten la misma dificultad, actualmente solo funcionan con el idioma inglés, y los que tienen opciones en español, como Google Now, presentan problemas con el reconocimiento del lenguaje. Pero muy seguramente esta restricción del idioma será superada en los próximos meses.

No es el único
Google no es el único desarrollador tecnológico que está trabajando en comandos de voz. La compañía NEC informó hace poco que sus investigadores desarrollan actualmente un sistema de control de voz para smartphone que permitirá superar uno de los principales problemas que tienen estos sistemas, el ruido ambiente.

NEC encontró una solución a las situaciones con intenso ruido que no permitían el uso de los comandos de voz. Su sistema funcionará mediante dos micrófonos, uno captará el ruido ambiente y otro exclusivamente los diferentes tipos de voz. De esta forma se evita tener que acercarse demasiado el micrófono a la boca para que el dispositivo pueda funcionar bien.

- Publicidad -

En el mismo sentido trabaja Sherpa, un asistente virtual que permite ejecutar y agendar las tareas mediante órdenes de voz. Este desarrollo español ha sido muy bien acogido debido a que su idioma nativo es el español. En sus primeros seis meses alcanzó el medio millón de descargas.

Expertos han señalado que es una mejor versión que el Google Now por su manejo del idioma español. Por eso, sus creadores decidieron aprovechar este éxito y actualmente se encuentran trabajando en la aplicación que les permitirá tener presencia en las Google Glass.



Por su parte, Apple tampoco se ha quedado atrás y durante 2011 lanzó su teléfono iPhone 4S con la aplicación Siri, que utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de las solicitudes a un conjunto de servicios web que va en aumento. Una de sus ventajas es que se adapta a las preferencias individuales del usuario con el paso del tiempo y personaliza los resultados, así como realizando tareas como reservar mesa para cenar o pedir un taxi.

Otras aplicaciones
Los comandos por voz han sido beneficiados por el auge de los dispositivos móviles, debido a que la mayoría de las aplicaciones están dirigidas a estos equipos. Pero no son los únicos. Como vimos anteriormente, las aplicaciones de voz para Google ya se pueden usar en su buscador desde cualquier dispositivo o computador.

También, el sistema en el que trabaja NEC pretende ser de utilidad para otras industrias, como las fábricas o tiendas, las cuales podrán verse beneficiadas con el manejo de las máquinas mediante voz permitiendo a los empleados realizar otras actividades a la vez usando las manos.

Windows 7 también trajo por primera vez comandos de voz para algunas de sus aplicaciones, como la administración de música tras la configuración del sistema y la grabación de los comandos a utilizar. Incluso, las consolas de juegos, como el Xbox 360, hoy cuentan con este tipo de servicios.

- Publicidad -

Algunos de los más beneficiados con los comandos por voz han sido las personas que tienen algún tipo de discapacidad, quienes han encontrado soluciones para facilitar la accesibilidad, sobre todo cuando tienen dificultades motrices o de movilidad.

Tipos y usos
En general, los comandos de voz buscan permitir una comunicación entre los humanos y las máquinas, pero algunos teóricos aseguran los principales retos de estos sistemas están en las formas del lenguaje (fonética, semántica, acento, entre otras) para tener una aceptación del mensaje correcto y una respuesta adecuada.  

Actualmente las soluciones de comando por voz están clasificadas en varias opciones. Por ejemplo, si requiere un entrenamiento previo antes de empezar a usarse, o si es accesible para cualquier persona o solo está en capacidad de reconocer solo un usuario.

También se deben diferenciar si el sistema permite que el usuario hable de corrido o debe pronunciar palabra por palabra, dando un corto espacio de tiempo entre cada una para facilitar el reconocimiento. Y un factor fundamental, es tener claro cuáles son las funciones que reconoce el sistema, si tiene algunas frases predeterminadas o un lenguaje extenso.

Aunque muchos ven en los comandos de voz soluciones a problemas cotidianos e incluso facilitando la vida en acciones comunes, es claro que esta es una tecnología en proceso de investigación y desarrollo para lograr una funcionalidad óptima. Un caso particular sería el de los conductores.

Muchos han hablado de lo útil que pueden resultar los comandos de voz para las personas cuando están frente al volante. Pero hay estudios académicos que han llamado la atención sobre el riesgo que éstos podrían traer para los conductores. El instituto de transporte de Texas, dependencia de la Universidad A&M, sostuvo en una reciente investigación que estas funciones podrían ser más peligrosas que chatiar cuando se está al volante.

Señalan que estos sistemas requieren mucha más atención, porque en la mayoría de las ocasiones se debe corregir la orden dada al dispositivo, lo que reduce el tiempo de reacción del conductor ante un imprevisto en la vía. Este sería un problema más que se le suma al conflicto que tiene combinar el volante con los dispositivos móviles.

Pero al ritmo que avanzan hoy las investigaciones y con el interés de tantas compañías por desarrollar sus aplicaciones, es posible que en un par de años su funcionalidad sea mayor, sobre todo, solucionando problemas como la distorsión que puede generar el sonido ambiente, los usos en diferentes idiomas, el reconocimiento de las diferentes características del hablante y hasta las distracciones para los conductores.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No hay comentarios

Deje su comentario

En respuesta a Some User
Unica debuta en Paraguay en instalaciones del Banco Ueno

Unica debuta en Paraguay en instalaciones del Banco Ueno

Paraguay. El Banco Ueno se ha convertido en la primera institución en Paraguay en adoptar la plataforma de amplificadores de instalación fija Unica de Powersoft, tras una importante actualización...

Cinemex equipa con proyectores láser las nuevas salas

Cinemex equipa con proyectores láser las nuevas salas

México. La cadena de cines mexicana Cinemex, ha adquirido proyectores láser de cine de la Serie CineLife+ de Christie para equipar cinco complejos, como parte de su proceso de renovación y nueva...

Yamaki AVI Experience brindará una experiencia AV completa

Yamaki AVI Experience brindará una experiencia AV completa

Colombia. El mundo del audio, video e iluminación profesional se dará cita en la capital del país con el, un evento de la mano de Yamaki, empresa líder en soluciones audiovisuales y tecnología para...

Se realizó Fiber Connect LATAM 2025 en México

Se realizó Fiber Connect LATAM 2025 en México

México. Inteligencia artificial, crecimiento de redes de fibra óptica, optimización de consumo energético, y principalmente, crecimiento de instalaciones de data center en diversas regiones de...

Medellín abre convocatoria para formar en industria musical

Medellín abre convocatoria para formar en industria musical

Colombia. La Administración Distrital de Medellín abrió la convocatoria para Medellín Music Lab, un programa que busca formar a 400 jóvenes entre los 14 y 28 años en diferentes áreas de la industria...

El corazón de actividades digitales está en Centros de Datos

El corazón de actividades digitales está en Centros de Datos

México. Con motivo del Día Internacional del Centro de Datos, que se conmemoró unas semanas atrás, se expone la relevancia de estas infraestructuras tecnológicas en nuestra vida diaria y en el...

10 de abril es el Building Automation Days by KNX Latam virtual

10 de abril es el Building Automation Days by KNX Latam virtual

Latinoamérica. El próximo jueves, 10 de abril, KNX Latinoamérica te invita a asistir al primer Building Automation Days virtual edición Chile. Bajo la temática; Desenmascarando mitos de KNX: Todo lo...

Hikvision presenta su nueva Web de Displays para Latam

Hikvision presenta su nueva Web de Displays para Latam

Latinoamérica. Hikvision lanzó su nueva página web para América Latina. Este nuevo portal está diseñado para ofrecer información detallada sobre las últimas innovaciones en pantallas y displays,...

Con

Con "Make It Happen", Panduit impulsa transformación digital

Latinoamérica. En el último año, la transformación digital en Latinoamérica y de acuerdo con el Think Digital Report 2023 de Inesdi Business School, México lidera este proceso en la región, con un...

Felipe Vasco se suma al equipo de Vertiv para América Latina

Felipe Vasco se suma al equipo de Vertiv para América Latina

Latinoamérica. Felipe Vasco ha sido nombrado nuevo director de aplicaciones tecnológicas para Vertiv América Latina. En este cargo, liderará a decenas de profesionales con experiencia...

Suscribase Gratis
Recuérdeme
SUSCRÍBASE AL INFO-BOLETIN
¿REQUIERE UNA COTIZACIÓN?
ENTREVISTAS DESTACADAS
PATROCINADORES










ULTIMO BOLETIN
Ultimo Info-Boletin