Seleccione su idioma

Hablando claro el sistema entiende

altDesde 1990 comenzaron las investigaciones sobre los sistemas controlados mediante comandos de voz. En los últimos años se han conocido sistemas con aplicaciones útiles y comercialmente viables para desarrolladores y consumidores.

Por Richard Santa


En este mundo cada vez más convulsionado, en el cual el tiempo no alcanza y las personas buscan realizar varias actividades a la vez, la tendencia en desarrollos tecnológicos es hacer más fácil la vida de todos. Por eso, ahora los fabricantes apuntan a equipos y sistemas que puedan controlarse mediante la voz.

Google es uno de los principales jalonadores de esta tecnología. En su más reciente Conferencia de desarrolladores realizada en mayo, presentó el sistema de reconocimiento por voz para el buscador, mediante el cual permite realizar preguntas y obtener las respuestas habladas.

- Publicidad -

Este nuevo sistema de búsqueda requiere el uso del navegador Google Chrome versión 27 o superior para su funcionamiento y autorización para que el programa pueda usar el micrófono del computador.

Y aunque ésta ha sido toda una novedad, las críticas no le han faltado. Una es por el idioma, debido a que solo está disponible para inglés, sin importar qué idioma sea el predeterminado en la cuenta de Google. Otro problema reportado es que muchas veces al intentar usarlo sale error en la página, pero los directivos de la compañía han indicado que se debe al exceso de uso de la plataforma en sus primeros días.

Uno de los anuncios más esperados de la Google I/O 2013 por parte de los adictos a la tecnología, eran los detalles de las Google Glass. Se conoció que éstas también incluyen un comando de voz para ejecutar acciones como tomar fotos, ubicar en mapas o usar internet.  

Otra de las aplicaciones del gigante tecnológico que también usa comandos por voz es Google Now, un asistente personal inteligente disponible para el sistema operativo Android e iOS, que utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer recomendaciones, y actuar al delegar las solicitudes a un conjunto de servicios web.

Los tres productos de Google con funciones a través de comandos de voz comparten la misma dificultad, actualmente solo funcionan con el idioma inglés, y los que tienen opciones en español, como Google Now, presentan problemas con el reconocimiento del lenguaje. Pero muy seguramente esta restricción del idioma será superada en los próximos meses.

No es el único
Google no es el único desarrollador tecnológico que está trabajando en comandos de voz. La compañía NEC informó hace poco que sus investigadores desarrollan actualmente un sistema de control de voz para smartphone que permitirá superar uno de los principales problemas que tienen estos sistemas, el ruido ambiente.

NEC encontró una solución a las situaciones con intenso ruido que no permitían el uso de los comandos de voz. Su sistema funcionará mediante dos micrófonos, uno captará el ruido ambiente y otro exclusivamente los diferentes tipos de voz. De esta forma se evita tener que acercarse demasiado el micrófono a la boca para que el dispositivo pueda funcionar bien.

- Publicidad -

En el mismo sentido trabaja Sherpa, un asistente virtual que permite ejecutar y agendar las tareas mediante órdenes de voz. Este desarrollo español ha sido muy bien acogido debido a que su idioma nativo es el español. En sus primeros seis meses alcanzó el medio millón de descargas.

Expertos han señalado que es una mejor versión que el Google Now por su manejo del idioma español. Por eso, sus creadores decidieron aprovechar este éxito y actualmente se encuentran trabajando en la aplicación que les permitirá tener presencia en las Google Glass.



Por su parte, Apple tampoco se ha quedado atrás y durante 2011 lanzó su teléfono iPhone 4S con la aplicación Siri, que utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de las solicitudes a un conjunto de servicios web que va en aumento. Una de sus ventajas es que se adapta a las preferencias individuales del usuario con el paso del tiempo y personaliza los resultados, así como realizando tareas como reservar mesa para cenar o pedir un taxi.

Otras aplicaciones
Los comandos por voz han sido beneficiados por el auge de los dispositivos móviles, debido a que la mayoría de las aplicaciones están dirigidas a estos equipos. Pero no son los únicos. Como vimos anteriormente, las aplicaciones de voz para Google ya se pueden usar en su buscador desde cualquier dispositivo o computador.

También, el sistema en el que trabaja NEC pretende ser de utilidad para otras industrias, como las fábricas o tiendas, las cuales podrán verse beneficiadas con el manejo de las máquinas mediante voz permitiendo a los empleados realizar otras actividades a la vez usando las manos.

Windows 7 también trajo por primera vez comandos de voz para algunas de sus aplicaciones, como la administración de música tras la configuración del sistema y la grabación de los comandos a utilizar. Incluso, las consolas de juegos, como el Xbox 360, hoy cuentan con este tipo de servicios.

- Publicidad -

Algunos de los más beneficiados con los comandos por voz han sido las personas que tienen algún tipo de discapacidad, quienes han encontrado soluciones para facilitar la accesibilidad, sobre todo cuando tienen dificultades motrices o de movilidad.

Tipos y usos
En general, los comandos de voz buscan permitir una comunicación entre los humanos y las máquinas, pero algunos teóricos aseguran los principales retos de estos sistemas están en las formas del lenguaje (fonética, semántica, acento, entre otras) para tener una aceptación del mensaje correcto y una respuesta adecuada.  

Actualmente las soluciones de comando por voz están clasificadas en varias opciones. Por ejemplo, si requiere un entrenamiento previo antes de empezar a usarse, o si es accesible para cualquier persona o solo está en capacidad de reconocer solo un usuario.

También se deben diferenciar si el sistema permite que el usuario hable de corrido o debe pronunciar palabra por palabra, dando un corto espacio de tiempo entre cada una para facilitar el reconocimiento. Y un factor fundamental, es tener claro cuáles son las funciones que reconoce el sistema, si tiene algunas frases predeterminadas o un lenguaje extenso.

Aunque muchos ven en los comandos de voz soluciones a problemas cotidianos e incluso facilitando la vida en acciones comunes, es claro que esta es una tecnología en proceso de investigación y desarrollo para lograr una funcionalidad óptima. Un caso particular sería el de los conductores.

Muchos han hablado de lo útil que pueden resultar los comandos de voz para las personas cuando están frente al volante. Pero hay estudios académicos que han llamado la atención sobre el riesgo que éstos podrían traer para los conductores. El instituto de transporte de Texas, dependencia de la Universidad A&M, sostuvo en una reciente investigación que estas funciones podrían ser más peligrosas que chatiar cuando se está al volante.

Señalan que estos sistemas requieren mucha más atención, porque en la mayoría de las ocasiones se debe corregir la orden dada al dispositivo, lo que reduce el tiempo de reacción del conductor ante un imprevisto en la vía. Este sería un problema más que se le suma al conflicto que tiene combinar el volante con los dispositivos móviles.

Pero al ritmo que avanzan hoy las investigaciones y con el interés de tantas compañías por desarrollar sus aplicaciones, es posible que en un par de años su funcionalidad sea mayor, sobre todo, solucionando problemas como la distorsión que puede generar el sonido ambiente, los usos en diferentes idiomas, el reconocimiento de las diferentes características del hablante y hasta las distracciones para los conductores.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No hay comentarios

Deje su comentario

En respuesta a Some User
Hotel Nöa, experiencia del huésped amplificada por el audio

Hotel Nöa, experiencia del huésped amplificada por el audio

Ecuador. Piñas, en la provincia de El Oro, Ecuador, es conocida como la "Orquídea de los Andes" y ofrece un ambiente de calma, gracias a sus paisajes montañosos y a su reserva ecológica. En este...

Manuel Ameneiros liderará ventas en Latam para Broadsign

Manuel Ameneiros liderará ventas en Latam para Broadsign

Latinoamérica. Broadsign designó a Manuel Ameneiros como Director de Ventas y Servicio de Medios para Latinoamérica (LATAM). Este nuevo cargo, que amplía la presencia regional de Broadsign, busca...

Aurora lanzó transceptor 4K AV sobre IP de con doble USB-C

Aurora lanzó transceptor 4K AV sobre IP de con doble USB-C

Latinoamérica. El nuevo VPX-TC1-UCP de la compañía Aurora no es solo un transceptor 4K, sino un sofisticado centro de distribución de energía PoE++. 

Absen presentó su nueva pantalla para eventos en vivo SA1.5

Absen presentó su nueva pantalla para eventos en vivo SA1.5

Latinoamérica. Absen lanzó la SA1.5, la última incorporación a su plataforma de pantallas para eventos en vivo, la Serie Saturn. Esta serie, un referente en el mercado de alquiler, destaca por su...

Powersoft lanzó promoción de intercambio de equipos

Powersoft lanzó promoción de intercambio de equipos

Latinoamérica. Las empresas de touring y rental que utilizan plataformas de amplificación antiguas ahora pueden entregar sus equipos viejos y obtener un importante descuento en un nuevo amplificador...

dBTechnologies apoyó escenario Lotus en Lollapalooza Chile

dBTechnologies apoyó escenario Lotus en Lollapalooza Chile

Chile. Lollapalooza Chile 2026 regresó al Parque O'Higgins, atrayendo a más de 300.000 asistentes durante tres días y reafirmando su posición como uno de los eventos de música en vivo más...

Spectera volvió a brillar en Lollapalooza Chile

Spectera volvió a brillar en Lollapalooza Chile

Chile. Sennheiser fue parte clave de Lollapalooza Chile 2026, acompañando a artistas, ingenieros de sonido, empresas de rental y equipos técnicos durante las tres jornadas de música y arte en vivo...

Discabos Group y Lecran fortalecen ecosistema Pro AV en Brasil

Discabos Group y Lecran fortalecen ecosistema Pro AV en Brasil

Brasil. Discabos Group y Lecran anunciaron una alianza estratégica con el objetivo de ampliar las oportunidades de negocio, generar mayor valor para el mercado Pro AV y fortalecer el ecosistema...

Pleneo Planner: diseño inteligente de salas en minutos

Pleneo Planner: diseño inteligente de salas en minutos

Latinoamérica. Pleneo presentó Planner, una nueva herramienta online que permite a distribuidores, integradores y usuarios finales diseñar salas de reuniones completas en pocos minutos, de forma...

Sennheiser lanza los audífonos cerrados HD 480 PRO

Sennheiser lanza los audífonos cerrados HD 480 PRO

Latinoamérica. Con los HD 480 PRO, Sennheiser lanza sus audífonos cerrados de gama alta para estudio y entornos en vivo. Diseñados con el mayor cuidado y precisión, eliminan los dos puntos más...

Suscribase Gratis
Recuérdeme
SUSCRÍBASE AL INFO-BOLETIN
¿REQUIERE UNA COTIZACIÓN?
ENTREVISTAS DESTACADAS
PATROCINADORES










ULTIMO BOLETIN
Ultimo Info-Boletin