Seleccione su idioma

Hablando claro el sistema entiende

altDesde 1990 comenzaron las investigaciones sobre los sistemas controlados mediante comandos de voz. En los últimos años se han conocido sistemas con aplicaciones útiles y comercialmente viables para desarrolladores y consumidores.

Por Richard Santa


En este mundo cada vez más convulsionado, en el cual el tiempo no alcanza y las personas buscan realizar varias actividades a la vez, la tendencia en desarrollos tecnológicos es hacer más fácil la vida de todos. Por eso, ahora los fabricantes apuntan a equipos y sistemas que puedan controlarse mediante la voz.

Google es uno de los principales jalonadores de esta tecnología. En su más reciente Conferencia de desarrolladores realizada en mayo, presentó el sistema de reconocimiento por voz para el buscador, mediante el cual permite realizar preguntas y obtener las respuestas habladas.

- Publicidad -

Este nuevo sistema de búsqueda requiere el uso del navegador Google Chrome versión 27 o superior para su funcionamiento y autorización para que el programa pueda usar el micrófono del computador.

Y aunque ésta ha sido toda una novedad, las críticas no le han faltado. Una es por el idioma, debido a que solo está disponible para inglés, sin importar qué idioma sea el predeterminado en la cuenta de Google. Otro problema reportado es que muchas veces al intentar usarlo sale error en la página, pero los directivos de la compañía han indicado que se debe al exceso de uso de la plataforma en sus primeros días.

Uno de los anuncios más esperados de la Google I/O 2013 por parte de los adictos a la tecnología, eran los detalles de las Google Glass. Se conoció que éstas también incluyen un comando de voz para ejecutar acciones como tomar fotos, ubicar en mapas o usar internet.  

Otra de las aplicaciones del gigante tecnológico que también usa comandos por voz es Google Now, un asistente personal inteligente disponible para el sistema operativo Android e iOS, que utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer recomendaciones, y actuar al delegar las solicitudes a un conjunto de servicios web.

Los tres productos de Google con funciones a través de comandos de voz comparten la misma dificultad, actualmente solo funcionan con el idioma inglés, y los que tienen opciones en español, como Google Now, presentan problemas con el reconocimiento del lenguaje. Pero muy seguramente esta restricción del idioma será superada en los próximos meses.

No es el único
Google no es el único desarrollador tecnológico que está trabajando en comandos de voz. La compañía NEC informó hace poco que sus investigadores desarrollan actualmente un sistema de control de voz para smartphone que permitirá superar uno de los principales problemas que tienen estos sistemas, el ruido ambiente.

NEC encontró una solución a las situaciones con intenso ruido que no permitían el uso de los comandos de voz. Su sistema funcionará mediante dos micrófonos, uno captará el ruido ambiente y otro exclusivamente los diferentes tipos de voz. De esta forma se evita tener que acercarse demasiado el micrófono a la boca para que el dispositivo pueda funcionar bien.

- Publicidad -

En el mismo sentido trabaja Sherpa, un asistente virtual que permite ejecutar y agendar las tareas mediante órdenes de voz. Este desarrollo español ha sido muy bien acogido debido a que su idioma nativo es el español. En sus primeros seis meses alcanzó el medio millón de descargas.

Expertos han señalado que es una mejor versión que el Google Now por su manejo del idioma español. Por eso, sus creadores decidieron aprovechar este éxito y actualmente se encuentran trabajando en la aplicación que les permitirá tener presencia en las Google Glass.



Por su parte, Apple tampoco se ha quedado atrás y durante 2011 lanzó su teléfono iPhone 4S con la aplicación Siri, que utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de las solicitudes a un conjunto de servicios web que va en aumento. Una de sus ventajas es que se adapta a las preferencias individuales del usuario con el paso del tiempo y personaliza los resultados, así como realizando tareas como reservar mesa para cenar o pedir un taxi.

Otras aplicaciones
Los comandos por voz han sido beneficiados por el auge de los dispositivos móviles, debido a que la mayoría de las aplicaciones están dirigidas a estos equipos. Pero no son los únicos. Como vimos anteriormente, las aplicaciones de voz para Google ya se pueden usar en su buscador desde cualquier dispositivo o computador.

También, el sistema en el que trabaja NEC pretende ser de utilidad para otras industrias, como las fábricas o tiendas, las cuales podrán verse beneficiadas con el manejo de las máquinas mediante voz permitiendo a los empleados realizar otras actividades a la vez usando las manos.

Windows 7 también trajo por primera vez comandos de voz para algunas de sus aplicaciones, como la administración de música tras la configuración del sistema y la grabación de los comandos a utilizar. Incluso, las consolas de juegos, como el Xbox 360, hoy cuentan con este tipo de servicios.

- Publicidad -

Algunos de los más beneficiados con los comandos por voz han sido las personas que tienen algún tipo de discapacidad, quienes han encontrado soluciones para facilitar la accesibilidad, sobre todo cuando tienen dificultades motrices o de movilidad.

Tipos y usos
En general, los comandos de voz buscan permitir una comunicación entre los humanos y las máquinas, pero algunos teóricos aseguran los principales retos de estos sistemas están en las formas del lenguaje (fonética, semántica, acento, entre otras) para tener una aceptación del mensaje correcto y una respuesta adecuada.  

Actualmente las soluciones de comando por voz están clasificadas en varias opciones. Por ejemplo, si requiere un entrenamiento previo antes de empezar a usarse, o si es accesible para cualquier persona o solo está en capacidad de reconocer solo un usuario.

También se deben diferenciar si el sistema permite que el usuario hable de corrido o debe pronunciar palabra por palabra, dando un corto espacio de tiempo entre cada una para facilitar el reconocimiento. Y un factor fundamental, es tener claro cuáles son las funciones que reconoce el sistema, si tiene algunas frases predeterminadas o un lenguaje extenso.

Aunque muchos ven en los comandos de voz soluciones a problemas cotidianos e incluso facilitando la vida en acciones comunes, es claro que esta es una tecnología en proceso de investigación y desarrollo para lograr una funcionalidad óptima. Un caso particular sería el de los conductores.

Muchos han hablado de lo útil que pueden resultar los comandos de voz para las personas cuando están frente al volante. Pero hay estudios académicos que han llamado la atención sobre el riesgo que éstos podrían traer para los conductores. El instituto de transporte de Texas, dependencia de la Universidad A&M, sostuvo en una reciente investigación que estas funciones podrían ser más peligrosas que chatiar cuando se está al volante.

Señalan que estos sistemas requieren mucha más atención, porque en la mayoría de las ocasiones se debe corregir la orden dada al dispositivo, lo que reduce el tiempo de reacción del conductor ante un imprevisto en la vía. Este sería un problema más que se le suma al conflicto que tiene combinar el volante con los dispositivos móviles.

Pero al ritmo que avanzan hoy las investigaciones y con el interés de tantas compañías por desarrollar sus aplicaciones, es posible que en un par de años su funcionalidad sea mayor, sobre todo, solucionando problemas como la distorsión que puede generar el sonido ambiente, los usos en diferentes idiomas, el reconocimiento de las diferentes características del hablante y hasta las distracciones para los conductores.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No hay comentarios

Deje su comentario

En respuesta a Some User
Fiesta Alegría en ISE 2026, con la casa llena

Fiesta Alegría en ISE 2026, con la casa llena

ISE. El restaurante La Pepa de Barcelona, sirvió de sede para la Fiesta Alegría, el encuentro de los latinos que asistieron a Integrated Systems Europe 2026, organizado por AVI Latinoamérica.

aeris group es nombrado Dante Certified Trainer para Latam

aeris group es nombrado Dante Certified Trainer para Latam

Latinoamérica. aeris group fue designado como Dante Certified Trainer para Latinoamérica a través de sus especialistas en Pro Audio Diego Cárdenas e Israel Moncayo, fortaleciendo una alianza...

Sony evoluciona pantallas de gran tamaño con nuevas Bravia

Sony evoluciona pantallas de gran tamaño con nuevas Bravia

ISE. Sony presentará 16 pantallas profesionales Bravia, la serie BZ-P mejoradas, que abarcan el modelo insignia BZ40P, opciones del modelo mejorado BZ35P y alternativas del modelo central BZ30P. 

Absen demuestra el poder de la colaboración en ISE 2026

Absen demuestra el poder de la colaboración en ISE 2026

ISE. En el marco de su 25º aniversario, Absen demostrará el poder de la colaboración durante ISE 2026, desde su stand 3M400. A lo largo del evento, la compañía presentará experiencias visuales...

Tecnología protagonista, pero invisible

Tecnología protagonista, pero invisible

Ultimate Tecnhnology, integrador colombiano, ganó el premio CALA Awards 2025 en su categoría Mejor proyecto de Iluminación. Estos son los detalles del proyecto realizado.  Richard Santa 

PlexusAV lanza nuevos codificadores y decodificadores IPMX

PlexusAV lanza nuevos codificadores y decodificadores IPMX

Latinoamérica. PlexusAV, la división de AV profesional de Sencore, especializada en soluciones AV-over-IP centradas en las personas, presentará en ISE 2026 una amplia gama de nuevos productos. 

IntelliMix Bar Pro de Shure potencia colaboración con IA

IntelliMix Bar Pro de Shure potencia colaboración con IA

ISE. Shure lanza IntelliMix Bar Pro, una barra de video todo en uno diseñada para resolver los desafíos cotidianos de TI en salas de reuniones. La más reciente incorporación a su cartera de...

Mimo busca crecer en Latam con alianza con Footprint

Mimo busca crecer en Latam con alianza con Footprint

ISE. El fabricante de pantallas comerciales de formato pequeño, tablets y soluciones AV, Mimo, anunció una alianza estratégica con Footprint Global, que actuará como representante comercial y...

HDBaseT celebra 15 años en ISE 2026

HDBaseT celebra 15 años en ISE 2026

ISE. La Alianza HDBaseT, celebra 15 años de la tecnología HDBaseT y su impacto duradero, que ha evolucionado continuamente para transformar la forma en que la industria diseña, implementa y...

UNLV establece estándar para captura en aulas con Pearl Nexus

UNLV establece estándar para captura en aulas con Pearl Nexus

Internacional. La University of Nevada, Las Vegas (UNLV) siempre ha estado a la vanguardia en el uso de tecnología para mejorar la experiencia educativa. Como una de las primeras instituciones en...

Suscribase Gratis
Recuérdeme
SUSCRÍBASE AL INFO-BOLETIN
¿REQUIERE UNA COTIZACIÓN?
ENTREVISTAS DESTACADAS
PATROCINADORES










ULTIMO BOLETIN
Ultimo Info-Boletin