Cuenta
Favor esperar un momento.

¿No tiene cuenta? Haga su registro.

×

Hablando claro el sistema entiende

altDesde 1990 comenzaron las investigaciones sobre los sistemas controlados mediante comandos de voz. En los últimos años se han conocido sistemas con aplicaciones útiles y comercialmente viables para desarrolladores y consumidores.

Por Richard Santa


En este mundo cada vez más convulsionado, en el cual el tiempo no alcanza y las personas buscan realizar varias actividades a la vez, la tendencia en desarrollos tecnológicos es hacer más fácil la vida de todos. Por eso, ahora los fabricantes apuntan a equipos y sistemas que puedan controlarse mediante la voz.

Google es uno de los principales jalonadores de esta tecnología. En su más reciente Conferencia de desarrolladores realizada en mayo, presentó el sistema de reconocimiento por voz para el buscador, mediante el cual permite realizar preguntas y obtener las respuestas habladas.

- Publicidad -

Este nuevo sistema de búsqueda requiere el uso del navegador Google Chrome versión 27 o superior para su funcionamiento y autorización para que el programa pueda usar el micrófono del computador.

Y aunque ésta ha sido toda una novedad, las críticas no le han faltado. Una es por el idioma, debido a que solo está disponible para inglés, sin importar qué idioma sea el predeterminado en la cuenta de Google. Otro problema reportado es que muchas veces al intentar usarlo sale error en la página, pero los directivos de la compañía han indicado que se debe al exceso de uso de la plataforma en sus primeros días.

Uno de los anuncios más esperados de la Google I/O 2013 por parte de los adictos a la tecnología, eran los detalles de las Google Glass. Se conoció que éstas también incluyen un comando de voz para ejecutar acciones como tomar fotos, ubicar en mapas o usar internet.  

Otra de las aplicaciones del gigante tecnológico que también usa comandos por voz es Google Now, un asistente personal inteligente disponible para el sistema operativo Android e iOS, que utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer recomendaciones, y actuar al delegar las solicitudes a un conjunto de servicios web.

Los tres productos de Google con funciones a través de comandos de voz comparten la misma dificultad, actualmente solo funcionan con el idioma inglés, y los que tienen opciones en español, como Google Now, presentan problemas con el reconocimiento del lenguaje. Pero muy seguramente esta restricción del idioma será superada en los próximos meses.

No es el único
Google no es el único desarrollador tecnológico que está trabajando en comandos de voz. La compañía NEC informó hace poco que sus investigadores desarrollan actualmente un sistema de control de voz para smartphone que permitirá superar uno de los principales problemas que tienen estos sistemas, el ruido ambiente.

NEC encontró una solución a las situaciones con intenso ruido que no permitían el uso de los comandos de voz. Su sistema funcionará mediante dos micrófonos, uno captará el ruido ambiente y otro exclusivamente los diferentes tipos de voz. De esta forma se evita tener que acercarse demasiado el micrófono a la boca para que el dispositivo pueda funcionar bien.

- Publicidad -

En el mismo sentido trabaja Sherpa, un asistente virtual que permite ejecutar y agendar las tareas mediante órdenes de voz. Este desarrollo español ha sido muy bien acogido debido a que su idioma nativo es el español. En sus primeros seis meses alcanzó el medio millón de descargas.

Expertos han señalado que es una mejor versión que el Google Now por su manejo del idioma español. Por eso, sus creadores decidieron aprovechar este éxito y actualmente se encuentran trabajando en la aplicación que les permitirá tener presencia en las Google Glass.



Por su parte, Apple tampoco se ha quedado atrás y durante 2011 lanzó su teléfono iPhone 4S con la aplicación Siri, que utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de las solicitudes a un conjunto de servicios web que va en aumento. Una de sus ventajas es que se adapta a las preferencias individuales del usuario con el paso del tiempo y personaliza los resultados, así como realizando tareas como reservar mesa para cenar o pedir un taxi.

Otras aplicaciones
Los comandos por voz han sido beneficiados por el auge de los dispositivos móviles, debido a que la mayoría de las aplicaciones están dirigidas a estos equipos. Pero no son los únicos. Como vimos anteriormente, las aplicaciones de voz para Google ya se pueden usar en su buscador desde cualquier dispositivo o computador.

También, el sistema en el que trabaja NEC pretende ser de utilidad para otras industrias, como las fábricas o tiendas, las cuales podrán verse beneficiadas con el manejo de las máquinas mediante voz permitiendo a los empleados realizar otras actividades a la vez usando las manos.

Windows 7 también trajo por primera vez comandos de voz para algunas de sus aplicaciones, como la administración de música tras la configuración del sistema y la grabación de los comandos a utilizar. Incluso, las consolas de juegos, como el Xbox 360, hoy cuentan con este tipo de servicios.

- Publicidad -

Algunos de los más beneficiados con los comandos por voz han sido las personas que tienen algún tipo de discapacidad, quienes han encontrado soluciones para facilitar la accesibilidad, sobre todo cuando tienen dificultades motrices o de movilidad.

Tipos y usos
En general, los comandos de voz buscan permitir una comunicación entre los humanos y las máquinas, pero algunos teóricos aseguran los principales retos de estos sistemas están en las formas del lenguaje (fonética, semántica, acento, entre otras) para tener una aceptación del mensaje correcto y una respuesta adecuada.  

Actualmente las soluciones de comando por voz están clasificadas en varias opciones. Por ejemplo, si requiere un entrenamiento previo antes de empezar a usarse, o si es accesible para cualquier persona o solo está en capacidad de reconocer solo un usuario.

También se deben diferenciar si el sistema permite que el usuario hable de corrido o debe pronunciar palabra por palabra, dando un corto espacio de tiempo entre cada una para facilitar el reconocimiento. Y un factor fundamental, es tener claro cuáles son las funciones que reconoce el sistema, si tiene algunas frases predeterminadas o un lenguaje extenso.

Aunque muchos ven en los comandos de voz soluciones a problemas cotidianos e incluso facilitando la vida en acciones comunes, es claro que esta es una tecnología en proceso de investigación y desarrollo para lograr una funcionalidad óptima. Un caso particular sería el de los conductores.

Muchos han hablado de lo útil que pueden resultar los comandos de voz para las personas cuando están frente al volante. Pero hay estudios académicos que han llamado la atención sobre el riesgo que éstos podrían traer para los conductores. El instituto de transporte de Texas, dependencia de la Universidad A&M, sostuvo en una reciente investigación que estas funciones podrían ser más peligrosas que chatiar cuando se está al volante.

Señalan que estos sistemas requieren mucha más atención, porque en la mayoría de las ocasiones se debe corregir la orden dada al dispositivo, lo que reduce el tiempo de reacción del conductor ante un imprevisto en la vía. Este sería un problema más que se le suma al conflicto que tiene combinar el volante con los dispositivos móviles.

Pero al ritmo que avanzan hoy las investigaciones y con el interés de tantas compañías por desarrollar sus aplicaciones, es posible que en un par de años su funcionalidad sea mayor, sobre todo, solucionando problemas como la distorsión que puede generar el sonido ambiente, los usos en diferentes idiomas, el reconocimiento de las diferentes características del hablante y hasta las distracciones para los conductores.

Richard Santa, RAVT
Author: Richard Santa, RAVT
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.

No hay ideas en “Hablando claro el sistema entiende”

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.

Deje su comentario

En respuesta a Some User
Suscribase Gratis
SUSCRÍBASE AL INFO-BOLETIN
¿REQUIERE UNA COTIZACIÓN?
ENTREVISTAS DESTACADAS

Webinar: Soluciones de proyección profesionales Epson

Epson presenta las innovaciones en su línea de productos, con los principales diferenciales y beneficios para instalaciones profesionales en educación, corporativo y grandes eventos. Por: Gabriel Goncalves, Gerente de Producto Regional Epson America Inc. https://www.avilatinoamerica.com/20...

KNX DAYS VIRTUAL ARGENTINA 2023

KNX DAYS MEXICO 2023 - Sesión 5: PANEL - Avances generales y proyectos de KNX en el país

KNX DAYS MEXICO 2023 - Sesión 4: Bienvenido al futuro de casas/edificios inteligentes con KNX IoTech

Ing. Edgar Iván Cienfuegos, Automatización de edificios - ESTÉVEZ https://www.knxlatinamerica.org/mex...

KNX DAYS MEXICO 2023 - Sesión 3: Visualización de información en una instalación KNX

Jahaziel Zaid Márquez Hernández, Especialista en marketing de productos - Soluciones de automatización del hogar y edificios / Dispositivos de eficiencia energética - ABB https://www.knxlatinamerica.org/mex...
Load more...
PATROCINADORES










ULTIMO BOLETIN
Ultimo Info-Boletin