Selecione seu Idioma

Falando claramente o sistema entende

altDesde 1990, a pesquisa começou em sistemas controlados por comandos de voz. Nos últimos anos, sistemas com aplicações úteis e comercialmente viáveis para desenvolvedores e consumidores têm sido conhecidos.

Por Richard Santa


Neste mundo cada vez mais convulsionado, em que o tempo não é suficiente e as pessoas buscam realizar diversas atividades ao mesmo tempo, a tendência na evolução tecnológica é facilitar a vida de todos. É por isso que os fabricantes estão agora mirando equipamentos e sistemas que podem ser controlados por voz.

O Google é um dos principais impulsionadores dessa tecnologia. Em sua mais recente Conferência de Desenvolvedores, em maio, apresentou o sistema de reconhecimento de voz para o mecanismo de busca, através do qual permite que você faça perguntas e obtenha as respostas faladas.

- Publicidad -

Este novo sistema de pesquisa requer o uso da versão 27 ou superior do navegador Google Chrome para seu funcionamento e autorização para que o programa possa usar o microfone do computador.

E embora isso tenha sido uma novidade, as críticas não têm faltado. Uma delas é por causa do idioma, porque ele só está disponível para inglês, não importa qual idioma seja o padrão na conta do Google. Outro problema relatado é que muitas vezes ao tentar usá-lo há um erro na página, mas os executivos da empresa indicaram que é devido ao uso excessivo da plataforma em seus primeiros dias.

Um dos anúncios mais esperados do Google I/O 2013 por viciados em tecnologia foram os detalhes do Google Glass. Sabia-se que estes também incluem um comando de voz para executar ações como tirar fotos, localizar em mapas ou usar a internet.

Outro dos aplicativos da gigante da tecnologia que também usa comandos de voz é o Google Now, um assistente pessoal inteligente disponível para o sistema operacional Android e iOS, que usa uma interface natural de usuário de linguagem para responder perguntas, fazer recomendações e agir delegando solicitações a um conjunto de serviços web.

Os três produtos do Google com recursos por meio de comandos de voz compartilham a mesma dificuldade, atualmente apenas trabalhando com a língua inglesa, e aqueles com opções em espanhol, como o Google Now, têm problemas com o reconhecimento de idiomas. Mas essa restrição linguística provavelmente será superada nos próximos meses.

Não é o único.
O Google não é o único desenvolvedor de tecnologia trabalhando em comandos de voz. A empresa NEC informou recentemente que seus pesquisadores estão desenvolvendo um sistema de controle de voz para smartphones que vai superar um dos principais problemas que esses sistemas têm, o ruído ambiente.

A NEC encontrou uma solução para situações com ruído intenso que não permitiam o uso de comandos de voz. Seu sistema funcionará através de dois microfones, um pegará o ruído ambiente e o outro exclusivamente os diferentes tipos de voz. Isso evita ter que chegar muito perto do microfone da boca para que o dispositivo possa funcionar bem.

- Publicidad -

No mesmo sentido funciona o Sherpa, um assistente virtual que permite executar e agendar tarefas através de comandos de voz. Este desenvolvimento espanhol foi muito bem recebido porque sua língua nativa é o espanhol. Em seus primeiros seis meses, alcançou meio milhão de downloads.

Especialistas apontaram que é uma versão melhor do que o Google Now para o seu manuseio da língua espanhola. Por isso, seus criadores decidiram aproveitar esse sucesso e atualmente estão trabalhando no aplicativo que permitirá que eles tenham presença no Google Glass.



Por sua vez, a Apple não foi deixada para trás e durante 2011 lançou seu telefone iPhone 4S com o aplicativo Siri, que usa processamento de linguagem natural para responder perguntas, fazer recomendações e realizar ações delegando solicitações a um conjunto de serviços web que está aumentando. Uma de suas vantagens é que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como reservar uma mesa para jantar ou pedir um táxi.

Outras aplicações
Os comandos de voz se beneficiaram do surgimento de dispositivos móveis, pois a maioria dos aplicativos são voltados para esses dispositivos. Mas eles não são os únicos. Como vimos anteriormente, aplicativos de voz para o Google já podem ser usados em seu mecanismo de busca a partir de qualquer dispositivo ou computador.

Além disso, o sistema em que a NEC trabalha visa ser útil para outras indústrias, como fábricas ou lojas, que podem se beneficiar do funcionamento de máquinas por voz permitindo que os funcionários realizem outras atividades ao mesmo tempo usando as mãos.

O Windows 7 também trouxe comandos de voz pela primeira vez para alguns de seus aplicativos, como o gerenciamento de música após a configuração do sistema e a gravação dos comandos a serem usados. Até mesmo consoles de jogos, como o Xbox 360, hoje têm esse tipo de serviço.

- Publicidad -

Alguns dos mais beneficiados por comandos de voz foram pessoas que têm algum tipo de deficiência, que encontraram soluções para facilitar a acessibilidade, especialmente quando têm dificuldades de motor ou de mobilidade.

Tipos e usos
Em geral, os comandos de voz buscam permitir a comunicação entre humanos e máquinas, mas alguns teóricos dizem que os principais desafios desses sistemas estão nas formas de linguagem (fonética, semântica, sotaque, entre outros) para ter uma aceitação da mensagem correta e uma resposta adequada.

Atualmente, as soluções de comando de voz são classificadas em várias opções. Por exemplo, se ele requer treinamento prévio antes de começar a ser usado, ou se ele é acessível a alguém ou só é capaz de reconhecer apenas um usuário.

Também deve ser diferenciado se o sistema permitir que o usuário fale em uma fileira ou deve pronunciar palavra por palavra, dando um curto espaço de tempo entre cada um para facilitar o reconhecimento. E um fator fundamental é ser claro sobre quais são as funções que o sistema reconhece, se tem algumas frases predeterminadas ou uma linguagem extensa.

Embora muitos vejam em comandos de voz soluções para problemas cotidianos e até mesmo facilitando a vida em ações comuns, é claro que esta é uma tecnologia em processo de pesquisa e desenvolvimento para alcançar a funcionalidade ideal. Um caso em particular seria o dos motoristas.

Muitos falaram sobre como comandos de voz podem ser úteis para as pessoas quando estão ao volante. Mas há estudos acadêmicos que têm chamado a atenção para o risco que isso pode trazer aos motoristas. O Texas Transportation Institute, um departamento da Universidade A&M, disse em pesquisas recentes que essas funções poderiam ser mais perigosas do que conversar ao volante.

Eles apontam que esses sistemas requerem muito mais atenção, pois na maioria dos casos a ordem dada ao dispositivo deve ser corrigida, o que reduz o tempo de reação do motorista a um imprevisto na estrada. Este seria mais um problema que se soma ao conflito que tem que combinar o volante com dispositivos móveis.

Mas no ritmo que a pesquisa está avançando hoje e com o interesse de tantas empresas em desenvolver suas aplicações, é possível que em alguns anos sua funcionalidade seja maior, sobretudo, resolvendo problemas como a distorção que o som ambiente pode gerar, os usos em diferentes linguagens, o reconhecimento das diferentes características do alto-falante e até mesmo as distrações para os motoristas.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No comments

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.
• Se você já está registrado, faça o login primeiro. O seu email não será publicado.

Leave your comment

In reply to Some User
Lembre-se de se inscrever para a Fiesta Alegría no ISE 2026

Lembre-se de se inscrever para a Fiesta Alegría no ISE 2026

ISE. Uma nova feira ISE está chegando, e com ela o espaço mais aguardado para os latinos que frequentam Barcelona: a Fiesta Alegría, um evento organizado pela AVI América Latina.

A AEQ contribuiu com seu Interfone para o concerto de Manuel Turizo

A AEQ contribuiu com seu Interfone para o concerto de Manuel Turizo

México. O artista colombiano Manuel Turizo ofereceu um concerto massivo na Arena Guadalajara como parte de sua turnê internacional "201 Tour" em 2 de dezembro, com tecnologia AEQ para a gestão das...

Almo Pro AV representará a Inogeni nos EUA e na América Latina

Almo Pro AV representará a Inogeni nos EUA e na América Latina

América Latina. O fabricante de soluções de videoconferência e audioconferência, Inogeni, firmou um acordo estratégico de distribuição com a Almo Pro AV, tanto para os Estados Unidos quanto para a...

Apple, Google e o novo mapa da inteligência artificial

Apple, Google e o novo mapa da inteligência artificial

América Latina. A Inteligência Artificial (IA) está se tornando o novo sistema operacional do mundo digital. O que há apenas três anos parecia um experimento interessante agora está no centro da...

Mercado Libre em Bogotá: Um Centro de Tecnologia

Mercado Libre em Bogotá: Um Centro de Tecnologia

O projeto foi desenvolvido em fases, abrangendo um total de cinco andares e 4.500 metros quadrados de construção. Richard Santa

A VuWall Introduziu Decodificador 4K Compacto para Salas de Controle

A VuWall Introduziu Decodificador 4K Compacto para Salas de Controle

América Latina. Pak One é o novo decodificador 4K compacto, de saída única e canal único da VuWall, projetado para salas de controle modernas que exigem distribuição de vídeo eficiente e de alta...

Q-SYS integra-se ao ServiceNow para conectar AV e TI

Q-SYS integra-se ao ServiceNow para conectar AV e TI

América Latina. A QSC anunciou uma nova integração com o ServiceNow para ajudar os clientes a otimizar fluxos de trabalho de AV e TI. Essa colaboração integra os dados Q-SYS com a plataforma de IA...

Tendências de Data Center 2026 Segundo a Vertiv

Tendências de Data Center 2026 Segundo a Vertiv

América Latina. A inovação em data centers continua sendo moldada por forças macro e tendências tecnológicas relacionadas à IA, segundo um relatório da Vertiv Frontiers.

A Fiesta Alegría do ISE 2026 será em 3 de fevereiro

A Fiesta Alegría do ISE 2026 será em 3 de fevereiro

ISE. Uma nova feira ISE está chegando, e com ela o espaço mais aguardado para os latinos que frequentam Barcelona: a Fiesta Alegría, um evento organizado pela AVI América Latina.

O novo Fuze Wash 250 da Elation já está disponível

O novo Fuze Wash 250 da Elation já está disponível

América Latina. A Elation expandiu sua família de luzes Fuze de alta performance e alta qualidade com o Fuze Wash 250, um poderoso cabeçote móvel LED de espectro completo para Fresnel, projetado...

Suscribase Gratis
Lembre-se de mim
INSCREVA-SE NO BOLETIM INFORMATIVO
VOCÊ PRECISA DE UMA COTAÇÃO?
ENTREVISTAS EM DESTAQUE
PATROCINADORES










ÚLTIMO BOLETIM
Ultimo Info-Boletin