Selecione seu Idioma

Falando claramente o sistema entende

altDesde 1990, a pesquisa começou em sistemas controlados por comandos de voz. Nos últimos anos, sistemas com aplicações úteis e comercialmente viáveis para desenvolvedores e consumidores têm sido conhecidos.

Por Richard Santa


Neste mundo cada vez mais convulsionado, em que o tempo não é suficiente e as pessoas buscam realizar diversas atividades ao mesmo tempo, a tendência na evolução tecnológica é facilitar a vida de todos. É por isso que os fabricantes estão agora mirando equipamentos e sistemas que podem ser controlados por voz.

O Google é um dos principais impulsionadores dessa tecnologia. Em sua mais recente Conferência de Desenvolvedores, em maio, apresentou o sistema de reconhecimento de voz para o mecanismo de busca, através do qual permite que você faça perguntas e obtenha as respostas faladas.

- Publicidad -

Este novo sistema de pesquisa requer o uso da versão 27 ou superior do navegador Google Chrome para seu funcionamento e autorização para que o programa possa usar o microfone do computador.

E embora isso tenha sido uma novidade, as críticas não têm faltado. Uma delas é por causa do idioma, porque ele só está disponível para inglês, não importa qual idioma seja o padrão na conta do Google. Outro problema relatado é que muitas vezes ao tentar usá-lo há um erro na página, mas os executivos da empresa indicaram que é devido ao uso excessivo da plataforma em seus primeiros dias.

Um dos anúncios mais esperados do Google I/O 2013 por viciados em tecnologia foram os detalhes do Google Glass. Sabia-se que estes também incluem um comando de voz para executar ações como tirar fotos, localizar em mapas ou usar a internet.

Outro dos aplicativos da gigante da tecnologia que também usa comandos de voz é o Google Now, um assistente pessoal inteligente disponível para o sistema operacional Android e iOS, que usa uma interface natural de usuário de linguagem para responder perguntas, fazer recomendações e agir delegando solicitações a um conjunto de serviços web.

Os três produtos do Google com recursos por meio de comandos de voz compartilham a mesma dificuldade, atualmente apenas trabalhando com a língua inglesa, e aqueles com opções em espanhol, como o Google Now, têm problemas com o reconhecimento de idiomas. Mas essa restrição linguística provavelmente será superada nos próximos meses.

Não é o único.
O Google não é o único desenvolvedor de tecnologia trabalhando em comandos de voz. A empresa NEC informou recentemente que seus pesquisadores estão desenvolvendo um sistema de controle de voz para smartphones que vai superar um dos principais problemas que esses sistemas têm, o ruído ambiente.

A NEC encontrou uma solução para situações com ruído intenso que não permitiam o uso de comandos de voz. Seu sistema funcionará através de dois microfones, um pegará o ruído ambiente e o outro exclusivamente os diferentes tipos de voz. Isso evita ter que chegar muito perto do microfone da boca para que o dispositivo possa funcionar bem.

- Publicidad -

No mesmo sentido funciona o Sherpa, um assistente virtual que permite executar e agendar tarefas através de comandos de voz. Este desenvolvimento espanhol foi muito bem recebido porque sua língua nativa é o espanhol. Em seus primeiros seis meses, alcançou meio milhão de downloads.

Especialistas apontaram que é uma versão melhor do que o Google Now para o seu manuseio da língua espanhola. Por isso, seus criadores decidiram aproveitar esse sucesso e atualmente estão trabalhando no aplicativo que permitirá que eles tenham presença no Google Glass.



Por sua vez, a Apple não foi deixada para trás e durante 2011 lançou seu telefone iPhone 4S com o aplicativo Siri, que usa processamento de linguagem natural para responder perguntas, fazer recomendações e realizar ações delegando solicitações a um conjunto de serviços web que está aumentando. Uma de suas vantagens é que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como reservar uma mesa para jantar ou pedir um táxi.

Outras aplicações
Os comandos de voz se beneficiaram do surgimento de dispositivos móveis, pois a maioria dos aplicativos são voltados para esses dispositivos. Mas eles não são os únicos. Como vimos anteriormente, aplicativos de voz para o Google já podem ser usados em seu mecanismo de busca a partir de qualquer dispositivo ou computador.

Além disso, o sistema em que a NEC trabalha visa ser útil para outras indústrias, como fábricas ou lojas, que podem se beneficiar do funcionamento de máquinas por voz permitindo que os funcionários realizem outras atividades ao mesmo tempo usando as mãos.

O Windows 7 também trouxe comandos de voz pela primeira vez para alguns de seus aplicativos, como o gerenciamento de música após a configuração do sistema e a gravação dos comandos a serem usados. Até mesmo consoles de jogos, como o Xbox 360, hoje têm esse tipo de serviço.

- Publicidad -

Alguns dos mais beneficiados por comandos de voz foram pessoas que têm algum tipo de deficiência, que encontraram soluções para facilitar a acessibilidade, especialmente quando têm dificuldades de motor ou de mobilidade.

Tipos e usos
Em geral, os comandos de voz buscam permitir a comunicação entre humanos e máquinas, mas alguns teóricos dizem que os principais desafios desses sistemas estão nas formas de linguagem (fonética, semântica, sotaque, entre outros) para ter uma aceitação da mensagem correta e uma resposta adequada.

Atualmente, as soluções de comando de voz são classificadas em várias opções. Por exemplo, se ele requer treinamento prévio antes de começar a ser usado, ou se ele é acessível a alguém ou só é capaz de reconhecer apenas um usuário.

Também deve ser diferenciado se o sistema permitir que o usuário fale em uma fileira ou deve pronunciar palavra por palavra, dando um curto espaço de tempo entre cada um para facilitar o reconhecimento. E um fator fundamental é ser claro sobre quais são as funções que o sistema reconhece, se tem algumas frases predeterminadas ou uma linguagem extensa.

Embora muitos vejam em comandos de voz soluções para problemas cotidianos e até mesmo facilitando a vida em ações comuns, é claro que esta é uma tecnologia em processo de pesquisa e desenvolvimento para alcançar a funcionalidade ideal. Um caso em particular seria o dos motoristas.

Muitos falaram sobre como comandos de voz podem ser úteis para as pessoas quando estão ao volante. Mas há estudos acadêmicos que têm chamado a atenção para o risco que isso pode trazer aos motoristas. O Texas Transportation Institute, um departamento da Universidade A&M, disse em pesquisas recentes que essas funções poderiam ser mais perigosas do que conversar ao volante.

Eles apontam que esses sistemas requerem muito mais atenção, pois na maioria dos casos a ordem dada ao dispositivo deve ser corrigida, o que reduz o tempo de reação do motorista a um imprevisto na estrada. Este seria mais um problema que se soma ao conflito que tem que combinar o volante com dispositivos móveis.

Mas no ritmo que a pesquisa está avançando hoje e com o interesse de tantas empresas em desenvolver suas aplicações, é possível que em alguns anos sua funcionalidade seja maior, sobretudo, resolvendo problemas como a distorção que o som ambiente pode gerar, os usos em diferentes linguagens, o reconhecimento das diferentes características do alto-falante e até mesmo as distrações para os motoristas.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No comments

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.
• Se você já está registrado, faça o login primeiro. O seu email não será publicado.

Leave your comment

In reply to Some User
Argentina e México sediaram as Jornadas de Automação Predial

Argentina e México sediaram as Jornadas de Automação Predial

América Latina. No dia 8 de outubro, o Novotel Hotel em Buenos Aires foi o cenário para os Building Automation Days by KNX LATAM, Argentina 2025 Edition.

Biamp adquire ativos da ClearOne

Biamp adquire ativos da ClearOne

América Latina. A Biamp anunciou a assinatura de um acordo para adquirir os ativos da ClearOne, incluindo propriedade intelectual e marcas registradas. Esta aquisição adiciona projetos de...

Habilidades digitais nas salas de aula contra as mudanças climáticas

Habilidades digitais nas salas de aula contra as mudanças climáticas

O POWAR STEAM permite que professores e alunos simulem condições climáticas, experimentem dados reais e promovam habilidades digitais e ambientais em sala de aula. Por Miguel Ángel Ossorio Vega /...

Avid lança nova versão do Pro Tools com áudio imersivo

Avid lança nova versão do Pro Tools com áudio imersivo

América Latina. A Avid apresentou o Pro Tools 2025.10, uma atualização repleta de recursos que oferece avanços importantes na criação de música imersiva e eficiência do fluxo de trabalho.

Planetário Galileo Galilei moderniza seus projetores com a Barco

Planetário Galileo Galilei moderniza seus projetores com a Barco

Argentina. O Planetário Galileu Galilei, referência cultural e científica em Buenos Aires, completou uma transformação tecnológica que posiciona suas projeções entre as mais avançadas da América...

Shure comemorou o centenário da marca no México

Shure comemorou o centenário da marca no México

México. Em 1925, Sidney Shure decidiu criar e iniciar as operações da marca Shure, então fabricante de componentes de rádio. A empresa teve um crescimento permanente que agora comemora seu primeiro...

NST Audio fortalece sua presença na Colômbia com a AVCOM

NST Audio fortalece sua presença na Colômbia com a AVCOM

Colômbia. O fabricante britânico de tecnologia de áudio profissional NST Audio, vem reforçar e complementar o portfólio de soluções para sistemas de som ao vivo e instalações da empresa AVCOM, que...

Demonstrações de áudio retornaram ao Caper Show com DAS Audio

Demonstrações de áudio retornaram ao Caper Show com DAS Audio

Argentina. Na última versão do Caper Show, as demonstrações de áudio profissionais foram realizadas novamente, uma atividade que estava suspensa desde a pandemia.

Relacart inclui IA em suas soluções de microfone

Relacart inclui IA em suas soluções de microfone

Argentina. A Relacart participou da Caper Show 2025, feira que foi realizada em Buenos Aires e serviu de palco para a empresa divulgar suas soluções para áudio instalado.

Yamaki representa Absen pela Colômbia

Yamaki representa Absen pela Colômbia

Colômbia. O distribuidor colombiano Yamaki acaba de adicionar o fabricante de telas de LED Absen ao portfólio de marcas que representa para o mercado colombiano.

Suscribase Gratis
Lembre-se de mim
INSCREVA-SE NO BOLETIM INFORMATIVO
VOCÊ PRECISA DE UMA COTAÇÃO?
ENTREVISTAS EM DESTAQUE
PATROCINADORES










ÚLTIMO BOLETIM
Ultimo Info-Boletin