Selecione seu Idioma

Falando claramente o sistema entende

altDesde 1990, a pesquisa começou em sistemas controlados por comandos de voz. Nos últimos anos, sistemas com aplicações úteis e comercialmente viáveis para desenvolvedores e consumidores têm sido conhecidos.

Por Richard Santa


Neste mundo cada vez mais convulsionado, em que o tempo não é suficiente e as pessoas buscam realizar diversas atividades ao mesmo tempo, a tendência na evolução tecnológica é facilitar a vida de todos. É por isso que os fabricantes estão agora mirando equipamentos e sistemas que podem ser controlados por voz.

O Google é um dos principais impulsionadores dessa tecnologia. Em sua mais recente Conferência de Desenvolvedores, em maio, apresentou o sistema de reconhecimento de voz para o mecanismo de busca, através do qual permite que você faça perguntas e obtenha as respostas faladas.

- Publicidad -

Este novo sistema de pesquisa requer o uso da versão 27 ou superior do navegador Google Chrome para seu funcionamento e autorização para que o programa possa usar o microfone do computador.

E embora isso tenha sido uma novidade, as críticas não têm faltado. Uma delas é por causa do idioma, porque ele só está disponível para inglês, não importa qual idioma seja o padrão na conta do Google. Outro problema relatado é que muitas vezes ao tentar usá-lo há um erro na página, mas os executivos da empresa indicaram que é devido ao uso excessivo da plataforma em seus primeiros dias.

Um dos anúncios mais esperados do Google I/O 2013 por viciados em tecnologia foram os detalhes do Google Glass. Sabia-se que estes também incluem um comando de voz para executar ações como tirar fotos, localizar em mapas ou usar a internet.

Outro dos aplicativos da gigante da tecnologia que também usa comandos de voz é o Google Now, um assistente pessoal inteligente disponível para o sistema operacional Android e iOS, que usa uma interface natural de usuário de linguagem para responder perguntas, fazer recomendações e agir delegando solicitações a um conjunto de serviços web.

Os três produtos do Google com recursos por meio de comandos de voz compartilham a mesma dificuldade, atualmente apenas trabalhando com a língua inglesa, e aqueles com opções em espanhol, como o Google Now, têm problemas com o reconhecimento de idiomas. Mas essa restrição linguística provavelmente será superada nos próximos meses.

Não é o único.
O Google não é o único desenvolvedor de tecnologia trabalhando em comandos de voz. A empresa NEC informou recentemente que seus pesquisadores estão desenvolvendo um sistema de controle de voz para smartphones que vai superar um dos principais problemas que esses sistemas têm, o ruído ambiente.

A NEC encontrou uma solução para situações com ruído intenso que não permitiam o uso de comandos de voz. Seu sistema funcionará através de dois microfones, um pegará o ruído ambiente e o outro exclusivamente os diferentes tipos de voz. Isso evita ter que chegar muito perto do microfone da boca para que o dispositivo possa funcionar bem.

- Publicidad -

No mesmo sentido funciona o Sherpa, um assistente virtual que permite executar e agendar tarefas através de comandos de voz. Este desenvolvimento espanhol foi muito bem recebido porque sua língua nativa é o espanhol. Em seus primeiros seis meses, alcançou meio milhão de downloads.

Especialistas apontaram que é uma versão melhor do que o Google Now para o seu manuseio da língua espanhola. Por isso, seus criadores decidiram aproveitar esse sucesso e atualmente estão trabalhando no aplicativo que permitirá que eles tenham presença no Google Glass.



Por sua vez, a Apple não foi deixada para trás e durante 2011 lançou seu telefone iPhone 4S com o aplicativo Siri, que usa processamento de linguagem natural para responder perguntas, fazer recomendações e realizar ações delegando solicitações a um conjunto de serviços web que está aumentando. Uma de suas vantagens é que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como reservar uma mesa para jantar ou pedir um táxi.

Outras aplicações
Os comandos de voz se beneficiaram do surgimento de dispositivos móveis, pois a maioria dos aplicativos são voltados para esses dispositivos. Mas eles não são os únicos. Como vimos anteriormente, aplicativos de voz para o Google já podem ser usados em seu mecanismo de busca a partir de qualquer dispositivo ou computador.

Além disso, o sistema em que a NEC trabalha visa ser útil para outras indústrias, como fábricas ou lojas, que podem se beneficiar do funcionamento de máquinas por voz permitindo que os funcionários realizem outras atividades ao mesmo tempo usando as mãos.

O Windows 7 também trouxe comandos de voz pela primeira vez para alguns de seus aplicativos, como o gerenciamento de música após a configuração do sistema e a gravação dos comandos a serem usados. Até mesmo consoles de jogos, como o Xbox 360, hoje têm esse tipo de serviço.

- Publicidad -

Alguns dos mais beneficiados por comandos de voz foram pessoas que têm algum tipo de deficiência, que encontraram soluções para facilitar a acessibilidade, especialmente quando têm dificuldades de motor ou de mobilidade.

Tipos e usos
Em geral, os comandos de voz buscam permitir a comunicação entre humanos e máquinas, mas alguns teóricos dizem que os principais desafios desses sistemas estão nas formas de linguagem (fonética, semântica, sotaque, entre outros) para ter uma aceitação da mensagem correta e uma resposta adequada.

Atualmente, as soluções de comando de voz são classificadas em várias opções. Por exemplo, se ele requer treinamento prévio antes de começar a ser usado, ou se ele é acessível a alguém ou só é capaz de reconhecer apenas um usuário.

Também deve ser diferenciado se o sistema permitir que o usuário fale em uma fileira ou deve pronunciar palavra por palavra, dando um curto espaço de tempo entre cada um para facilitar o reconhecimento. E um fator fundamental é ser claro sobre quais são as funções que o sistema reconhece, se tem algumas frases predeterminadas ou uma linguagem extensa.

Embora muitos vejam em comandos de voz soluções para problemas cotidianos e até mesmo facilitando a vida em ações comuns, é claro que esta é uma tecnologia em processo de pesquisa e desenvolvimento para alcançar a funcionalidade ideal. Um caso em particular seria o dos motoristas.

Muitos falaram sobre como comandos de voz podem ser úteis para as pessoas quando estão ao volante. Mas há estudos acadêmicos que têm chamado a atenção para o risco que isso pode trazer aos motoristas. O Texas Transportation Institute, um departamento da Universidade A&M, disse em pesquisas recentes que essas funções poderiam ser mais perigosas do que conversar ao volante.

Eles apontam que esses sistemas requerem muito mais atenção, pois na maioria dos casos a ordem dada ao dispositivo deve ser corrigida, o que reduz o tempo de reação do motorista a um imprevisto na estrada. Este seria mais um problema que se soma ao conflito que tem que combinar o volante com dispositivos móveis.

Mas no ritmo que a pesquisa está avançando hoje e com o interesse de tantas empresas em desenvolver suas aplicações, é possível que em alguns anos sua funcionalidade seja maior, sobretudo, resolvendo problemas como a distorção que o som ambiente pode gerar, os usos em diferentes linguagens, o reconhecimento das diferentes características do alto-falante e até mesmo as distrações para os motoristas.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No comments

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.
• Se você já está registrado, faça o login primeiro. O seu email não será publicado.

Leave your comment

In reply to Some User
Além da tela

Além da tela

A sinalética digital como eixo da comunicação inteligente no mundo físico. Jorge Sánchez*

Alternativas do Skype para usar em 2025

Alternativas do Skype para usar em 2025

América Latina. A Microsoft anunciou recentemente que encerrará o Skype, o serviço gratuito de chamadas de voz e vídeo pela Internet, em maio deste ano. O serviço, lançado em 2003, revolucionou a...

Vizrt integra zoom nativo ao Tricaster

Vizrt integra zoom nativo ao Tricaster

América Latina. A Vizrt anunciou sua parceria com a Zoom, para oferecer aos criadores de conteúdo novas ferramentas poderosas para produções híbridas ao vivo.

Shure e Haivision Alliance favorecem áudio para jornalistas móveis

Shure e Haivision Alliance favorecem áudio para jornalistas móveis

América Latina. A Shure anunciou sua colaboração com a Haivision, por meio da qual o microfone sem fio Shure MoveMic agora pode ser emparelhado diretamente com dispositivos móveis dentro do...

Exertis Almo relança portfólio de serviços sob o LinkLab

Exertis Almo relança portfólio de serviços sob o LinkLab

América Latina. A Exertis Almo relançou oficialmente seu portfólio consolidado de serviços sob a nova marca LinkLab. Essa coleção de serviços beneficia os integradores, dando-lhes acesso a uma gama...

Visual Productions lançou controlador de iluminação

Visual Productions lançou controlador de iluminação

América Latina. O SpiNode é um controlador SPI autônomo de 4 portas, lançado recentemente pela Visual Productions. Ele foi projetado para converter facilmente Art-Net e sACN em SPI, preenchendo a...

Oso Colmenero amplia sua presença no México

Oso Colmenero amplia sua presença no México

México. Com uma nova marca representada e um novo membro de sua equipe, o distribuidor de produtos de iluminação e áudio, Oso Colmenero, expande sua presença no México.

Samsung aposta em tecnologia para educação sem limites

Samsung aposta em tecnologia para educação sem limites

Colômbia. Em um mundo onde a digitalização avança a passos largos, a educação não pode ser deixada para trás. A Samsung desenvolveu um ecossistema de produtos que transformam a forma como alunos e...

Papel fundamental dos dispositivos no novo ecossistema IoT

Papel fundamental dos dispositivos no novo ecossistema IoT

Colômbia. A digitalização das operações em setores estratégicos como transporte, logística, saúde e segurança tornou os dispositivos IoT um pilar fundamental para garantir a conectividade e a...

Epson escolhida para ação para lidar com as mudanças climáticas

Epson escolhida para ação para lidar com as mudanças climáticas

América Latina. A Epson foi incluída na Lista A do CDP pelo quinto ano consecutivo. Esta organização internacional sem fins lucrativos atribuiu à Epson a classificação mais alta em ação climática,...

Suscribase Gratis
Lembre-se de mim
INSCREVA-SE NO BOLETIM INFORMATIVO
VOCÊ PRECISA DE UMA COTAÇÃO?
ENTREVISTAS EM DESTAQUE
PATROCINADORES










ÚLTIMO BOLETIM
Ultimo Info-Boletin