Selecione seu Idioma

Falando claramente o sistema entende

altDesde 1990, a pesquisa começou em sistemas controlados por comandos de voz. Nos últimos anos, sistemas com aplicações úteis e comercialmente viáveis para desenvolvedores e consumidores têm sido conhecidos.

Por Richard Santa


Neste mundo cada vez mais convulsionado, em que o tempo não é suficiente e as pessoas buscam realizar diversas atividades ao mesmo tempo, a tendência na evolução tecnológica é facilitar a vida de todos. É por isso que os fabricantes estão agora mirando equipamentos e sistemas que podem ser controlados por voz.

O Google é um dos principais impulsionadores dessa tecnologia. Em sua mais recente Conferência de Desenvolvedores, em maio, apresentou o sistema de reconhecimento de voz para o mecanismo de busca, através do qual permite que você faça perguntas e obtenha as respostas faladas.

- Publicidad -

Este novo sistema de pesquisa requer o uso da versão 27 ou superior do navegador Google Chrome para seu funcionamento e autorização para que o programa possa usar o microfone do computador.

E embora isso tenha sido uma novidade, as críticas não têm faltado. Uma delas é por causa do idioma, porque ele só está disponível para inglês, não importa qual idioma seja o padrão na conta do Google. Outro problema relatado é que muitas vezes ao tentar usá-lo há um erro na página, mas os executivos da empresa indicaram que é devido ao uso excessivo da plataforma em seus primeiros dias.

Um dos anúncios mais esperados do Google I/O 2013 por viciados em tecnologia foram os detalhes do Google Glass. Sabia-se que estes também incluem um comando de voz para executar ações como tirar fotos, localizar em mapas ou usar a internet.

Outro dos aplicativos da gigante da tecnologia que também usa comandos de voz é o Google Now, um assistente pessoal inteligente disponível para o sistema operacional Android e iOS, que usa uma interface natural de usuário de linguagem para responder perguntas, fazer recomendações e agir delegando solicitações a um conjunto de serviços web.

Os três produtos do Google com recursos por meio de comandos de voz compartilham a mesma dificuldade, atualmente apenas trabalhando com a língua inglesa, e aqueles com opções em espanhol, como o Google Now, têm problemas com o reconhecimento de idiomas. Mas essa restrição linguística provavelmente será superada nos próximos meses.

Não é o único.
O Google não é o único desenvolvedor de tecnologia trabalhando em comandos de voz. A empresa NEC informou recentemente que seus pesquisadores estão desenvolvendo um sistema de controle de voz para smartphones que vai superar um dos principais problemas que esses sistemas têm, o ruído ambiente.

A NEC encontrou uma solução para situações com ruído intenso que não permitiam o uso de comandos de voz. Seu sistema funcionará através de dois microfones, um pegará o ruído ambiente e o outro exclusivamente os diferentes tipos de voz. Isso evita ter que chegar muito perto do microfone da boca para que o dispositivo possa funcionar bem.

- Publicidad -

No mesmo sentido funciona o Sherpa, um assistente virtual que permite executar e agendar tarefas através de comandos de voz. Este desenvolvimento espanhol foi muito bem recebido porque sua língua nativa é o espanhol. Em seus primeiros seis meses, alcançou meio milhão de downloads.

Especialistas apontaram que é uma versão melhor do que o Google Now para o seu manuseio da língua espanhola. Por isso, seus criadores decidiram aproveitar esse sucesso e atualmente estão trabalhando no aplicativo que permitirá que eles tenham presença no Google Glass.



Por sua vez, a Apple não foi deixada para trás e durante 2011 lançou seu telefone iPhone 4S com o aplicativo Siri, que usa processamento de linguagem natural para responder perguntas, fazer recomendações e realizar ações delegando solicitações a um conjunto de serviços web que está aumentando. Uma de suas vantagens é que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como reservar uma mesa para jantar ou pedir um táxi.

Outras aplicações
Os comandos de voz se beneficiaram do surgimento de dispositivos móveis, pois a maioria dos aplicativos são voltados para esses dispositivos. Mas eles não são os únicos. Como vimos anteriormente, aplicativos de voz para o Google já podem ser usados em seu mecanismo de busca a partir de qualquer dispositivo ou computador.

Além disso, o sistema em que a NEC trabalha visa ser útil para outras indústrias, como fábricas ou lojas, que podem se beneficiar do funcionamento de máquinas por voz permitindo que os funcionários realizem outras atividades ao mesmo tempo usando as mãos.

O Windows 7 também trouxe comandos de voz pela primeira vez para alguns de seus aplicativos, como o gerenciamento de música após a configuração do sistema e a gravação dos comandos a serem usados. Até mesmo consoles de jogos, como o Xbox 360, hoje têm esse tipo de serviço.

- Publicidad -

Alguns dos mais beneficiados por comandos de voz foram pessoas que têm algum tipo de deficiência, que encontraram soluções para facilitar a acessibilidade, especialmente quando têm dificuldades de motor ou de mobilidade.

Tipos e usos
Em geral, os comandos de voz buscam permitir a comunicação entre humanos e máquinas, mas alguns teóricos dizem que os principais desafios desses sistemas estão nas formas de linguagem (fonética, semântica, sotaque, entre outros) para ter uma aceitação da mensagem correta e uma resposta adequada.

Atualmente, as soluções de comando de voz são classificadas em várias opções. Por exemplo, se ele requer treinamento prévio antes de começar a ser usado, ou se ele é acessível a alguém ou só é capaz de reconhecer apenas um usuário.

Também deve ser diferenciado se o sistema permitir que o usuário fale em uma fileira ou deve pronunciar palavra por palavra, dando um curto espaço de tempo entre cada um para facilitar o reconhecimento. E um fator fundamental é ser claro sobre quais são as funções que o sistema reconhece, se tem algumas frases predeterminadas ou uma linguagem extensa.

Embora muitos vejam em comandos de voz soluções para problemas cotidianos e até mesmo facilitando a vida em ações comuns, é claro que esta é uma tecnologia em processo de pesquisa e desenvolvimento para alcançar a funcionalidade ideal. Um caso em particular seria o dos motoristas.

Muitos falaram sobre como comandos de voz podem ser úteis para as pessoas quando estão ao volante. Mas há estudos acadêmicos que têm chamado a atenção para o risco que isso pode trazer aos motoristas. O Texas Transportation Institute, um departamento da Universidade A&M, disse em pesquisas recentes que essas funções poderiam ser mais perigosas do que conversar ao volante.

Eles apontam que esses sistemas requerem muito mais atenção, pois na maioria dos casos a ordem dada ao dispositivo deve ser corrigida, o que reduz o tempo de reação do motorista a um imprevisto na estrada. Este seria mais um problema que se soma ao conflito que tem que combinar o volante com dispositivos móveis.

Mas no ritmo que a pesquisa está avançando hoje e com o interesse de tantas empresas em desenvolver suas aplicações, é possível que em alguns anos sua funcionalidade seja maior, sobretudo, resolvendo problemas como a distorção que o som ambiente pode gerar, os usos em diferentes linguagens, o reconhecimento das diferentes características do alto-falante e até mesmo as distrações para os motoristas.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No comments

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.
• Se você já está registrado, faça o login primeiro. O seu email não será publicado.

Leave your comment

In reply to Some User
Colômbia continua seu compromisso com a indústria de reuniões

Colômbia continua seu compromisso com a indústria de reuniões

Colômbia. A Colômbia continua avançando em seu posicionamento como um destino competitivo na indústria global de reuniões. Este setor inclui eventos corporativos, congressos, convenções, viagens de...

Soundtec adiciona Blaze Audio ao seu portfólio

Soundtec adiciona Blaze Audio ao seu portfólio

Argentina. A Soundtec anunciou a adição ao seu portfólio de marcas representadas da marca dinamarquesa Blaze Audio, que ganhou reconhecimento mundial por seu foco em soluções de amplificação e...

Coca Cola Chile automatiza auditório

Coca Cola Chile automatiza auditório

A integradora Ictra foi responsável por este projeto de modernização do auditório da Coca Cola em sua sede chilena. Ricardo Papai Noel

RCF expande suas soluções de áudio e som ao vivo

RCF expande suas soluções de áudio e som ao vivo

América Latina. A RCF apresenta a nova X-Series, uma gama de alto-falantes de alta potência com gabinetes com classificação IP55 e proteção UV, ideal para estádios e grandes locais ao ar livre.

NEOLUX Cinema representará as soluções de cinema da Christie's

NEOLUX Cinema representará as soluções de cinema da Christie's

Brasil. A NEOLUX Cinema Ltda. se tornará o principal ponto de contato para os produtos de cinema da Christie's no Brasil e também apoiará os clientes da Christie's na Argentina, Paraguai e Uruguai.

Shure anuncia duas novas soluções de conferência

Shure anuncia duas novas soluções de conferência

América Latina. A Shure apresentará duas novas soluções de conferência na InfoComm 2025 que permitirão que os integradores de AV e TI ofereçam melhor suporte a diversos espaços de reunião.

Associação Mexicana de Datacenters comemorou dois anos

Associação Mexicana de Datacenters comemorou dois anos

México. A Associação Mexicana de Data Centers, MEXDC, comemorou seu segundo aniversário liderando os interesses de mais de 126 empresas ligadas à Indústria de Data Centers, um setor econômico que...

Siemens reafirma seu compromisso com a sustentabilidade

Siemens reafirma seu compromisso com a sustentabilidade

México. No âmbito do Dia Mundial do Meio Ambiente, a Siemens México, América Central e Caribe apresentou em seu Relatório de Sustentabilidade 2024 o progresso de sua estratégia ambiental, social e...

A Epson é parceira oficial da estreia europeia do Cirque du Soleil

A Epson é parceira oficial da estreia europeia do Cirque du Soleil

Internacional. A Epson anunciou que seus projetores a laser de última geração desempenharão um papel fundamental para dar vida às imagens nunca antes vistas do Cirque du Soleil ALIZÉ™ ("ALIZÉ") em...

Da-Lite lançado plugin de integração para Q-SYS

Da-Lite lançado plugin de integração para Q-SYS

América Latina. A Da-Lite anunciou seu novo plugin para integração com Q-SYS: Screen Controller. Como parceira no ecossistema Q-SYS, a Da-Lite colaborou com a Q-SYS para criar uma solução de...

Suscribase Gratis
Lembre-se de mim
INSCREVA-SE NO BOLETIM INFORMATIVO
VOCÊ PRECISA DE UMA COTAÇÃO?
ENTREVISTAS EM DESTAQUE
PATROCINADORES










ÚLTIMO BOLETIM
Ultimo Info-Boletin