Selecione seu Idioma

Falando claramente o sistema entende

altDesde 1990, a pesquisa começou em sistemas controlados por comandos de voz. Nos últimos anos, sistemas com aplicações úteis e comercialmente viáveis para desenvolvedores e consumidores têm sido conhecidos.

Por Richard Santa


Neste mundo cada vez mais convulsionado, em que o tempo não é suficiente e as pessoas buscam realizar diversas atividades ao mesmo tempo, a tendência na evolução tecnológica é facilitar a vida de todos. É por isso que os fabricantes estão agora mirando equipamentos e sistemas que podem ser controlados por voz.

O Google é um dos principais impulsionadores dessa tecnologia. Em sua mais recente Conferência de Desenvolvedores, em maio, apresentou o sistema de reconhecimento de voz para o mecanismo de busca, através do qual permite que você faça perguntas e obtenha as respostas faladas.

- Publicidad -

Este novo sistema de pesquisa requer o uso da versão 27 ou superior do navegador Google Chrome para seu funcionamento e autorização para que o programa possa usar o microfone do computador.

E embora isso tenha sido uma novidade, as críticas não têm faltado. Uma delas é por causa do idioma, porque ele só está disponível para inglês, não importa qual idioma seja o padrão na conta do Google. Outro problema relatado é que muitas vezes ao tentar usá-lo há um erro na página, mas os executivos da empresa indicaram que é devido ao uso excessivo da plataforma em seus primeiros dias.

Um dos anúncios mais esperados do Google I/O 2013 por viciados em tecnologia foram os detalhes do Google Glass. Sabia-se que estes também incluem um comando de voz para executar ações como tirar fotos, localizar em mapas ou usar a internet.

Outro dos aplicativos da gigante da tecnologia que também usa comandos de voz é o Google Now, um assistente pessoal inteligente disponível para o sistema operacional Android e iOS, que usa uma interface natural de usuário de linguagem para responder perguntas, fazer recomendações e agir delegando solicitações a um conjunto de serviços web.

Os três produtos do Google com recursos por meio de comandos de voz compartilham a mesma dificuldade, atualmente apenas trabalhando com a língua inglesa, e aqueles com opções em espanhol, como o Google Now, têm problemas com o reconhecimento de idiomas. Mas essa restrição linguística provavelmente será superada nos próximos meses.

Não é o único.
O Google não é o único desenvolvedor de tecnologia trabalhando em comandos de voz. A empresa NEC informou recentemente que seus pesquisadores estão desenvolvendo um sistema de controle de voz para smartphones que vai superar um dos principais problemas que esses sistemas têm, o ruído ambiente.

A NEC encontrou uma solução para situações com ruído intenso que não permitiam o uso de comandos de voz. Seu sistema funcionará através de dois microfones, um pegará o ruído ambiente e o outro exclusivamente os diferentes tipos de voz. Isso evita ter que chegar muito perto do microfone da boca para que o dispositivo possa funcionar bem.

- Publicidad -

No mesmo sentido funciona o Sherpa, um assistente virtual que permite executar e agendar tarefas através de comandos de voz. Este desenvolvimento espanhol foi muito bem recebido porque sua língua nativa é o espanhol. Em seus primeiros seis meses, alcançou meio milhão de downloads.

Especialistas apontaram que é uma versão melhor do que o Google Now para o seu manuseio da língua espanhola. Por isso, seus criadores decidiram aproveitar esse sucesso e atualmente estão trabalhando no aplicativo que permitirá que eles tenham presença no Google Glass.



Por sua vez, a Apple não foi deixada para trás e durante 2011 lançou seu telefone iPhone 4S com o aplicativo Siri, que usa processamento de linguagem natural para responder perguntas, fazer recomendações e realizar ações delegando solicitações a um conjunto de serviços web que está aumentando. Uma de suas vantagens é que ele se adapta às preferências individuais do usuário ao longo do tempo e personaliza os resultados, além de realizar tarefas como reservar uma mesa para jantar ou pedir um táxi.

Outras aplicações
Os comandos de voz se beneficiaram do surgimento de dispositivos móveis, pois a maioria dos aplicativos são voltados para esses dispositivos. Mas eles não são os únicos. Como vimos anteriormente, aplicativos de voz para o Google já podem ser usados em seu mecanismo de busca a partir de qualquer dispositivo ou computador.

Além disso, o sistema em que a NEC trabalha visa ser útil para outras indústrias, como fábricas ou lojas, que podem se beneficiar do funcionamento de máquinas por voz permitindo que os funcionários realizem outras atividades ao mesmo tempo usando as mãos.

O Windows 7 também trouxe comandos de voz pela primeira vez para alguns de seus aplicativos, como o gerenciamento de música após a configuração do sistema e a gravação dos comandos a serem usados. Até mesmo consoles de jogos, como o Xbox 360, hoje têm esse tipo de serviço.

- Publicidad -

Alguns dos mais beneficiados por comandos de voz foram pessoas que têm algum tipo de deficiência, que encontraram soluções para facilitar a acessibilidade, especialmente quando têm dificuldades de motor ou de mobilidade.

Tipos e usos
Em geral, os comandos de voz buscam permitir a comunicação entre humanos e máquinas, mas alguns teóricos dizem que os principais desafios desses sistemas estão nas formas de linguagem (fonética, semântica, sotaque, entre outros) para ter uma aceitação da mensagem correta e uma resposta adequada.

Atualmente, as soluções de comando de voz são classificadas em várias opções. Por exemplo, se ele requer treinamento prévio antes de começar a ser usado, ou se ele é acessível a alguém ou só é capaz de reconhecer apenas um usuário.

Também deve ser diferenciado se o sistema permitir que o usuário fale em uma fileira ou deve pronunciar palavra por palavra, dando um curto espaço de tempo entre cada um para facilitar o reconhecimento. E um fator fundamental é ser claro sobre quais são as funções que o sistema reconhece, se tem algumas frases predeterminadas ou uma linguagem extensa.

Embora muitos vejam em comandos de voz soluções para problemas cotidianos e até mesmo facilitando a vida em ações comuns, é claro que esta é uma tecnologia em processo de pesquisa e desenvolvimento para alcançar a funcionalidade ideal. Um caso em particular seria o dos motoristas.

Muitos falaram sobre como comandos de voz podem ser úteis para as pessoas quando estão ao volante. Mas há estudos acadêmicos que têm chamado a atenção para o risco que isso pode trazer aos motoristas. O Texas Transportation Institute, um departamento da Universidade A&M, disse em pesquisas recentes que essas funções poderiam ser mais perigosas do que conversar ao volante.

Eles apontam que esses sistemas requerem muito mais atenção, pois na maioria dos casos a ordem dada ao dispositivo deve ser corrigida, o que reduz o tempo de reação do motorista a um imprevisto na estrada. Este seria mais um problema que se soma ao conflito que tem que combinar o volante com dispositivos móveis.

Mas no ritmo que a pesquisa está avançando hoje e com o interesse de tantas empresas em desenvolver suas aplicações, é possível que em alguns anos sua funcionalidade seja maior, sobretudo, resolvendo problemas como a distorção que o som ambiente pode gerar, os usos em diferentes linguagens, o reconhecimento das diferentes características do alto-falante e até mesmo as distrações para os motoristas.

Richard Santa, RAVT
Richard Santa, RAVTEmail: [email protected]
Editor
Periodista de la Universidad de Antioquia (2010), con experiencia en temas sobre tecnología y economía. Editor de las revistas TVyVideo+Radio y AVI Latinoamérica. Coordinador académico de TecnoTelevisión&Radio.


No comments

• Si ya estás registrado, favor ingresar primero al sistema. Su email no será publicado.
• Se você já está registrado, faça o login primeiro. O seu email não será publicado.

Leave your comment

In reply to Some User
LEA Professional foca na América Latina

LEA Professional foca na América Latina

América Latina. O fabricante de soluções de áudio LEA Professional busca aumentar a presença de suas soluções no mercado latino-americano, aproveitando o crescimento da indústria AV em seus...

A Yamaki comemora seu 40º aniversário com a AVI Experience

A Yamaki comemora seu 40º aniversário com a AVI Experience

Colômbia. De 12 a 14 de maio, a segunda edição da Yamaki AVI Experience será realizada em Bogotá, um evento que este ano será especial, pois servirá para celebrar os 40 anos da empresa.

D2S DSCBS é lançado para simplificar projetos de AV no Brasil

D2S DSCBS é lançado para simplificar projetos de AV no Brasil

Brasil. A execução de projetos audiovisuais profissionais no Brasil há muito coloca integradores internacionais em uma situação difícil: navegar sozinhos em um ambiente logístico e fiscal complexo e...

Michael Phipps, novo presidente e diretor da Christie

Michael Phipps, novo presidente e diretor da Christie

América Latina. A empresa-mãe da Christie, Ushio Inc., promoveu Michael Phipps ao cargo de Presidente e Diretor Executivo da Christie Digital Systems e suas subsidiárias.

Mudando o escritório em casa para um dia de trabalho mais produtivo

Mudando o escritório em casa para um dia de trabalho mais produtivo

América Latina. A consolidação do trabalho híbrido na Colômbia deixou de ser uma resposta de emergência e se tornou um pilar da economia digital.

A Universidade Anahuac transforma a educação híbrida com a Shure

A Universidade Anahuac transforma a educação híbrida com a Shure

México. A Universidad Anáhuac Puebla, uma instituição líder em excelência acadêmica na América Latina, anunciou a implementação bem-sucedida de um ecossistema de áudio inteligente, com soluções...

O grupo Dante & Aeris oferecerá cursos especializados no México

O grupo Dante & Aeris oferecerá cursos especializados no México

México. O grupo Dante e aeris realizará dois cursos especializados em áudio sobre rede que acontecerão na Cidade do México, voltados para profissionais do setor Pro AV, engenharia de áudio e...

Automação residencial e predial transformarão os edifícios chilenos

Automação residencial e predial transformarão os edifícios chilenos

Chile. O setor de construção inteligente alcançou um marco com a realização dos Dias de Automação Predial pela KNX LATAM Virtual, CHILE 2026.

INFiLED fortalece sua equipe, Henry Ambrose novo presidente

INFiLED fortalece sua equipe, Henry Ambrose novo presidente

Estados Unidos. A INFiLED anunciou uma série de mudanças em sua equipe de liderança norte-americana. Henry Ambrose foi promovido a Presidente e Diretor Executivo, enquanto Chris Donaldson se junta...

Copa FIFA 2026: desafio tecnológico para hotéis no México

Copa FIFA 2026: desafio tecnológico para hotéis no México

México. Em um ambiente onde a experiência do usuário se tornou o principal diferencial, o setor de hospitalidade está se preparando para um de seus maiores desafios nos próximos anos: a alta demanda...

Suscribase Gratis
Lembre-se de mim
INSCREVA-SE NO BOLETIM INFORMATIVO
VOCÊ PRECISA DE UMA COTAÇÃO?
ENTREVISTAS EM DESTAQUE
PATROCINADORES










ÚLTIMO BOLETIM
Ultimo Info-Boletin