Introducing G2.ai, the future of software buying.Try now

Interagindo com Interfaces: Dando Voz à Tecnologia

9 de Dezembro de 2019
por Matthew Miller

Tecnologia de voz: A voz ouvida ao redor do mundo. Todos nós já ouvimos falar da Alexa da Amazon e do Google Assistant (talvez até do Samsung's Bixby e do Alibaba’s Tmall Genie).

Como mencionei em minha última coluna mensal, uma das novas fronteiras empolgantes da tecnologia são as formas em mudança como interagimos com ela. A tecnologia de voz, em particular, desempenhou um papel enorme nessas mudanças. Bem-vindo à era multimodal, onde a tecnologia de voz e o processamento de linguagem natural (NLP) reinam supremos. 

A ascensão e ascensão da tecnologia de voz

A tecnologia de voz ou reconhecimento de voz, juntamente com a internet das coisas (IoT), é tão ubíqua que tendemos a esquecer que nem sempre fez parte de nossas vidas. 

RELACIONADO: Saiba mais sobre o funcionamento interno do reconhecimento de voz.

gráfico que mostra a linha do tempo da revolução dos assistentes de vozFonte: voicebot.ai

Assistentes de voz não vão a lugar nenhum. Se algo, eles parecem ter mais casos de uso a cada dia. Como é a adoção desses assistentes de voz na prática? Como a tecnologia é usada e como as empresas a estão aproveitando para alcançar usuários ou potenciais clientes?

Uma coisa é certa: a voz está em ascensão. No primeiro trimestre de 2019, mais de 31% das residências nos Estados Unidos possuíam um alto-falante inteligente com um assistente pessoal inteligente. (Compare isso com os 8% que possuíam um em 2016.) O Reino Unido não está muito atrás. Novos dados da Strategy Analytics mostraram que até junho de 2019, cerca de 20% das residências no Reino Unido possuem um alto-falante inteligente.

A posse de alto-falantes inteligentes é apenas um preditor parcial da prevalência da tecnologia de voz. Incluindo o uso de telefones celulares, a Location World descobriu que cerca de 40% dos adultos usam a busca por voz pelo menos uma vez por dia.

RELACIONADO: Confira estas 43 estatísticas de busca por voz para 2019 

De acordo com a eMarketer, 31 milhões de americanos farão compras usando um alto-falante inteligente este ano. Como os clientes têm a capacidade de pedir mantimentos via Google Assistant, e praticamente qualquer coisa da Amazon via Alexa, é provável que mais clientes utilizem a tecnologia de voz em um futuro próximo. Do ponto de vista dos negócios, a oportunidade de aumento de receita com a tecnologia de voz é empolgante.

O ponto principal: a voz está se espalhando, então as marcas devem aproveitá-la e incluí-la como parte de sua estratégia digital mais ampla. Abaixo, focaremos no lado do e-commerce, mas exploraremos outras aplicações industriais de longo alcance em colunas futuras.

Por que isso está acontecendo?

Para entender por que a tecnologia de voz foi adotada tão rapidamente, vale a pena olhar para a evolução da relação humano-computador que se desenvolveu na própria tecnologia, bem como na experiência do usuário (UX).

Muitas tecnologias complexas, como AR, VR, IoT e controle por gestos estão explorando a necessidade de interfaces de usuário naturais. Estamos em uma jornada em direção a essa naturalização da relação humano-computador há muito tempo. 

Estamos nos movendo em direção a interfaces mais amigáveis e intuitivas. Seja com interruptores, teclados ou telas sensíveis ao toque, estamos nos comunicando com nossa tecnologia de maneiras mais naturais. A voz, facilitada pela tecnologia de reconhecimento de fala (como a do Google, que tem 95% de precisão), é a próxima fronteira.

Ao mesmo tempo, os critérios de experiência do usuário evoluíram. Ao desenvolver tecnologias, os desenvolvedores costumavam se concentrar em critérios como confiabilidade, precisão e velocidade. Avançando para hoje, onde estamos focando e falando sobre tecnologia que podemos confiar, construir relacionamentos e encontrar conforto. Essa evolução na personificação da tecnologia é fundamental para a nova forma de experiência do usuário. É importante notar que as expectativas anteriores não desapareceram. Ainda esperamos que nossa tecnologia seja rápida e confiável; agora queremos que ela faça isso de uma maneira que pareça tanto orgânica quanto personalizada — afinal, é chamado de processamento de linguagem natural (NLP).

A voz faz a tecnologia parecer mais humana e permite que as pessoas confiem mais nela. A voz provará ser uma interface natural importante que mediará nossa comunicação e relacionamentos com nossos dispositivos e, em última análise, nossa comunicação e relacionamentos dentro de um mundo movido por IA.

Falando naturalmente com a tecnologia de voz

Quais são as características da voz que a tornam uma interface tão natural?

    1. Velocidade: Homo sapiens fala em média 150 palavras por minuto e digita em média 40 palavras por minuto. Quando falamos, não há processo de tradução da voz em nossa cabeça para botões referenciais em um teclado ou telefone. 
    2. Liberador: Em um mundo onde a tecnologia deve nos libertar, o desenvolvimento de telas visuais em telefones e tablets nos constrangeu, forçando nossas cabeças para baixo. A voz traz nossas cabeças de volta para cima, nos libertando da fixação em uma tela e permitindo a capacidade de multitarefa e interação com nossas tecnologias ao mesmo tempo. Com a voz, podemos realizar multitarefas de forma contínua, já que ela já é uma parte natural do nosso ambiente.
    3. Primitivo: Somos capazes de falar desde que nos lembramos. A voz é registrada nas partes mais primitivas do nosso cérebro; portanto, a voz não é tão pesada para o nosso cérebro em comparação com outras formas de comunicação.

As interações dos indivíduos com computadores, televisão e novas mídias são fundamentalmente sociais e naturais, assim como as interações na vida real, de acordo com "The Media Equation" de Reeves e Nass.

Quer aprender mais sobre Software de Reconhecimento de Voz? Explore os produtos de Reconhecimento de Voz.

Que valor a voz oferece às marcas?

Como as marcas podem usar essa nova interface para seu benefício? Existem vários aspectos da voz que as empresas devem considerar ao iniciar sua jornada de voz. 

  • Criando uma personalidade digital
    A tecnologia de voz dá às marcas a capacidade de descobrir seu som único e desenvolver uma personalidade digital para criar momentos de marca significativos e fluidos, gerando lealdade à marca com seus clientes. Por exemplo, Just Eat, um serviço britânico de pedidos e entrega de comida online, fez isso bem com respostas humorísticas como, "Você pediu como um chefe!" e "Okie dokie amigo." Embora isso possa parecer bastante básico, pode ir longe na humanização da interação que um cliente tem com essa marca.
  • Gerando conscientização
    As marcas podem usar a voz para aumentar sua descobribilidade e gerar conscientização da marca projetando uma experiência de voz que forneça utilidade. Por exemplo, a Tide desenvolveu um aplicativo de voz na Alexa com o qual os usuários podem conversar para obter ajuda na remoção de diferentes tipos de manchas. Aproveitar a tecnologia de voz para fornecer utilidade aos consumidores ajuda a Tide a implantar uma associação entre sua marca e seus objetivos de produto (remoção rápida de manchas). 
  • Facilitando transações
    Uma marca que desenvolve uma experiência de voz que facilita o processo de compra proporcionará uma experiência de compra que reduz o atrito para o usuário, resultando em lealdade do cliente. Um ótimo exemplo é a habilidade Alexa da Ocado. Esta habilidade auxilia na compra de mantimentos enquanto oferece aos usuários uma experiência fantástica com a tecnologia de voz. A Domino’s é outro ótimo exemplo, fornecendo aos clientes uma habilidade Alexa da Amazon que facilita o pedido rápido de pizza.
  • Personalizando a interação
    As marcas podem personalizar as interações de voz para as necessidades e desejos de seus consumidores para desenvolver um halo de confiança. Por exemplo, a American Express tem uma habilidade Alexa que fornece dados e informações, como padrões de gastos, adaptados ao cliente em questão. 
RELACIONADO: Saiba quatro maneiras de ouvir a voz do cliente e melhorar a experiência do cliente, aqui

E agora?

Pelo que vimos, os usuários finais esperam que as marcas estejam disponíveis via tecnologia de voz. Com essa realidade em mente, as empresas de SaaS devem preencher a lacuna e fornecer aos usuários as ferramentas para ter sucesso. 

Várias tendências que vimos recentemente nessa direção incluem:

        • Busca por voz como serviço: Algolia, que arrecadou $110 milhões no mês passado, quer fazer um grande avanço na direção da voz. Tanto o CEO quanto o cofundador disseram que a empresa quer "enriquecer [suas] capacidades de busca conversacional e por voz em canais web, móveis e de voz para atender à crescente demanda dos consumidores por buscar de qualquer forma, em qualquer lugar, a qualquer momento."
        • Ferramentas de arrastar e soltar para criar aplicativos de voz: Em abril, a Voiceflow, que permite a qualquer pessoa criar aplicativos de voz sem codificação, arrecadou $3,5 milhões.
        • Sites habilitados para voz: No final de julho, a Airbud arrecadou $4 milhões. Esta tecnologia permitirá que os usuários adicionem facilmente uma interface de voz ao seu site. 

Falando sobre essas limitações

Embora o quadro que pintamos seja preciso, as pinceladas são amplas e a cor é limitada. 

Na segunda parte desta série, teremos uma visão das limitações da tecnologia de voz em diferentes indústrias, incluindo preocupações com privacidade, o futuro do comércio por voz e mais.

Fique ligado. 

Matthew Miller
MM

Matthew Miller

Matthew Miller is a research and data enthusiast with a knack for understanding and conveying market trends effectively. With experience in journalism, education, and AI, he has honed his skills in various industries. Currently a Senior Research Analyst at G2, Matthew focuses on AI, automation, and analytics, providing insights and conducting research for vendors in these fields. He has a strong background in linguistics, having worked as a Hebrew and Yiddish Translator and an Expert Hebrew Linguist, and has co-founded VAICE, a non-profit voice tech consultancy firm.