Tecnología de voz: La voz que se escucha en todo el mundo. Todos hemos oído hablar de Alexa de Amazon y del Asistente de Google (quizás incluso de Bixby de Samsung y del Tmall Genie de Alibaba).
Como mencioné en mi última columna mensual, una de las nuevas fronteras emocionantes de la tecnología son las formas cambiantes en que interactuamos con ella. La tecnología de voz en particular ha jugado un papel enorme en estos cambios. Bienvenidos a la era multimodal, donde la tecnología de voz y el procesamiento del lenguaje natural (NLP) reinan supremos.
El auge y auge de la tecnología de voz
La tecnología de voz o el reconocimiento de voz, junto con el internet de las cosas (IoT) es tan ubicua que tendemos a olvidar que no siempre ha sido parte de nuestras vidas.
RELACIONADO: Aprende más sobre el funcionamiento interno del reconocimiento de voz. |
Fuente: voicebot.ai
Los asistentes de voz no van a desaparecer. De hecho, parecen tener más casos de uso cada día. ¿Cómo se ve la adopción de estos asistentes de voz en la práctica? ¿Cómo se utiliza la tecnología y cómo las empresas la aprovechan para llegar a los usuarios o clientes potenciales?
Una cosa es segura: La voz está en auge. A partir del primer trimestre de 2019, más del 31% de los hogares en los Estados Unidos poseían un altavoz inteligente con un asistente personal inteligente. (Compáralo con el 8% que poseía uno en 2016). El Reino Unido no está muy lejos. Nuevos datos de Strategy Analytics mostraron que hasta junio de 2019, alrededor del 20% de los hogares en el Reino Unido tienen un altavoz inteligente.
La posesión de altavoces inteligentes es solo un predictor parcial de la prevalencia de la tecnología de voz. Incluyendo el uso de teléfonos móviles, Location World descubrió que alrededor del 40% de los adultos usan la búsqueda por voz al menos una vez al día.
RELACIONADO: Consulta estas 43 estadísticas de búsqueda por voz para 2019 → |
Según eMarketer, 31 millones de estadounidenses comprarán usando un altavoz inteligente este año. Dado que los clientes tienen la capacidad de pedir comestibles a través del Asistente de Google, y casi cualquier cosa de Amazon a través de Alexa, es probable que más clientes utilicen la tecnología de voz en el futuro cercano. Desde una perspectiva empresarial, la oportunidad de aumentar los ingresos a partir de la tecnología de voz es emocionante.
La conclusión: La voz se está extendiendo, por lo que las marcas deben aprovecharla e incluirla como parte de su estrategia digital más amplia. A continuación, nos centraremos en el lado del comercio electrónico, pero exploraremos otras aplicaciones industriales de gran alcance en columnas posteriores.
¿Por qué está sucediendo esto?
Para entender por qué la tecnología de voz fue adoptada tan rápidamente, vale la pena mirar hacia atrás en la evolución de la relación humano-computadora que se ha desarrollado en la propia tecnología, así como en la experiencia del usuario (UX).
Muchas tecnologías complejas como AR, VR, IoT, y el control por gestos están aprovechando la necesidad de interfaces de usuario naturales. Hemos estado en un viaje hacia esta naturalización de la relación humano-computadora durante mucho tiempo.
Nos estamos moviendo hacia interfaces más amigables para el usuario e intuitivas. Ya sea con interruptores, teclados o pantallas táctiles, nos estamos comunicando con nuestra tecnología de maneras más naturales. La voz, facilitada por la tecnología de reconocimiento de voz (como la de Google que tiene un 95% de precisión), es la próxima frontera.
Al mismo tiempo, los criterios de experiencia del usuario han evolucionado. Al desarrollar tecnologías, los desarrolladores solían centrarse en criterios como la fiabilidad, la precisión y la velocidad. Avancemos hasta hoy, donde nos centramos y hablamos de tecnología en la que podemos confiar, construir relaciones y encontrar comodidad. Esta evolución en la personificación de la tecnología es clave para la nueva forma de experiencia del usuario. Es importante señalar que las expectativas anteriores no han desaparecido. Todavía esperamos que nuestra tecnología sea rápida y confiable; ahora queremos que lo haga de una manera que se sienta tanto orgánica como personalizada, después de todo, se llama procesamiento del lenguaje natural (NLP).
La voz hace que la tecnología se sienta más humana y permite a las personas confiar más en ella. La voz demostrará ser una interfaz natural importante que mediará nuestra comunicación y relaciones con nuestros dispositivos, y en última instancia, nuestra comunicación y relaciones dentro de un mundo impulsado por la IA.
Hablando naturalmente con tecnología de voz
¿Cuáles son las características de la voz que la hacen una interfaz tan natural?
-
- Velocidad: Homo sapiens hablan un promedio de 150 palabras por minuto y escriben un promedio de 40 palabras por minuto. Cuando hablamos, no hay un proceso que traduzca la voz en nuestra cabeza a botones referenciales en un teclado o teléfono.
- Liberador: En un mundo donde se supone que la tecnología debe liberarnos, el desarrollo de pantallas visuales en teléfonos y tabletas nos ha constreñido, obligándonos a bajar la cabeza. La voz nos levanta la cabeza, liberándonos de la fijación en una pantalla y permitiendo la capacidad de realizar múltiples tareas e interactuar con nuestras tecnologías al mismo tiempo. Con la voz, podemos realizar múltiples tareas sin problemas, ya que ya es una parte natural de nuestro entorno.
- Primitivo: Hemos podido hablar desde que podemos recordar. La voz está registrada en las partes más primitivas de nuestro cerebro; por lo tanto, la voz no es tan pesada para nuestro cerebro en comparación con otras formas de comunicación.
Las interacciones de los individuos con computadoras, televisión y nuevos medios son fundamentalmente sociales y naturales, al igual que las interacciones en la vida real, según "The Media Equation" de Reeves y Nass.
¿Quieres aprender más sobre Software de reconocimiento de voz? Explora los productos de Reconocimiento de voz.
¿Qué valor ofrece la voz a las marcas?
¿Cómo pueden las marcas usar esta nueva interfaz para su beneficio? Hay varios aspectos de la voz que las empresas deben considerar al comenzar su viaje de voz.
-
Creación de una personalidad digital
La tecnología de voz da a las marcas la capacidad de descubrir su sonido único y desarrollar una personalidad digital para crear momentos de marca significativos y fluidos, fomentando la lealtad a la marca con sus clientes. Por ejemplo, Just Eat, un servicio británico de pedidos y entrega de comida en línea, ha hecho esto bien con respuestas humorísticas como, "¡Has pedido como un jefe!" y "Okie dokie amigo." Aunque eso pueda parecer bastante básico, puede ser muy útil para humanizar la interacción que un cliente tiene con esa marca. -
Generación de conciencia
Las marcas pueden usar la voz para aumentar su descubribilidad y generar conciencia de marca diseñando una experiencia de voz que proporcione utilidad. Por ejemplo, Tide desarrolló una aplicación de voz en Alexa con la que los usuarios pueden conversar para obtener ayuda para eliminar diferentes tipos de manchas. Aprovechar la tecnología de voz para proporcionar utilidad a los consumidores ayuda a Tide a implantar una asociación entre su marca y sus objetivos de producto (eliminación rápida de manchas). -
Facilitación de transacciones
Una marca que desarrolla una experiencia de voz que facilita el proceso de compra proporcionará una experiencia de compra que reduce la fricción para el usuario, resultando en lealtad del cliente. Un gran ejemplo es la habilidad de Alexa de Ocado. Esta habilidad ayuda en la compra de comestibles mientras ofrece a los usuarios una fantástica experiencia de tecnología de voz. Domino’s es otro gran ejemplo, proporcionando a los clientes una habilidad de Amazon Alexa que facilita pedir pizza rápidamente. -
Personalización de la interacción
Las marcas pueden adaptar las interacciones de voz a las necesidades y deseos de sus consumidores para desarrollar un halo de confianza. Por ejemplo, American Express tiene una habilidad de Alexa que proporciona datos e información, como patrones de gasto, adaptados al cliente en cuestión.
RELACIONADO: Aprende cuatro maneras de escuchar la voz del cliente y mejorar la experiencia del cliente, aquí → |
¿Y ahora qué?
Hasta donde hemos visto, los usuarios finales esperan que las marcas estén disponibles a través de la tecnología de voz. Con esta realidad en mente, las empresas de SaaS deben cerrar la brecha y proporcionar a los usuarios herramientas para tener éxito.
Varias tendencias que hemos visto recientemente en esta dirección incluyen:
- Búsqueda por voz como servicio: Algolia, que recaudó $110 millones el mes pasado, quiere hacer un gran impulso en la dirección de la voz. Tanto el CEO como el cofundador dijeron que la empresa quiere "enriquecer [sus] capacidades de búsqueda conversacional y por voz en canales web, móviles y de voz primero para satisfacer la creciente demanda de los consumidores de buscar de cualquier manera, en cualquier lugar, en cualquier momento."
- Herramientas de arrastrar y soltar para construir aplicaciones de voz: En abril, Voiceflow, que permite a cualquiera hacer aplicaciones de voz sin codificación, recaudó $3.5 millones.
-
- Sitios web habilitados para voz: A finales de julio, Airbud recaudó $4 millones. Esta tecnología permitirá a los usuarios agregar fácilmente una interfaz de voz a su sitio web.
Hablando de esas limitaciones
Aunque la imagen que hemos pintado es precisa, las pinceladas son amplias y el color es limitado.
En la segunda parte de esta serie, echaremos un vistazo a las limitaciones de la tecnología de voz en diversas industrias, incluyendo preocupaciones de privacidad, el futuro del comercio por voz, y más.
Estén atentos.

Matthew Miller
Matthew Miller is a research and data enthusiast with a knack for understanding and conveying market trends effectively. With experience in journalism, education, and AI, he has honed his skills in various industries. Currently a Senior Research Analyst at G2, Matthew focuses on AI, automation, and analytics, providing insights and conducting research for vendors in these fields. He has a strong background in linguistics, having worked as a Hebrew and Yiddish Translator and an Expert Hebrew Linguist, and has co-founded VAICE, a non-profit voice tech consultancy firm.