Advertisement

Tarjeta amarilla a los asistentes de voz: la mitad de las consultas todavía no están cubiertas

El porcentaje de respuesta correcta de los dispositivos por voz apenas supera el 50%, mientras que un tercio de las réplicas proviene de fuentes externas. El entretenimiento es el rey: escuchar música (81%), escuchar la radio (48%) y buscar información (45%) son los tres principales usos que se da a estos dispositivos

Ok Google, resérvame mesa para cenar a las 22h’; ‘Alexa, ¿dónde está mi pedido?’; ‘Siri, ¿qué tiempo va a hacer hoy?’ Cada vez son más los usuarios que utilizan los sistemas de voz en su día a día para realizar tareas tanto cotidianas como más profundas. Sin embargo, casi la mitad de las preguntas que los usuarios realizan en la web todavía no tienen la respuesta adecuada en los entornos de voz. Con el objetivo de obtener una radiografía de los hábitos de consumo y comportamiento de los españoles en el uso de la tecnología por voz, así como la respuesta actual de los principales players del mercado, ISDI y Webedia han presentado esta mañana en Madrid las conclusiones de su VoiceISDIgital, el primer estudio de respuesta sobre tecnologías de voz. Según los datos, el porcentaje de respuesta correcta supera ligeramente el 50% y, además, casi un tercio de las réplicas que ofrecen los asistentes de voz proviene de fuentes externas.

El estudio ha descubierto que esta tecnología es una gran vía de penetración para una audiencia sin explorar, ya que la media de edad es superior a otras, situándose entre los 51 y 65 años, y los hombres aventajan a las mujeres en 11 puntos porcentuales.

El proyecto ha desvelado además que las marcas todavía tienen un gran mercado por explotar en este terreno, ya que la mitad de los usuarios aún no ve un valor intrínseco a los altavoces inteligentes en comparación con otros dispositivos para usar la voz. La presentación de las conclusiones de VoiceISDIgital ha corrido a cargo de Nacho de Pinedo, CEO de ISDI, que ha desarrollado la parte cuantitativa, y Aida Méndez, head of innovation en Webedia, responsable del análisis cualitativo.

La penetración de los altavoces inteligentes ya supera a la de los drones y las cámaras go-pro, pues el 15% de la población tiene uno y es uno de los dispositivos con mayor previsión de compra próxima (12%). Sin embargo, parece que todavía no ha sabido transmitir al usuario una propuesta de valor de suficiente utilidad: un 50% de los usuarios identifica como uno de los principales frenos a la compra el hecho de no apreciar en ellos ninguna utilidad diferencial con respecto a otros dispositivos que ofrecen esta tecnología de forma integrada. De hecho, entre los principales frenos que se declaran a la hora de ampliar el uso de la voz son la seguridad –el 64% de los usuarios no se siente seguro con esta tecnología a la hora de realizar gestiones importantes-, la privacidad –el 42% no se fía del trato que se le pueden dar a sus datos- y los fallos en su usabilidad y fiabilidad, donde 3 de cada 4 usuarios han experimentado algún problema en el uso de la tecnología de voz. En este sentido, se ha observado que la calidad en las respuestas está relacionada con dos factores: la fuente de donde se obtiene la información y el sector al que pertenece la pregunta. En concreto:

  • De forma general, el asistente de Google Home Mini muestra una tasa del 18% superior en calidad de respuesta que Amazon Echo Dot
  • En el caso de Google Home Mini, el 57% de las respuestas provienen de una fuente nativa frente al 43% que procede de contenido web externo. Finanzas (86%) y Entretenimiento (84%) son los sectores con más precisión
  • En el caso de Amazon Echo Dot, el 85% de las respuestas provienen de una fuente nativa frente al 15% de contenido web externo. Entretenimiento (84%) y Gran Consumo (53%) son los sectores con las respuestas más precisas

En un 12% de los hogares en que existe esta tecnología, hay dos altavoces en vez de uno. El parque es muy joven: solo el 15% de los aparatos supera el año de vida. La media del coste que asumen los usuarios es de 99,78 euros por dispositivo. Las marcas que lideran la categoría son Alexa (37%) y Google Assistant (33%), seguidos de lejos por Siri (13%).

Pero, ¿para qué utilizan los usuarios los altavoces inteligentes? Los usos más frecuentes son para escuchar música (81%), la radio (48%) y buscar información (45%). Y entre las utilidades relacionadas con usos prácticos y del hogar, destacan poner la alarma (44%), realizar recordatorios (34%) y controlar los dispositivos de casa (27%).

Desde la perspectiva de la tecnología, la calidad de la respuesta es mayor en aquellos contenidos “nativos” de la tecnología de voz, mientras que los problemas se generan en aquellos casos en que los contenidos tienen otros orígenes. En este sentido, es particularmente relevante el posicionamiento estratégico que han tomado cada uno de los players. Mientras que Amazon apuesta por derivar todas las tareas no soportadas de forma nativa a assets propios dentro de su ecosistema (ecommerce Amazon, IMDB, skills…), Google se apoya en la fortaleza de su motor de búsqueda, haciendo que el posicionamiento en sitios especializados, verticales y blogs de la web gráfica sean clave para las marcas y organizaciones a la hora de obtener visibilidad en las respuestas del asistente.

Nacho Pinedo y Aida Méndez presentando el estudio VoiceISDIgital en las oficinas de ISDI | Fuente: imagen propia

Los usuarios no quieren publicidad convencional (84%) aunque sí se muestran receptivos a recibir comunicaciones de sus marcas favoritas (57%). En cuanto a momentos y lugares de uso, el salón es la habitación que concentra el mayor porcentaje de interactuaciones (72%) seguido del dormitorio (29%). La mayoría de los usuarios lo utiliza mientras realiza labores domésticas (67%), en un momento de relax (51%) o cocinando (45%).

Cabe destacar que los mayores picos de uso se producen fuera del horario laboral.

En cuanto a la eficacia de las consultas que realizan los usuarios, una de las principales barreras para su desarrollo son los fallos en usabilidad y fiabilidad, que reflejan de forma específica las limitaciones que actualmente posee la tecnología de voz. El principal inconveniente que manifiestan los usuarios es el hecho de que tenga que estar todo el día conectado (33%); un 26% les achaca “no reconocer fácilmente la voz”, el mismo porcentaje que alude a respuestas incorrectas. Como se ha comentado, Google se posiciona como 18 puntos más listo que Alexa, por lo que analizando las respuestas específicas de ambos dispositivos se ha resultado con que:

  • Alexa muestra un 44,9% de comunicaciones no comprendidas, un 39,9% correctas y el 15,2% equivocadas.
  • Google, por su parte, tiene un 57,4% de respuestas correctas, el 32,2 no comprendido y un 10,4 de errores.
  • Entretenimiento y finanzas son los sectores más fáciles de interpretar por los dispositivos de voz: el caso del primero por tratarse de un segmento con multitud de datos públicos y estructurados, y en el financiero, donde gran parte de las consultas más frecuentes son de tipo “glosario” o “búsqueda de términos”, casos que los asistentes resuelven particularmente bien.
  • De forma específica, los principales sectores de consulta recogen los siguientes porcentajes de acierto:
    • Entretenimiento: 84%
    • Finanzas y banca: 62,5%
    • Gran consumo/ cocina: 46,9%
    • Motor y movilidad: 46,6% o Viajes: 45,3%
    • Tecnología: 41,4%
    • Familia y bebés: 36,6%
    • Moda: 30%

De forma particular, los mejores resultados de Alexa se producen en cine/entretenimiento donde registra un 84% de aciertos, y cocina (52,9%); mientras que donde más falla es en moda (62,3% de errores) y en familia/bebés (81,3%). En cuanto a Google, destaca su pericia también en cine/entretenimiento (84% de aciertos) y finanzas (85,5%) y tiene sus puntos débiles en cocina (43,6% de fallos) y tecnología (39,3%).

“La tecnología de voz representa la primera aproximación de lo que será uno de los mayores desafíos de nuestro futuro próximo: la comunicación verbal entre humanos y tecnología. Un reto que todavía tiene que consolidar su propuesta de valor hacia el usuario y que, en la actualidad, se gestiona por separado y de forma independiente por cada uno de los agentes involucrados en la industria”, indicaba Nacho de Pinedo.

 

Otras conclusiones sobre las tecnologías de voz

  • Existe un elevado interés general por la tecnología, un 7,3 sobre 10; es un poco más elevado en el caso de los hombres (7,6 frente al 6,9 de las mujeres); casi indiferente a la edad y prominente entre andaluces (7,5) y madrileños (7,4).
  • Un 54% de la población española (75% dentro del grupo de los techies) utiliza la voz para realizar alguna acción con sus dispositivos inteligentes.
  • Entre los usos dominan los asistentes de voz (45%), seguidos de las funciones de automóvil (30%), la navegación por apps (23%) y las órdenes en casa como controlar las luces, la calefacción, poner música, etc. (7%). Además, aunque no se considera estrictamente un servicio de voz, un 63% de los ciudadanos envía mensajes de este tipo a través de sus apps de mensajería.
  • Entre las aplicaciones en las que se recurre a la voz como elemento de comunicación destacan las de música (64%), hogar (21%) y juegos y viajes (17%). Banca y salud están representadas con un 14 y un 12% respectivamente.
  • Comodidad y rapidez son las ventajas que incentivan el uso mientras que la privacidad y la inseguridad destacan como frenos al desarrollo.
  • Los altavoces inteligentes superan en penetración (15%) a drones y cámaras go-pro y tienen una previsión de compra próxima del 12%.

“Los datos nos dicen que estamos ante una tecnología incipiente, pero con un gran potencial de crecimiento. Muchos de los posibles casos de uso no están todavía cubiertos. Esto abre una ventana de oportunidad para que las marcas investiguen cómo pueden aportar valor a los usuarios en este nuevo canal, donde además nos están diciendo que están interesados en interactuar con sus marcas favoritas”, explicaba Aída Méndez.

De izq. a drcha.: Luis Héctor, Alba de Vera, Nieves Ábalos, Esther Checa y Enrique Tellado; componentes de la mesa redonda | Fuente: imagen propia

Al concluir con los datos del estudio, se ha completado el encuentro debatiendo sobre la información obtenida en una mesa redonda en la que han participado Alba de Vera, responsable de marketing para Asistente de Google en España y Portugal; Esther Checa, head of Innovation at T20 Media; Enrique Tellado, CEO de Evo Bank; Nieves Ábalos, chief producer & founder en Monoceros Labs; y Luis Héctor, senior business product manager en Amazon. Los expertos han coincidido en el avance tan rápido que está experimentando el audio, cargado de exigencias del consumidor, ante una tecnología que todavía está en desarrollo y manifiestan la importancia de dotar de utilidad a la voz para conseguir que sea una tecnología e interfaz efectiva.

“Todavía no le hemos dado suficiente utilidad al altavoz como para poder implementar otras opciones como la publicidad”, explicaba Luis Héctor, quien continuaba con el ejemplo de Youtube o las aplicaciones, en las cuales la publicidad no molesta como tal porque se está cumpliendo la función por la que se accede. En caso de añadir publicidad en los altavoces inteligentes, debería ser totalmente distinta: “No se puede utilizar como un dispositivo más, es necesario entender las estrategias de un modo distinto. La voz tiene la oportunidad de ofrecer experiencias que van más allá y es una gran oportunidad para las marcas, siempre que se aporte un valor adicional tanto para los anunciantes como para el usuario. Si se utiliza la publicidad como en un medio tradicional de advertasing, podemos brindar la muerte al dispositivo”.

De cara a un futuro próximo, además de dar un paso más en las preguntas hasta alcanzar una conversación entre ambas partes, los profesionales tienen una visión muy clara: “La voz integrada con la imagen es el paso necesario para que la tecnología por voz termine de eclosionar”.