blog

Alexa (también) susurra

Alexa (también) susurra

Soy ese tipo de persona que necesita un poco de ruido de radio de fondo (normalmente algún programa de radio deportivo) para dormirse, y por eso tengo un despertador que puedo programar para que se apague al cabo de X minutos, cuando con suerte ya estoy dormido. Hace un mes, sin embargo, mi radio despertador dejó de funcionar, y me encontré comprando y devolviendo varios dispositivos despertadores de distintas marcas. ¿Por qué ? sólo porque el nivel sonoro más bajo de la mayoría de esos aparatos era tan alto que no conseguía dormirme en absoluto (ni mi mujer, que suele usar tapones para los oídos para evitar el ruido).

Así que después de mi último intento fallido, le di una oportunidad a Alexa: Cogí el Echo Dot que tengo en nuestro salón, y lo trasladé a mi dormitorio. Programé el despertador para que me despertara por la mañana, y empecé a usar la radio despertador por la noche con mi programa deportivo favorito (bueno, favorito no es la palabra; simplemente el que es tan aburrido que me duermo fácilmente). Después de lanzarlo, sólo tengo que decir «Alexa, en 20 minutos detén el programa».

Como nuestro dormitorio está al lado del de nuestro hijo, la primera noche le pasé las instrucciones a Alexa en un susurro. Entonces me sorprendió mucho la reacción de Alexa, que también me susurró su respuesta. Al principio era un poco espeluznante (¡pruébalo!), pero una vez que me acostumbré me encantó, y ahora susurrar órdenes a Alexa se ha convertido en mi rutina antes de acostarme.

Para mí, esta capacidad de susurrar es bastante interesante: ¿cómo se adapta el reconocimiento automático de voz (ASR) a esta entrada ? ¿se trata de una simple adaptación de los modelos aprendidos para el habla normal, o por el contrario hay que volver a entrenar toda la pila ASR a propósito para esta entrada susurrada? y si es necesario un entrenamiento, qué llevó a los diseñadores de producto de AWS a tomar la decisión de incorporar esta modalidad de comunicación, que no parece ser realmente crucial (basta con bajar el volumen de Alexa para comunicar el efecto de que el usuario desea una interacción menos ruidosa).

Pero en realidad, lo que realmente me sorprende es el hecho de que la tecnología Alexa tenga capacidades ocultas que aparecen cuando el usuario siente que deben estar ahí. ¿Qué me llevó a hablar con Alexa en un susurro? Creo que fue la confianza que tengo en la tecnología que hay detrás para poder entender un susurro. Y ahora, la confianza no ha hecho más que crecer, debido a la sorpresa de ser respondido con una salida susurrada.

Construir tecnología para que la use la gente no es una tarea nada fácil; te mueves entre las necesidades del usuario (product market fit) y cualquier cosa que se te ocurra que crees que es una funcionalidad bonita – que luego, si eres un equipo como el nuestro en Conversaciones sobre el procesoque viene del mundo académico, es un riesgo enorme. El encaje del producto en el mercado es realmente un elemento necesario para cualquier negocio viable, ya que de lo contrario estarás creando un software que nadie quiere y, por tanto, nadie compra.

Paralelamente al desarrollo de tecnología guiado por el encaje del producto en el mercado, cualquier empresa de software necesita generar confianza en su tecnología. Yo no diría que es una dimensión secundaria, menos importante que la adecuación del producto al mercado. En cambio, creo que es un objetivo a largo plazo que debe considerarse desde las primeras fases y no puede relegarse a una etapa posterior. Porque cuando el producto esté listo, otras métricas (como el churn) se manifestarán como muy importantes, y la confianza que construyas en la relación software-usuarios sin duda contribuirá positivamente en ellas.

De momento, me va a costar no susurrar más a cualquiera de mis futuras radios despertador …

Facebook
Twitter
LinkedIn