lunes, 1 de octubre de 2012

Sherpa: un asistente de voz español para Android quiere retar a Siri

 
Tras recibir una indicación de voz, Sherpa conecta con el sitio web de música Goear para reproducir una canción sin necesidad de descargarla.

Sherpa, un asistente virtual compatible con el 95 por ciento de los teléfonos inteligentes Android, destaca por su avanzada tecnología de procesamiento del lenguaje natural.

No han pasado ni quince días desde que Apple anunciara que gracias a la actualización de su sistema operativo móvil ya podíamos hablar en español con Siri, su asistente virtual para teléfonos inteligentes, y ya le ha salido un competidor que asegura que entiende mucho mejor que él la lengua de Cervantes.
Se trata de Sherpa, una aplicación gratuita para móviles Android cuya versión beta puede descargarse desde hoy en Google Play, el antiguo Android Market. Tras ocho años de intenso trabajo, una start-up española liderada por el ingeniero Xabier Uribe-Etxebarria –uno de los 10 ganadores de la primera edición de los premios TR35 Spain- acaba de lanzarse a la competida arena de los asistentes virtuales.
Sherpa funciona en todos los modelos de móvil que tengan instalado el sistema operativo de Android en una versión igual o superior a la 2.2 (conocida como Froyo), es decir, en más del 95 por ciento de los dispositivos activos que utilizan este sistema, según estimaciones de la propia Android.
Además de dominar las funciones habituales de estos ‘ayudantes’, como ofrecer al usuario información del tiempo, facilitarle las búsquedas en Internet, o gestionar la agenda, Sherpa ofrece algunas más, que le son exclusivas. Entre ellas destaca la posibilidad de realizar transacciones a través de PayPal –por ejemplo, ordenando y confirmando una transferencia a un contacto guardado en el teléfono mediante la voz- y la de buscar billetes de avión a través de Lastminute.com aunque, en este caso, habría que hacer la compra desde el sitio web de esta página de ofertas.
Sherpa también permite al usuario publicar en su nombre en Facebook y Twitter y decirle al móvil que reproduzca una canción cualquiera, que pasa a sonar inmediatamente gracias a un acuerdo alcanzado con Goear para ofrecer música sin necesidad de descarga.
Esta nueva aplicación recopila la información de acceso de varias cuentas del usuario -como las de Facebook, PayPal y Twitter- en una base de datos situada en  su sistema de gestión. Estos datos están en la nube, por lo que podría acceder con su contraseña y usuario desde cualquier dispositivo. Del mismo modo, las búsquedas que el programa realiza extraen la información de servidores en línea, así que solo funciona cuando está conectado a Internet (a través de wifi o de una red 3G).
Por ahora no hay versión de Sherpa para tabletas aunque la empresa está trabajando en su desarrollo con la intención de incorporar esta posibilidad en la siguiente versión. “Por el momento estamos adaptándola para que se vea decentemente en ellas”, reconoce Uribe-Extebarria, que dirige un equipo de 12 personas.
Menos problemas habría con la incorporación de nuevos idiomas a Sherpa, ya que al disponer de un lenguaje intermedio de conceptos, no de palabras concretas, puede ser multilingüe. “Pensamos sacarla para varios idiomas. No hace falta hacer un desarrollo por cada uno”, asegura el ingeniero.  
Y es que aunque resulta gracioso escuchar las respuestas que ofrece su voz mecánica a preguntas diversas, Uribe-Etxebarria afirma que su objetivo no es que se utilice como un juego, sino “explotar su lado útil”.
Sherpa es rápido resolviendo tareas sencillas, como subir el volumen del terminal, dar el resultado del último partido de fútbol, buscar la previsión del tiempo o los restaurantes japoneses de la zona. Pero según su creador, si esta aplicación es “muy superior a lo que hemos podido ver hasta ahora en Android e incluso en otras plataformas" es debido, sobre todo, a su sistema de procesamiento de lenguaje natural y su capacidad de establecer un verdadero diálogo con el usuario.
Su tecnología de comprensión y gestión del diálogo está patentada a nivel internacional, y tal y como explica Deborah Dahl, responsable del diseño del sistema de comprensión del lenguaje Unisys de la Agencia de Investigación de Proyectos Avanzados de Defensa de Estados Unidos (DARPA), y autora de un informe en el que analiza el sistema de Sherpa, hay varias razones que lo diferencian.
La primera sería su “profundo y exhaustivo” conocimiento de los idiomas que analiza. El núcleo del sistema de Sherpa incluye 250.000 conceptos y 5.000 reglas sintácticas y semánticas, junto a los diccionarios necesarios para dar soporte a los conceptos. "Este conocimiento general ha sido testeado mucho más concienzudamente que el que pueda haber sido creado solo para una aplicación en concreto y, por tanto, es mucho más fiable”, explica Dahl.
Las otras dos características que destaca la experta en su informe -fechado en agosto de este año- son “el énfasis en las representaciones conceptuales derivadas del análisis, que son independientes del idioma en sí, y su proceso de análisis lingüístico, que integra cinco niveles”.
Los cinco estratos de procesado a los que se refiere son los que permiten eliminar ambigüedades y acertar sobre la intención real del usuario, independientemente del idioma que éste hable. El proceso comienza con un reconocimiento automático de voz que convierte ésta en texto. A continuación Sherpa lo analiza para extraer su significado realizando los cinco análisis: morfológico, sintáctico, semántico, pragmático y funcional. Todo ello se lleva a cabo en el módulo de procesamiento de lenguaje natural, donde se extraen los conceptos de lo que el usuario ha dicho. "Trabajamos los significados, no las palabras", recuerda Uribe-Etxebarria.
Un vez que Sherpa conoce los conceptos entra en juego el sistema de diálogo, que pregunta al usuario por los datos que le faltan para poder realizar una acción por él. Cuando dispone de toda la información que necesita -que es diferente para cada ‘tarea’- conecta con las Interfaces de Programación de Aplicaciones (API, por sus siglas en inglés) de diferentes servicios externos, como Facebook o Twitter, donde realiza la acción y obtiene la confirmación de que se ha hecho correctamente.
Todos estos procesos pasan también por el sistema de gestión, que es el que identifica, por ejemplo, con qué cuenta quiere el usuario hacer un pago, o se asegura de responderle a un saludo mencionando su nombre su pila.
Aunque desde Sherpa dicen que la competencia con Apple no es directa, ambos han entrado en el mismo mercado, el de las búsquedas a través de la voz, en el que según la consultora Gartner “los ingresos por publicidad en el móvil aumentarán hasta superar el 40 por ciento en 2015”.
Además, desde el punto de vista tecnológico, la comparación con el asistente virtual de Apple es inevitable. "Siri no establece un diálogo real", explica Dahl en su informe. "El usuario hace una petición y Siri ofrece una respuesta, pero raramente te entiende si repreguntas sobre la respuesta anterior", explica la investigadora.
Aunque Sherpa sale después de que Apple anunciara su versión de Siri en español, Uribe-Extebarria no cree que esto vaya a perjudicarles, ya que además de estar orientados a plataformas diferentes considera que ellos son “tecnológicamente superiores”.
Como ejemplo de ello destaca su modulo de adquisición de conocimiento, que Sherpa utiliza para resolver preguntas como: “¿Dónde nació Obama?”. Siri utiliza para este tipo de consultas el motor de búsqueda Wolfram Alpha, que solo tiene versión en inglés. Sherpa, en su lugar, utiliza otras fuentes diversas, como Wikipedia o el proyecto de Web semántica DBpedia, lo que le permite ser mucho más efectivo. “Como no existía Wolfram Alpha en español, Apple le quitó a Siri en español esas funcionalidades”, comenta el emprendedor.
Apple no ha respondido a MIT Technology Review en español sobre estos aspectos antes de la fecha de publicación de este artículo.
Por su parte, la compañía de software de reconocimiento de voz Nuance anunciaba esta misma semana que estaba trabajando con varios fabricantes de chips para que los usuarios pudieran darle órdenes de voz a su smartphone incluso cuando esté en modo 'sueño', gracias a una escucha constante. A Uribe-Etxebarria se gusta está aplicación pero considera que aún no ha sido suficientemente probada. "Hay que mirar dos cosas: que funcione correctamente y el rendimiento de la batería", explica. "Nosotros estamos buscando otras opciones para lograr el mismo efecto".
Además de disponer de un asistente virtual propio, Dragon go!, que a diferencia de Siri funciona también para dispositivos iOS anteriores al iPhone 4S, Nuance compró en 2011 al que será otro de los competidores de Sherpa, Vlingo, cuyo asistente de voz tiene versiones para Symbian, Android, iPhone y BlackBerry. "Es un competidor muy serio, con más recursos de nosotros", reconoce Uribe. "Tenemos una tecnología superior pero tenemos que hacer bien la ejecución", añade.
En cuanto al modelo de negocio, Sherpa ha llegado a acuerdos con algunas empresas para recibir compensaciones por enviar tráfico a sus webs y están valorando también la inserción de anuncios, pero Uribe-Extebarria asegura que no es algo que les preocupe en este momento. “Queremos que la gente lo use”, insiste. ”Si tenemos algo útil, luego es fácil de monetizar”.
El emprendedor se muestra optimista con el lanzamiento pero puntualiza que solo hemos visto una mínima parte de lo que esta tecnología puede aportar: “un 0,001 por ciento”, aventura. Su visión para Sherpa es seguir perfeccionándola hasta exprimirla mucho más. ”Sabemos que estamos lejos, pero estamos más cerca que otros”, afirma.
En este sentido Sherpa es un reflejo de la ambición de su creador. Si le preguntas “¿Me quieres?” su respuesta es toda una declaración de intenciones: “¿Qué crees, que me voy a rendir a tus pies como un Siri cualquiera?”
Copyright Technology Review 2012.

No hay comentarios:

Publicar un comentario