jueves, 6 de octubre de 2011

Al nuevo iPhone de Apple le gustaría decir unas palabras



Un asistente personal con IA llamado Siri es la principal novedad del iPhone 4S.

En 2007, el recientemente fallecido fundador de Apple, Steve Jobs afirmó ante el mundo entero que los teléfonos de su compañía se podrían controlar con "el mejor dispositivo de señalización del mundo... nuestros dedos".
El pasado martes, la compañía anunció que los usuarios del siguiente iPhone, el 4S, también serán capaces de utilizar la voz para controlarlo.
Al mantener pulsado el botón de "Inicio" en el nuevo iPhone 4S, disponible en EE.UU. a partir del 14 de octubre, accedemos a un "asistente personal" conocido como Siri, capaz de comprender órdenes dadas en inglés, francés o alemán. Responde con un estilo conversacional mediante texto y voz sintetizada.

El evento del martes fue el primer lanzamiento de Apple presidido por Tim Cook, convertido recientemente en director general después de que Steve Jobs se retirase por razones médicas. Cook abrió la presentación en el estilo ya familiar establecido por Jobs, bromeando con los periodistas asistentes y dedicando tiempo a hacer alarde de las cifras de ventas y las nuevas aperturas de tiendas. 

Sin embargo, Cook no estuvo en el escenario para la noticia más importante del evento, dejando la presentación de Siri en manos de Phil Schiller, vicepresidente senior de Apple para la comercialización de productos a nivel mundial. No obstante, Cook regresó al escenario para resumir las noticias del día, declarándose "increíblemente orgulloso de esta empresa". No hizo ninguna referencia a Steve Jobs.

Las demostraciones en el escenario del evento de lanzamiento, celebrado en la sede de Apple en Cupertino, California, incluyeron preguntas del tipo "¿Qué tiempo hace hoy?", a lo que Siri respondió mostrando y comentando en voz alta un pronóstico según la ubicación actual del propietario del teléfono. Cuando se planteó la cuestión de forma más coloquial, diciendo "¿Me tengo que poner el impermeable hoy?" Siri respondió de forma similar: "La verdad es que parece que va a llover". 

Siri se basa en una serie de fuentes de información en línea, desde pronósticos meteorológicos a negocios locales, así como en el motor de búsqueda de preguntas y respuesta Wolfram Alpha. Siri es capaz de encontrar restaurantes en respuesta a una pregunta como "Búscame un buen restaurante griego en Palo Alto", e incluso se ofrece para reservar una mesa. Wolfram Alpha permite a Siri tramitar peticiones como "¿Cuántos dólares son 45 euros?". El asistente personal es también capaz de hacerse cargo del teléfono de una persona llevar a cabo acciones como establecer alarmas o recordatorios de reuniones, en respuesta a comandos como "despiértame a las 6 de la mañana". 

La tecnología en que se basa Siri se originó en un proyecto de investigación financiado por la DARPA (la Agencia Estadounidense de Proyectos de Investigación de Defensa Avanzados) realizada en el laboratorio privado de investigación SRI International, y se utilizó para lanzar una startup y la aplicación Siri para el iPhone en 2009. Siri fue una de las 10 tecnologías a las que seguirles la pista en 2009 según Technology Review, y Apple compró la compañía en 2010. 

Una característica nueva e independiente, Dictation, permite a los usuarios del nuevo iPhone utilizar el reconocimiento de voz para componer mensajes de texto o correos electrónicos, algo que ya es posible para los usuarios del software Android de Google para teléfonos y tabletas.

Contrariamente a lo habitual en Apple, que se enorgullece de crear dispositivos y software obsesivamente pulidos que "simplemente funcionan", tanto Siri como la función de dictado fueron etiquetadas como productos "beta". Una posible razón es que al igual que toda la tecnología de reconocimiento de voz, la que Apple ha obtenido de la compañía de software Nuance para Siri y Dictation no siempre logra ser perfectamente exacta. 

Aparte de Siri y Dictation, el nuevo iPhone 4S tiene una apariencia idéntica a la del modelo anterior, el iPhone 4, aunque ha mejorado los componentes en el interior, incluyendo un procesador más potente y una cámara mejorada.

Norman Winarsky, desde SRI International, trabajó en el proyecto que dio lugar a Siri y fue cofundador de la compañía que lanzó su aplicación original. Señala que la versión que Apple ha dado a conocer es ahora más potente. "No está únicamente conectada a varios servicios web, sino también a nuestros calendarios, contactos, música y todo lo que tengamos en el teléfono", afirma. Colocar Siri en el corazón de un dispositivo potente y popular representa "un cambio de paradigma en cómo las personas pueden interactuar con su dispositivo y otros servicios", añade.

Winarsky indica que la interfaz basada en el habla de Siri no es su característica más impresionante. "Reconocer el habla se ha convertido en algo básico. Lo que cuesta cientos de millones en investigación es encontrar la intención de lo que se ha dicho y hacer que coincida con los servicios web disponibles". Winarsky y sus colegas en SRI hicieron que su tecnología fuera capaz de manejar la ambigüedad y la variabilidad en el habla, lo que permite a Siri hacer frente a órdenes dictadas de forma casual y que los usuarios no tengan que usar una frase cuidadosamente preparada, concluye.
Copyright Technology Review 2011.

No hay comentarios:

Publicar un comentario