jueves, 7 de octubre de 2010

Ver el futuro con una búsqueda


Una startup llamada Recorded Future ha desarrollado una herramienta que rastrea datos de Internet en tiempo real en busca de pistas sobre lo que sucederá en el futuro. La herramienta de búsqueda de la empresa devuelve resultados en una escala de tiempo que se extiende hacia el futuro, además de hacia el pasado.

La empresa, que sólo tiene 18 meses, atrajo la atención a principios de este año después de recibir dinero de los brazos de capital de riesgo de Google y de la CIA. Recientemente, la empresa ha ofrecido un primer vistazo a cómo funciona su tecnología.

Los motores de búsqueda convencionales como Google utilizan los enlaces para ordenar y conectar las diferentes páginas web. El software de Recorded Future va a un nivel más profundo, analizando el contenido de las páginas para rastrear el las conexiones "invisibles" entre las personas, lugares y acontecimientos descritos.

"Eso me permite buscar patrones específicos, como los próximos lanzamientos de productos de Apple, o identificar cuándo una empresa tiene previsto invertir o expandirse a la India", afirma Christopher Ahlberg, fundador de la empresa con sede en Boston.

La búsqueda de información sobre la empresa farmacéutica Merck, por ejemplo, genera un calendario que muestra no sólo las noticias recientes sobre los ingresos de la empresa, sino también cuándo terminaran varios ensayos clínicos de fármacos registrados en la página web clinicaltrials.gov. Otra investigación reveló cuándo esperan varios medios de comunicación que Facebook realice su oferta pública inicial.

Esto se hace utilizando un índice actualizado constantemente de lo que Ahlberg llama "datos de flujo", incluyendo artículos de noticias, solicitudes a los organismos reguladores del gobierno, actualizaciones de Twitter, y transcripciones de informes de beneficios o discursos políticos y económicos. Recorded Future utiliza algoritmos lingüísticos para identificar los tipos específicos de eventos, tales como lanzamientos de productos, fusiones o catástrofes naturales, la fecha en que los acontecimientos suceden, y las entidades relacionadas, como personas, empresas y países. La herramienta también puede seguir el sentimiento de la cobertura sobre empresas, clasificándolo como bueno o malo.

La base de clientes de Recorded Future se encuentra actualmente por debajo de los cien, indica Ahlberg. Ésta incluye una mezcla de entidades financieras, analistas del gobierno y analistas de los medios de comunicación, que pagan una cuota mensual para acceder a la herramienta en línea. "Los analistas del gobierno están interesados en el seguimiento de personas y lugares, mientras que los servicios financieros tienen interés en obtener información sobre los próximos eventos en torno a determinadas empresas", señala Ahlberg.

Además de proporcionar una interfaz elegante para realizar búsquedas que devuelven calendarios con los resultados (ver video), Recorded Future también ofrece varios boletines de correo electrónico gratuitos para indicar a los usuarios hacia las predicciones más destacadas. También permite que los clientes escriban software basado en los datos de esta herramienta y el análisis a través de interfaces de programación de aplicaciones o APIs (por sus siglas en inglés).

Con el tiempo, esto podría llevar al desarrollo de aplicaciones orientadas a los consumidores, afirma Ahlberg. "Si estoy a punto de comprar un iPhone, es probable que quiera saber si voy a parecer estúpido porque van a lanzar uno nuevo la semana que viene, o el tiempo que generalmente toma a los competidores lanzar los productos después de un nuevo lanzamiento de Apple." Los analistas financieros ya están utilizando la API de la empresa para sobreponer o incluso integrar los datos de Recorded Future en sus propios modelos, señala él.

"Hemos demostrado que nuestros datos pueden realizar predicciones importante", afirma Ahlberg, citando estudios que compararon los datos devueltos por Recorded Future con los cambios en el volumen de actividad en unas acciones financieras determinadas. "Hemos encontrado que nuestras medida del momento, la cual indica la intensidad de la actividad en torno a un evento o entidad, y nuestros futuros eventos corresponden con el volumen de la actividad del mercado", destaca Ahlberg.

Las herramientas de su empresa también se pueden utilizar para averiguar qué fuentes de información dan las mejores pistas en cuanto a eventos futuros. Un análisis reciente mostró que los artículos de uno de los blogs del Financial Times eran mejores que otras fuentes de información en la predicción del rendimiento de las empresas en el índice de acciones S&P 500. Los artículos negativos sobre una empresa estaban relacionados con un rendimiento por debajo del mercado la semana siguiente, mientras que los positivos estaban relacionados con un rendimiento superior al del mercado.

"Lo que realmente están haciendo aquí es identificar y cotejar las declaraciones que se han hecho sobre el futuro", explica Steven Skiena de la Universidad Estatal de Nueva York en Stony Brook. Skiena ha desarrollado una tecnología similar utilizada por otra startup,General Sentiment, para minar el material de las noticias y los blogs. "Un analista puede utilizarlo entonces para realizar sus propias predicciones, menos arriesgado que Recorded Future, quien está realizando predicciones por sí misma."

Hay varias herramientas capaces de extraer los acontecimientos, personas y empresas de un texto, pero la distribución de esta información en el tiempo es una tarea más difícil, afirma Panagiotis Ipeirotis de la Escuela de Negocios Leonard Stern de la Universidad de Nueva York. Ipeirotis investiga cómo se pueden extraer los datos económicamente importantes de las fuentes de noticias los medios de comunicación social en línea. "El análisis de secuencias de eventos es muy interesante, y casi inexplorado en la literatura de investigación", señala él. "Incluso el conseguir datos decentemente sincronizados de los artículos de noticias a fin de generar correctamente las secuencias de eventos es un problema difícil."

Este enfoque en el calendario es lo que diferencia Recorded Future de las otras empresas que están intentado obtener conocimientos a partir de la extracción de datos de noticías y otras fuentes, afirma Ipeirotis. "Tengo curiosidad por ver si otras empresas de análisis de texto se unirán a la tendencia."

Recorded Future está a punto de ampliar su servicio para cubrir también las fuentes árabes chinas. Ampliar sus índices es una prioridad importante. "Me gustaría ser capaz de disponer de todas y cada una de las fuentes de datos del planeta", afirma Ahlberg.

A medida que las bases de datos cubiertas por Recorded Future, General Sentiment, y otras crezcan, se podrán realizar nuevos tipos de análisis más potentes, destaca Skiena. "Actualmente estoy trabajando con los científicos sociales en unos modelos para predecir cuál es la probabilidad de que una persona que actualmente recibe pocas menciones de repente se vuelva muy famosa en el futuro, mediante el estudio de los datos de varios años atrás", indica él.

No hay comentarios:

Publicar un comentario