jueves, 29 de julio de 2010

Google y el Cloud Computing


Por Stephen Baker. BusinessWeek. --------------------------------


Una simple pregunta. Sólo eso necesitó Christophe Bisciglia para desconcertar a confiados aspirantes laborales en Google. Bisciglia, un ingeniero en programación de 27 años, rasgos angulosos, pelo largo y ondulado, quería comprobar si estos estudiantes estaban listos para pensar como googlers. “Díganme”, decía, “¿qué harían si tuvieran una cantidad mil veces mayor de información?”

Qué idea tan extraña. Si retornaran a sus proyectos escolares y fueran lo suficientemente ilusos como para memorizar fórmulas con 1000 detalles más sobre compras online, sobre mapas o con archivos de video, disminuirían de manera notable sus servidores universitarios.

En ese momento de la entrevista, Bisciglia explicaba su pregunta. Para que Google prosperara, les decía, deberían aprender a trabajar –y a soñar– en escalas más amplias. Y describía el mundo de Google: una cadena de computadoras que se está extendiendo cada vez más. Claro, todos contestaron preguntas sobre búsquedas de manera instantánea. Pero también bombardearon pilas de datos, buscando respuestas e información inteligente más rápido que cualquier otra máquina en el mundo. La mayor parte de este hardware no estaba en el campus de Google. Se encontraba sencillamente allá afuera, en algún punto de la tierra, zumbando en enormes y refrigerados centros de información de datos. La gente en Google lo llamaba “la nube”. Y uno de los desafíos de programación era hacer palanca en esa nube –llevarla a aplastar a máquinas más pequeñas. Los nuevos empleados de Google, dice Bisciglia, generalmente tardan unos pocos meses en trabajar a esta escala. “Luego, un día alguien sugiere un trabajo fuera de lo común, un trabajo que necesita 1000 máquinas distintas y uno dice ‘Sí, entiende todo’”.

Bisciglia decidió eventualmente que lo que los reclusos necesitaban era entrenamiento avanzado. Entonces, un año atrás, un día de otoño, cuando se encontró con Eric E. Schmidt, el CEO de Google, entre reuniones, dejó escapar una idea. Emplearía el 20 por ciento de su tiempo, lo que los googlers utilizan para proyectos independientes, para lanzar un curso. En su alma mater, la Universidad de Washington, iniciaría a los estudiantes en la “programación a escala de nube”. Lo llamaría Google 101. Y a Schmidt le fascinó el plan. En los meses siguientes, el Google 101 de Bisciglia se desarrolló y creció. Y llegó a ambicionar una asociación con IBM, que sería anunciada en octubre, para acercar estas nubes-informáticas-estilo-Google a universidades alrededor del mundo.

A medida que el concepto se propaga, promete expandir la marca registrada de Google más allá de la industria de la búsqueda, los medios y los avisos publicitarios, para llevar al gigante al campo de la investigación científica y, quizá, de nuevos negocios. En este proceso, la firma se podría transformar, de algún modo, en la computadora primaria del mundo.

“Originalmente creía que Bisciglia trabajaría en educación, lo que me resultaba bien”, dice Schmidt una tarde en las oficinas centrales. “Nueve meses después, aparece con esta nueva estrategia de la nube, algo absolutamente inesperado”. La idea, tal y como fue concebida, surgía para repartir entre estudiantes, investigadores y emprendedores el inmenso poder de Google y su estilo en informática, ya fuera vía las máquinas de Google mismo u otras que ofrecieran el servicio.

¿Qué es la “Google Cloud”, como se la llama? Es una cadena conformada por cientos de miles –algunos estiman millones– de servidores económicos, cada uno apenas más poderoso que las computadoras que cualquiera posee en su hogar. Almacena cantidades alternadas de información, que incluyen numerosas copias de sitios de Internet. Esto agiliza la búsqueda, ayudando a descubrir respuestas a millones de dudas en fracciones de segundos. Al contrario de las tradicionales supercomputadoras, el sistema Google no envejece. Cuando sus piezas individuales mueren, generalmente luego de tres años, los ingenieros las desechan y las reemplazan con nuevas y más rápidas piezas. Esto quiere decir que la nube se regenera mientras crece, casi como un ser viviente.

Este avance hacia “las nubes” señala un cambio fundamental en la manera en que manejamos la información. Básicamente, la informática es equivalente a la revolución que la electricidad provocó un siglo atrás cuando los centros y los comercios cerraron sus propios generadores y adquirieron el servicio de eficientes empresas industriales. Hacía tiempo que los ejecutivos de Google habían imaginado este cambio y se habían preparado para él. Servicios en forma de nube, con su propia maquinaria como eje, encajaba perfecto dentro de la gran visión de la compañía, establecida una década atrás por sus fundadores Sergey Brin y Larry Page: “para organizar el mundo de la información y hacerlo universalmente accesible”. La idea de Bisciglia abrió un camino hacia el futuro. “Quizá ya lo tenían en mente y no me lo habían dicho”, dice Schmidt. “No me di cuenta de que Bisciglia iba a tratar de cambiar el modo en que los científicos piensan acerca de la informática. Esa es una ambición mucho mayor”.

Calle de un único sentido
Para pequeñas empresas y emprendedores, la “nube” significa oportunidad –nivelación en el campo de juego para una mayor cantidad de datos y formas intensivas de informática. Hasta la fecha, únicamente un grupo de selectos que manejan las nubes de los gigantes de Internet consiguió las fuentes para extraer grandes masas de información y construir negocios alrededor. Nuestras palabras, imágenes, clicks y búsquedas son la materia prima de esta industria. Pero fue una calle de un único sentido. La humanidad emite los datos y un puñado de compañías –similares a Google, Yahoo! o Amazon.com– transforman la información en insights, servicios y, finalmente, en ingresos.

Este status quo ya está comenzando a cambiar. El año pasado, Amazon abrió sus propias cadenas de computadoras para clientes pagos, iniciando a nuevos players, grandes y pequeños, en la informática en forma de nube. Algunos usuarios simplemente estatizan sus bases de datos masivas junto con Amazon.

Otros utilizan sus computadoras para extraer datos o crear servicios por Internet. En noviembre, Yahoo! abrió un grupo de máquinas –una pequeña nube– para investigadores de la Carnegie Mellon University. Y Microsoft profundizó sus vínculos con comunidades de investigadores científicos ofreciéndoles acceso a sus propios centros de servidores. Mientras estas nubes crecen, asegura Frank Gens, analista superior en investigación de mercado en IDC, “una nueva comunidad de startups en la Web tendrán acceso a estas máquinas. Es como si estuvieran plantando semillas de Google”. Muchos de estos nuevos emprendimientos surgirán de la medicina y de la ciencia, mientras que los laboratorios de datacrunching que buscan nuevos materiales y medicamentos establecen sus negocios en las nubes.

Para que las nubes alcancen su potencial, deberían ser tan fáciles de programar y de navegar como la Web misma. Ésto, aseguran los analistas, debería abrir mercados para la búsqueda en nube y herramientas de software –un negocio natural para Google y sus competidores. Schmidt no asegura cuánto de su propia capacidad Google le ofrece a ajenos, o bajo qué condiciones o a qué precios. “Típicamente, preferimos empezar gratis”, manifiesta, y agrega que los usuarios más poderosos “probablemente se hagan cargo de parte del costo”. ¿Cuánto crecerán estas nubes? “No existe un límite”, afirma Schmidt. Mientras que esta estrategia se devela, más personas ven que Google está preparado para transformarse en una fuerza dominante en la próxima fase de la informática. “Aspiramos a ser una gran porción de la nube, o una nube misma con la que interactuar cada día”, explica el CEO. ¿Y el business plan? Por ahora, se mantiene arraigado en el centro del negocio, los ingresos publicitarios. La iniciativa de la nube es apenas una pequeña parte en términos de inversiones.

Cambiar la naturaleza de la informática y la investigación científica no era una prioridad en la agenda de Bisciglia el día que “atrapó” a Schmidt. Lo que realmente quería, dice, era volver a la escuela. Al contrario de la mayoría de sus colegas de la organización, un lugar repleto de PhDs, Bisciglia fue capturado por la compañía ni bien se graduó de la Universidad de Washington, o la U-Dub, como la llaman. Era su primer título en algo. Deseaba un corte en su “Google-rutina” –las 10 horas de trabajo diario construyendo algoritmos de búsqueda en su cubículo en el Edificio 44, los largos viajes al trabajo en los Google buses desde el departamento que compartía con tres compañeros en San Francisco’s Double Triangle. Quería volver a Seattle, aunque fuera sólo un día a la semana, y trabajar con su profesor y mentor, Ed Lazowska. “Moría por ponerme a enseñar”, asegura.

No lo pensó dos veces antes de lanzarse de lleno sobre el mapa organizacional y estampar su idea directamente con el CEO. Bisciglia y Schmidt se conocían hacía años. Poco tiempo después de aterrizar en la firma cinco años atrás como un programador de apenas 22 años, Bisciglia ya trabajaba en un cubículo al otro lado de la oficina del CEO. Deambulaba cerca, asegura, atraído en parte por unos aviones para armar que le recordaban a cuando su madre trabajaba como azafata en United Airlines. Naturalmente, dialogaba con el CEO sobre informática. Era como estar en la universidad. E incluso luego de que Bisciglia se mudara a otros edificios, siguieron en contacto. (“No es muy complicado seguirle el rastro y es increíble para responder e-mails”, dice Bisciglia).

El día que hablaron por primera vez de Google 101, Schmidt le dio un pequeño gran consejo: reducir el proyecto hacia algo que pudiera resolver fácilmente y poner en práctica en dos meses. “Realmente, no me importaba qué fuera a hacer”, recuerda Schmidt. Pero quería que el joven ingeniero obtuviera feedback de inmediato. Incluso si fracasaba, afirma. “Es inteligente y aprendería de eso”.
Para lanzar Google 101, Bisciglia debía reproducir la dinámica y parte de la magia de la Google Cloud –pero sin intervenir las nubes mismas y sin revelar sus secretos mejor guardados. Estos secretos alientan interminables especulaciones entre científicos informáticos. Pero Google se mantiene encubierto. Esta inmensa computadora, después de todo, es la que dirige la compañía. Maneja automáticamente búsquedas, ubica avisos publicitarios, se mueve a través de e-mails. La PC trabaja y miles de ingenieros, Bisciglia incluido, apenas sirven a la máquina. Le enseñan nuevos trucos al sistema o encuentran novedosos mercados para invadir. Y agregan nuevos grupos –cuatro centros de datos solamente este año, con un costo promedio de US$ 600 millones cada uno.

Al construir esta máquina, Google, famosa por sus motores de búsqueda, está preparada para adquirir un nuevo rol en la industria informática. No tantos años atrás, científicos e investigadores recurrían a laboratorios nacionales para lo último en materia de investigación informática. Hoy en día, afirma Daniel Frye, vicepresidente de Desarrollo de Sistemas Abiertos en IBM, “Google está haciendo el trabajo que diez años atrás hubiera sido asignado a un laboratorio nacional”.

¿Cómo iba a hacer Bisciglia para darles acceso a los estudiantes a esta máquina? La opción más simple hubiera sido conectar su clase directamente en la computadora. Pero la compañía no dejaría que alumnos navegaran en una máquina cargada con software privado, repleto de datos personales y que manejara un negocio de US$ 10,6 mil millones. Entonces, el ejecutivo compró un asequible grupo de cuarenta computadoras. Ubicó el pedido y después comenzó a pensar cómo pagar por los servidores. Mientras el vendedor estaba instalando las computadoras, el ejecutivo le advirtió a un par de gerentes que pronto tendrían una factura que pagar. Luego “envío la boleta con los gastos pagos, y nadie pudo decir que no”. Y agrega uno de sus dichos favoritos: “Es mucho más fácil rogar por perdón que pedir permiso”. (“Si Usted está interesado en alguien que siga las reglas al pie de la letra, no cuente con Christophe”, asegura Lazowska, que se refiere al grupo de computadoras como “un regalo del cielo”).

Un alumno frenético
El 10 de noviembre de 2006, las máquinas desembarcaron en el edificio de Ciencia Informática de la U-Dub. Bisciglia y algunos administradores técnicos debían resolver cómo alzar cuatro pisos el cargamento de una tonelada hacia el adonde se encontraba el servidor. Eventualmente lo lograron y luego se prepararon para el comienzo de clases, en enero.

La madre de Bisciglia, Brenda, asegura que su hijo daba la impresión de estar marcado por un camino especial desde el principio. No habló hasta los dos años y luego empezó con oraciones. Una de sus primeras apareció cuando ella estaba conduciendo. Un insecto voló dentro la boca de su madre y una vocecita salió de la parte trasera del auto: “Mami, hay algo artificial en tu boca”.

En la escuela, sus infinitas preguntas y su velocidad frenética para aprender exasperaban a los maestros. Sus padres, al verlo triste y frustrado, lo sacaron del colegio y le brindaron educación en su casa por tres años. Bisciglia dice que extrañaba la compañía de otros chicos de su edad durante ese período, pero que se desarrolló como emprendedor. Tenía pasión por los caballos islandeses y, cuando era adolescente, incursionó en los negocios criándolos. Una vez, cuenta su padre Jim, fueron juntos hasta Manitoba y compraron caballos, sin tener idea de cómo llevar los animales a su casa. “Todo el viaje de vuelta fue como una escena de una película de Chevy Chase”, recuerda. Christophe aprendió sobre computadoras y desarrollo de páginas web para sus ventas con los caballos y para el negocio de su padre, un crucero de lujo. Y luego de concluir esa etapa, las computadoras prometían un futuro más brillante que el del cuidado de animales. Entonces ingresó en la U-Dub y se anotó en la mayor cantidad de cursos de matemática, física e informática que pudo.

A mediados de 2006, mientras iba y venía entre Googleplex y los preparativos para Google 101 en Seattle, Bisciglia usó sus habilidades como emprendedor para armar un particular grupo de voluntarios. Trabajó con internos universitarios para desarrollar un currículum y reunió a un par de colegas de Google del cercano Kirkland, para que usaran parte del 20 por ciento de su tiempo para ayudarlo a enseñar. Siguiendo el consejo de Schmidt, Bisciglia trabajó para focalizar Google 101 en algo que los estudiantes fueran capaces de aprender rápidamente. “Era como si pensara ‘¿qué puedo enseñarles en dos meses que sea útil e importante?´”, recuerda. Su respuesta fue “MapReduce”.

Bisciglia adora MapReduce, el software que se encuentra en el centro de la informática propia de Google. Mientras que los famosos algoritmos de investigación de la compañía proveen la inteligencia para cada nueva búsqueda, MapReduce ofrece la velocidad y el peso industrial. Divide cada tarea en miles de tareas diferentes y las distribuye entre una multitud de computadoras. En una fracción de segundo, mientras cada una vuelve a su sitio con su parte de la información, MapReduce velozmente reúne las distintas respuestas en una única respuesta. Otros programas realizan el mismo trabajo. Pero MapReduce es incluso más rápido y da la impresión de manejar trabajo en cantidades ilimitadas. Cuando el tema aparece en una conversación, Bisciglia se entusiasma. “Recuerdo graduarme, venir a trabajar a Google, aprender sobre MapReduce y cambiar mi manera de ver la ciencia informática y todo lo que ella implica”, asegura. Lo define como “un modelo de programación muy simple y elegante”. Fue ideado por otro alumno de la Universidad de Washington, Jeffrey Dean. Volviendo a la U-Dub y enseñando MapReduce, Bisciglia estaría devolviendo este software y su “manera de pensar” de vuelta a sus raíces.

Sólo existía un obstáculo. MapReduce estaba anclado de manera segura dentro de la máquina de Google –y no era exactamente para consumo externo, aunque la materia a enseñar fuera Google 101. La compañía compartía poca información sobre el programa, aunque alimentaba una versión de fuente abierta de MapReduce llamada Hadoop. La idea era que, sin divulgar su joya tan bien guardada, Google pudiera empujar hacia delante su estándar para convertirse en el arquitecto de la informática en forma de nube.

El grupo que había desarrollado Hadoop pertenecía a una compañía adquirida, Nutch. Curiosamente, estaban trabajando puertas adentro en Yahoo!, que tenía en cuenta a los “hijos” de MapReduce para darle a sus propias computadoras un poco de la magia de Google. Sin embargo, Hadoop permanecía como una fuente de código abierto, lo que significaba que el equipo de Google podía adaptarlo e instalarlo gratuitamente en el grupo de trabajo de la U-Dub.

Los estudiantes corrieron a anotarse al curso sobre Google 101 tan pronto como apareció en el plan de estudios del semestre de invierno. Al principio, Bisciglia y sus colegas trataron de enseñar. Pero, con el tiempo, entregaron el trabajo a profesionales de la U-Dub. “Sus clases son mucho más claras”, asegura Bisciglia. En unas pocas semanas, los estudiantes habían aprendido a configurar su propio trabajo en las computadoras de Google y a diseñar ambiciosas páginas web a escala de proyectos, a catalogar las ediciones de artículos de Wikipedia y a rastrear Internet en busca de spam. Durante 2007, mientras los comentarios sobre el curso se extendían entre los alumnos, departamentos fuera de ese ámbito comenzaron a preguntar por Google 101.

Muchos deseaban comprender el know-how de la Google Cloud y su poder informático –en especial para investigaciones científicas. En prácticamente cada campo, científicos estaban luchando con vastas pilas de nuevos datos que trataban temas como servidores de sensores, equipamiento analítico y herramientas de medida. Crear un modelo para estos hallazgos podía señalar nuevas medicinas y terapias, nuevas formas de energía limpia. Podían ayudar a predecir terremotos. Pero la mayor parte de los científicos no disponían de la maquinaria necesaria para escudriñar a través de este El Dorado digital. “Nos estamos ahogando en información”, expresó Jeannette Wing, de la National Sciencie Foundation.

Generosidad del gigante azul
El hambre por la informática de Google puso a Bisciglia en un apuro. Había tenido suerte al abrirse paso con la orden del primer grupo de computadoras. ¿Podría repetir eso, instalando pequeños equipos Google en cada computadora de cada departamento de ciencias? Por supuesto que no. Para extender Google 101 en universidades alrededor del mundo, los participantes necesitaban conectarse a una fuente compartida. Bisciglia necesitaba una nube aún más grande.

En ese momento, la suerte descendió en la persona indicada: el presidente de IBM, Samuel J. Palmisano. Ese fue “el día de Sam en Google”, asegura un investigador de IBM. El día invernal era muy frío para jugar volley en el campus, entonces Palmisano almorzó en la legendaria cocina de la cafetería. Luego él y su equipo se sentaron con Schmidt y un puñado de googlers, entre ellos Bisciglia. No era ningún secreto que IBM tenía intenciones de desplegar nubes para proveer información y servicios a clientes comerciales. Asimismo, y durante la gerencia de Palmisano, IBM había sido promotor líder de softwares de fuente abierta, incluyendo Linux. Esto era un tema clave en las batallas de Big Blue softwares, especialmente en contra de Microsoft. Si Google e IBM se agrupaban en una empresa en forma de nube, podían construir el futuro de este tipo de informática sobre la base de Google, y con Hadoop incluido.

Google, por supuesto, ya tenía un pie dentro de este proyecto: el Google 101 ideado por Bisciglia. En el transcurso del día, la pequeña aventura del joven ingeniero mutó en una iniciativa mayor apoyada a nivel gerencial por dos titanes del sector técnico. Para el momento en que Palmisano se había retirado esa tarde, ya estaba establecido que Bisciglia y su contrapartida en IBM, Dennis Quan, construirían el prototipo de una unión universitaria en forma de nube.

Durante los tres meses siguientes, trabajaron juntos en las oficinas de Google. El trabajo en sí implicaba integrar las aplicaciones comerciales de IBM y los servidores de Google, y equiparlos con otro servidor de fuente abierta para programas, incluyendo Hadoop. En febrero, develaron el prototipo en Mountain View, California, y en video desde las oficinas de IBM en Armonk, Nueva York.
La nube de Google 101 se asomaba a la luz verde. El plan era expandir la informática en forma de nube primero a un puñado de universidades estadounidenses dentro del período de un año y luego desplegarla globalmente. Las casas de estudio desarrollarían las nubes de información, y crearían herramientas y aplicaciones mientras generaban un sinnúmero de científicos en informática para continuar construyéndolas y manejándolas.

Quienes desarrollaron el proyecto debían ser capaces de encontrar puestos de trabajo en servidores de compañías informáticas, incluyendo Google. A Schmidt le gusta comparar los centros de datos con las partículas de aceleradores, mejor conocidas como ciclotrones. “Existen sólo unos pocos ciclotrones en la física”, dice. “Y cada uno de ellos es importante, porque, por ejemplo, un físico de alto vuelo necesita estar en el laboratorio si un ciclotrón está funcionando. En ese punto es en donde se hará historia; ahí mismo es donde los inventos aparecerán. Entonces, mi idea es que si toman éstas como supercomputadoras que están unidas a pequeñas máquinas, tenemos las más atractivas súper PCs, desde el punto de vista científico, para que la gente trabaje con ellas”.

Mientras el fluir de los negocios y la información científica aumenta, el poder de la informática se transforma en una fuente estratégica, en una forma de capital. “En cierto modo”, explica el Jefe Investigador de Yahoo!, Prabhakar Raghavan, “existen sólo cinco computadoras en todo el planeta”. Enumera a Google, Yahoo!, Microsoft, IBM y Amazon. Pocas otras, agrega, pueden transformar electricidad en poder informático con una eficiencia comparable.

Toda clase de modelos comerciales son proclives a evolucionar. Google y sus rivales podrían agruparse con clientes, quizás intercambiar poder informático por acceso a sus bases de datos. Podrían reclutar socios en las nubes para sus proyectos predilectos como la iniciativa de la compañía sobre la energía limpia. Con las facturas eléctricas en gigantes centros de datos rebalsando los US$ 20 millones al año y de acuerdo con la industria de los analistas, es simplemente natural para Google comprometer el cerebro y la capacidad de servidor a la búsqueda de cambios en el juego de avances energéticos.

¿Cómo lucirán las búsquedas con la Google Cloud? Tony Hey, vicepresidente de Investigación Externa de Microsoft, asegura que funcionarán como enormes laboratorios virtuales, con una nueva generación de bibliotecarios –algunos de ellos humanos–, “curando” hallazgos de datos, abriéndolos para investigadores con las credenciales correctas. Usuarios autorizados, agregan, construirán nuevas herramientas, arrastrarán información, y la compartirán con lejanos colegas. En estos nuevos laboratorios, predice, “se podría ganar un premio Nobel por analizar datos reunidos por otra persona”. Mark Dean, head del departamento de investigación y operaciones de IBM en Almaden, California, asegura que la mezcla del negocio y la ciencia llevarán a, en unos pocos años, formar redes de nubes que le pondrán un impuesto a nuestra imaginación. “Comparado con esto”, expresa, “Internet es un mundo pequeño. Nos reiremos de lo que chiquito que es”. Y aún más, si este pequeño mundo de Internet fue lo suficientemente grande como para generar a Google y su imperio, no hay que especificar las oportunidades que podrían surgir en las gigantescas nubes de información.

Es finales de noviembre en Googleplex. Christophe Bisciglia acaba de regresar de China, donde estuvo explicando Google 101 en diversas universidades. Tuvo días ocupados, no sólo estableciendo la Google Cloud con IBM, sino también resolviendo cuestiones con seis universidades –U-Dub, Berkely, Stanford, MIT, Carnegie Mellon y la Universidad de Maryland– para lanzarlo. Ahora tiene a su personal con cámaras y micrófonos esperándolo en una sala de conferencias, con cables y luces derramados sobre una mesa. Filmará un video promocional sobre la educación en forma de nube que se difundirá, en algún momento, por YouTube.

Entra Eric Schmidt. Con sus 52 años tiene casi el doble que Bisciglia, quien le explica el plan. Grabarán el audio de la entrevista y luego prepararán a Schmidt para algunas tomas de su cara. Schmidt lo piensa mejor. Le dice al camarógrafo que olvide las tomas de la cara. Están demasiado ocupados como para perder tiempo.

No hay comentarios:

Publicar un comentario