jueves, 20 de octubre de 2011

Los cortes de servicio amenazan a los usuarios de la nube


Por Cindy Waxer
En contrapartida a la escalabilidad sin precedentes y comodidad de la computación en nube, hay un aspecto en el que se queda corta: la fiabilidad.
Control de daños: La discusión en Internet acerca de la interrupción del servicio que afectó a Amazon en abril se empezó a generar tan pronto como comenzaron los problemas (el 21 de abril), y de nuevo cuando Amazon explicó la causa (29 de abril). Los datos se basan en determinadas menciones en Twitter, blogs y medios de comunicación en línea.

Fuente: Alterian

Solo hay que preguntarle a Jeff Malek, cofundador de BigDoor, una compañía de Seattle (Estados Unidos) cuyo software de juegos se encuentra alojado en los servidores públicos de Amazon. El pasado abril, diversos problemas en un centro de datos de Virginia del Norte cortaron las operaciones de Amazon en el noreste de Estados Unidos, afectando a una gran cantidad de negocios basados en nube. Un servicio irregular durante más de cuatro días obligó a BigDoor a esforzarse por encontrar soluciones técnicas y a emitir un flujo constante de disculpas ante sus 250 clientes.
Desde entonces, BigDoor se ha unido a un creciente número de compañías a la búsqueda de nuevas formas de construcción de sistemas en nube resistentes ante cortes de servicio, lo que a menudo supone costes e inconvenientes adicionales.
Todos los principales proveedores en nube, como Salesforce.com, Microsoft y Google, han experimentado interrupciones. Durante un período de 30 días entre agosto y septiembre, por ejemplo, las aplicaciones de Google basadas ​​en nube experimentaron seis interrupciones, según afirma su servicio Apps Status Dashboard, incluyendo un corte de una hora de duración el 7 de septiembre que impidió el acceso a varios millones de usuarios de Google Docs. Algunas interrupciones han sido causadas ​​por acontecimientos imprevisibles, como por ejemplo la caída de rayos, aunque a menudo las culpables son las actualizaciones de software. Google ha señalado que los cambios realizados en su software provocaron que Google Docs dejase de funcionar. De igual modo, un intento por ejecutar código actualizado fue el responsable de un masivo corte en el correo electrónico de usuarios de teléfonos BlackBerry en Europa este mes. (RIM, al igual que Google, gestiona sus propios servidores en lugar de depender de proveedores en nube públicos).
A pesar de que las interrupciones ponen a las empresas en un gran riesgo, los proveedores en nube todavía no ofrecen garantías a toda prueba. En su así llamado"contrato de nivel de servicio", Amazon afirma que si sus servicios no están disponibles durante más de un 0,05 por ciento a lo largo de un año (alrededor de cuatro horas) abonará a sus clientes un crédito "equivalente al 10% de su factura". Algunas voces dentro de la industria opinan que las nubes públicas como Amazon deberían tener como objetivo una disponibilidad del 99,999 por ciento, o un tiempo de inactividad de tan solo unos cinco minutos al año.
Hasta entonces, las empresas deben hacer frente a la realidad de un servicio imperfecto. "Para mí, [los contratos de servicio] son ​​creados por burócratas y abogados", señaló Malek. "Lo que me importa es el grado de fiabilidad del servicio en nube, y las medidas que haya tomado el proveedor para prepararse ante cortes".
Amazon posee centros de datos informáticos en cinco regiones del mundo. Las empresas pueden optar por ejecutar sus aplicaciones en múltiples regiones, como medida de precaución (del mismo modo en que haríamos una copia de seguridad de nuestro ordenador en un disco duro externo). Inmediatamente después de la gran interrupción en abril, BigDoor actualizó su cuenta para alojar sus servicios en varias regiones de Amazon. Sin embargo, agregar esa capa de protección condujo a un aumento del 5 por ciento en las facturas mensuales de computación en nube de la empresa. Además, conseguir que las aplicaciones se comuniquen sin problemas a lo largo de todas las regiones aisladas requiere "más recursos, dinero y tiempo", afirma Malek.
Netflix, que utiliza la nube de Amazon para transmitir vídeos, es otra de las empresas que están realizando esfuerzos de ingeniería por protegerse contra los fallos de la nube. A raíz de los problemas en Amazon, la compañía desarrolló Chaos Gorilla, un software interno que permite a sus ingenieros simular el grado de efectividad de los sistemas de Netflix para redirigir los datos cuando una zona de red deja de funcionar.
Una de las empresas que afirma no haberse visto afectada recientemente por problemas en nube es SimpleGeo, una start-up de San Francisco que utiliza Amazon para ofrecer a sus clientes herramientas de conocimiento de la ubicación. SimpleGeo salió ilesa del corte de Amazon gracias al uso de una técnica llamada back-pressure routing (enrutamiento de presión trasera), que evita áreas de red con tiempos de respuesta lentos. Joe Stump, cofundador y director tecnológico, compara la tecnología con un conductor ajustando la velocidad o cambiando de carril en una carretera obstruida. Aunque SimpleGeo ha sido capaz de esquivar los cortes en la red, lograrlo ha supuesto un coste considerable. "Tenemos tres ingenieros dedicados a tiempo completo a la construcción de herramientas internas para administrar nuestra infraestructura", indica.
De hecho, Stump afirma que solo hay una cosa 100 por cien segura cuando se trata de la nube: "Siempre hay que crear la arquitectura de los sistemas asumiendo posibles fallos", sentencia. 

No hay comentarios:

Publicar un comentario