DAPHNE, el proyecto de la NASA para optimizar y abaratar el almacenamiento de datos

  • Estrategias digitales

El almacenamiento de datos se ha convertido un problema para organizaciones como la NASA, cuyas investigaciones generan gran cantidad de información que debe almacenarse en beneficio de la ciencia. En las últimas décadas los costes han aumentado considerablemente, pero ahora han recurrido a las tecnologías de la nube con su proyecto DAPHNE, que les ha permitido reducir drásticamente el coste de la infraestructura TI que tienen en sus instalaciones en tierra.

A medida que la NASA ha ido avanzando en sus proyectos de investigación y exploración del espacio ha aumentado exponencialmente la cantidad de datos que la agencia debe almacenar y poner a disposición de los científicos en todo el mundo. Hasta ahora estos datos estaban almacenados en sus estaciones terrestres. Pero el volumen de datos no deja de aumentar, y esto implica enormes costes de adquisición y mantenimiento de equipos, algo que la agencia necesitaba resolver.

Para abordar este problema se creó el sistema DAPHNE (Entorno de red de procesamiento y manejo de adquisición de datos), cuyas características no se han conocido hasta hace muy poco, gracias a un artículo de GCN. En él explican que el sistema se compone de dos partes: una infraestructura de hardware optimizado en las estaciones terrestres y un segundo componente virtual que se encuentra en la nube. El sistema físico se basa en hardware de almacenamiento convencional, instalado en dos estaciones construidas en Alaska y Svalbard (Noruega), donde se envían los datos de las misiones satelitales.

Desde aquí se seleccionan los datos prioritarios, que se envían a la nube, donde se lleva a cabo su procesamiento, reduciendo la carga de TI local. Esto permite ahorrar muchos de los costes de adquisición, mantenimiento y operación de los sistemas, cuyo número no ha parado de crecer en las últimas décadas. Además, les permite evitar el gran coste de adquisición o arrendamiento de las conexiones, ya que el sistema está diseñado para conectarse a las redes de infraestructura global de backbone en la nube más cercana, reduciendo enormemente el coste de las comunicaciones gracias a la economía de escala.

Ante el éxito que está teniendo este sistema, la NASA se plantea implementarlo en otras instalaciones, y ya han mencionado sus estaciones de Puntas Arenas (Chile) y Wallops Island (EEUU), lo que les permitirá ampliar la cobertura y capacidad del sistema, reduciendo aún más los costes. Aunque por ahora no se conoce cuál es el proveedor de la nube que da servicio a la segunda parte de este sistema, la agencia sí ha explicado que van a utilizar DAPHNE en el radar de apertura sintética NASA-ISRO (NISAR), que comenzará a funcionar en enero de 2023. Según han explicado sus representantes, esperan generar al menos 32 Terabytes de datos al día, lo que supondría un volumen de casi cinco Petabytes durante los tres años que durará la misión.

Por ahora, afirman que este nuevo sistema de almacenamiento híbrido basado en la nube ha ayudado a la agencia a ahorrar millones de dólares, y esperan que sus beneficios se amplíen a medida que puedan abandonar las estrategias de almacenamiento tradicionales para adoptar soluciones de este tipo, que les permitan combinar las ventajas de los centros de datos propios con la ubicuidad de la nube.