Por Javier Machin estudiante de Magister de la Universidad Católica y Karim Pichara, investigador joven MAS y Profesor Asociado del Departamento de Ciencias de la Computación de la Universidad Católica
En astronomía, han habido muchos intentos de reunir e integrar numerosas fuentes de datos con la intención de crear una base de datos centralizada, organizada y consolidada; con suerte en algunos casos con mecanismos de visualización y análisis. Desafortunadamente, la mayoría de esos intentos han sido ineficientes, principalmente, porque carecen de un esquema holístico que permita la integración de datos heterogéneos, el pre-procesamiento de alto nivel y herramientas de visualización dentro de la misma estructura.
Industrias como la Construcción, la Banca, las Finanzas, la Educación y la Medicina enfrentaron problemas similares en la década de los 60 donde las empresas comenzaron a recopilar grandes cantidades de datos sobre clientes y mercados bursátiles. Rápidamente notaron el valor de los datos y desarrollaron un sistema de toma de decisiones exitosos basados en plataformas completas de análisis de datos. La solución a este escenario fue el desarrollo de motores de Business Intelligent (BI) y Data Warehouses (DW).
Semejante a estas industrias, en los últimos diez años la Astronomía se ha convertido en una ciencia basada en datos, debido a la creciente capacidad de generar y recopilar información a consecuencia de masivos proyectos de observación que han entregado enormes cantidades de datos astronómicos.
Inspirándose en la mentalidad de las industrias, el estudiante Javier Machin y el investigador del MAS Karim Pichara, trabajan en el diseño y la implementación de “A Global Data Warehouse for Astronomy” (Almacén de Datos globales para la Astronomía) GAWA – por sus siglas en inglés – que permite a sus usuarios – investigadores, académicos y estudiantes de astronomía – procesar y analizar visualmente datos astronómicos en tiempo real, reduciendo análisis exploratorios; proporcionando una interacción más efectiva entre los datos y el astrónomo. GAWA ofrece una serie de algoritmos, para describir series de tiempo de datos, calcula pruebas estadísticas o “características” asociadas a las series usando ventanas de gráficos simples de analizar por una persona con el entrenamiento apropiado. Por ejemplo, en la figura que se adjunta la fila superior muestra las características globales de la dispersión estándar de brillo para estrellas normales – es decir, no variables – en la columna del extremo izquierdo; para estrellas variables RR Lyrae en la columna del medio y para las transientes de lentes gravitacionales en la columna del extremo derecho. En la tercera fila, podemos apreciar claramente que tanto las estrellas no variables como las RR Lyrae muestran una fuerte auto-correlación en un periodo dado, mientras que los eventos transientes de lentes gravitacionales, cuyas curvas de luz uno tienen un comportamiento estándar, no lo hacen. Para una mejor comprensión de las características que describen cada serie de tiempo – curva de luz – nos referimos al trabajo de Isadora Num en : https://arxiv.org/abs/1506.00010
El impacto que GAWA ofrece a la comunidad astronómica es enorme ya que, entrega datos transparentes de manera eficiente, los cuales facilitan la toma de decisiones oportuna con mejor adaptabilidad, máxima flexibilidad y mejor soporte. Los maestros poseerán un entorno interactivo en el cual podrán probar en tiempo real lo explicado en clases a sus alumnos. Además, los estudiantes podrán interactuar de manera natural con los datos mientras deben asimilar y sobrellevar teorías y conceptos relacionadas con sus carreras de enseñanza. GAWA también genera un aporte significativo a la comunidad de investigación, ofreciéndoles una alternativa donde puedan seleccionar objetos astronómicos específicos a través de diferentes fuentes de datos, visualizar patrones particulares en objetos de interés con el mínimo esfuerzo posible y de est forma promoviendo e incentivando la colaboración entre astrónomos.
Imagen principal: GAWA: Un Almacén de Datos Globales para la Astronomía.