Por Pablo Huijse, investigador postdoctoral MAS y del Depto. de Ingeniería Eléctrica UChile
Hoy en día analizar manualmente los grandes volúmenes de datos provenientes de los sondeos astronómicos es una tarea imposible. Las disciplinas científicas de la astro-informática y astro-estadística han sido creadas para lidiar con los desafíos astronómicos en la era de Bigdata. Herramientas estadísticas robustas e implementaciones computacionales eficientes son necesarias para procesar la avalancha de datos y aprovechar de la mejor manera el tiempo de los expertos.
En este trabajo nos enfocamos en el problema de detección de periodicidad en curvas de luz del sondeo EROS-2. El periodo es de suma importancia en la clasificación de estrellas variables y también para deducir otros parámetros tales como la distancia del astro a la Tierra.
Un total de 32.8 millones de curvas de luz de EROS-2 observadas de las nubes de Magallanes fueron analizadas. En este experimento sólo se utilizaron observaciones en el canal azul. El período se estima usando una métrica robusta de teoría de la información llamada periodograma kernelizado de correntropía (CKP por su sigla en inglés). El CKP es capaz de extraer más información a partir de la curva de luz con respecto a métodos convencionales y es también más robusto al ruido. Luego de computar el periodograma, los periodos espurios debidos a alias con el día sideral y el ciclo lunar son filtrados. Luego se lleva a cabo una prueba estadística basada en el CKP para seleccionar los periodos con una confianza mayor al 99%. En esta etapa períodos duplicados debido al traslape de los campos de observación y al blending (superposición de objetos) son eliminados. Para las periodicidades más fuertes, sustraemos la señal periódica y corremos nuestro algoritmo por segunda vez en búsqueda de periodicidades adicionales y multimodos.
El cómputo del CKP se realiza usando arquitecturas paralelas basadas en unidades de procesamiento gráfico (GPU por su sigla en inglés). Las 32.8 millones de curvas de luz son procesadas en 18 horas usando un cluster de 72 GPUs de la iniciativa XSEDE. Encontramos que un 0.4% de las curvas de luz de EROS-2 son periódicas y un 0.002% tiene un segundo periodo. Los resultados sugieren que los catálogos pueden ser usados para encontrar variables que no caen en las categorías conocidas (detección de novedad). También es posible realizar clasificación fotométrica utilizando los catálogos encontrados.