Una investigació liderada pel departament de Física i Astronomia de la Universitat de Pennsylvania i l’Institut de Física de Cantàbria (UC-CSIC) ha produït el major catàleg de classificació morfològica de galàxies fins a dia d’avui, que inclou 27 milions de galàxies. La investigadora de l’Institut de Ciències de l’Espai (ICE, CSIC) Helena Domínguez és la segona autora d’aquest catàleg, publicat recentment a la revista Monthly Notices of the Royal Astronomical Society (MNRAS).
Els investigadors han utilitzat les dades del Mapatge d’Energia Fosca (Dark Energy Survey, DES) -que va catalogar centenars de milions de galàxies distants durant sis anys- i un algorisme d’aprenentatge automàtic amb una precisió fins al 97% per aprendre a classificar les galàxies en dos tipus de morfologies, fins i tot les galàxies més dèbils i llunyanes.
La morfologia de les galàxies està molt relacionada amb el tipus d’estels que les componen i els seus mecanismes de formació. Principalment, aquest catàleg classifica les galàxies en dos tipus de morfologies: galàxies espirals, que tenen un disc giratori on neixen noves estels; i el·líptiques, que són les galàxies més massives de l’Univers, compostes d’estels antics que realitzen moviments aleatoris.
Tot i que resulta fàcil distingir aquests dos tipus de galàxies a simple vista, hi ha dos problemes importants: d’una banda, l’elevat nombre de galàxies per classificar, que va fer necessari realitzar classificacions automatitzades; i, d’altra banda, el fet que les galàxies situades a major distància semblen més febles i més petites, així que les imatges recollides solien tenir molt soroll.
L’equip científic ha degradat les imatges d’alta qualitat de les galàxies locals fins a obtenir l’aparença que tindrien si estiguessin més distants i han introduït les etiquetes correctes per entrenar una xarxa neuronal convolucional. D’aquesta manera, ha estat possible aprendre a classificar fins i tot els exemples més difícils. L’estudi assenyala que l’algorisme utilitzat pot encertar la morfologia de les galàxies fins al 97% de les vegades, independentment del nivell de soroll i la resolució espacial de les imatges.
Aquest treball demostra que les màquines poden recuperar imatges que l’ull humà no pot captar i que tenen capacitat per distingir els senyals útils del soroll quan s’entrenen amb les etiquetes correctes. Per tant, poden classificar de manera fiable imatges de galàxies més febles.
L’ús de xarxes neuronals convolucionals és extremadament exitós per analitzar i classificar imatges de galàxies. Aquest tipus de xarxes neuronals són un algorisme d’aprenentatge automàtic (deep learning) que pot rebre una imatge d’entrada i assignar-li una etiqueta a diferents aspectes d’aquesta imatge i diferenciar-los entre si.
Implicacions futures
Amb aquest mètode automatitzat, ha estat possible assignar una classificació a 27 milions de galàxies i elaborar el catàleg morfològic de galàxies publicat fins a dia d’avui.
Algunes de les galàxies incloses en el catàleg es troben a una distància de fins a 8 giga-anys (Ga), és a dir, 8.000 milions d’anys. Aquest catàleg permet obtenir una visió aproximada de com eren les galàxies quan l’Univers tenia la meitat de la seva edat actual, estudiar com han canviat les galàxies durant els últims 8 Ga i observar com aquests canvis estructurals estan relacionats amb els camins evolutius de les galàxies .
El fet que les màquines puguin aprendre a reconèixer patrons en dades amb soroll i difícils d’interpretar pot tenir aplicacions directes en altres camps, com la seguretat (per exemple, reconeixement facial), la indústria del reconeixement d’imatges, diagnòstics clínics o el canvi climàtic.
Article de referència
J.Vega-Ferrero et al. “Pushing automated morphological classifications to their limits with the Dark Energy Survey”, publicado en la revista Monthly Notices of the Royal Astronomical Society. https://doi.org/10.1093/mnras/stab594

Imatges originals (panells a l’esquerra) d’una galàxia espiral (a dalt) i una galàxia el·líptica (a baix) i les seves versions degradades, utilitzades per a entrenar la xarxa neuronal convolucional. En el cas de les galàxies més llunyanes (panells a la dreta), és difícil diferenciar les dues categories a simple vista. (Imatge: J. Vega-Ferrero et al.)
Material de descarga
Imagen (jpeg)