👽 졸업 논문 ( 4 ) - 논문 분석 : PhotoRedshift-MML: A multimodal machine learning method for estimating photometric redshifts of quasars

2025. 3. 20. 11:31개발/👽 졸업 논문

 

 

 

PhotoRedshift-MML: A multimodal machine learning method for estimating photometric redshifts of quasars

https://academic.oup.com/mnras/article/518/4/5049/6824441?login=false

 

✨ 주제

멀티모달 머신러닝(MML, Multimodal Machine Learning) 기법을 활용하여 퀘이사(Quasar)의 광학적 적색편이(Photometric Redshift)를 예측하는 새로운 방법

 


 

🌱 주요 개념

 

< 퀘이사 (Quasar)의 광학적 적색 편이 >

 

1. 퀘이사의 개념

퀘이사(quasar)는 "quasi-stellar object"의 줄임말로, 별처럼 보이지만 실제로는 매우 멀리 있는 강력한 에너지를 방출하는 천체입니다. 퀘이사는 대부분 매우 밝고, 그 밝기는 수백억 배의 태양 밝기보다 더 밝을 수 있습니다. 퀘이사는 사실 중심에 초대형 블랙홀이 있고 그 주위를 도는 물질이 빠르게 회전하면서 발생하는 강력한 복사를 방출하는 구조입니다. 이 복사는 주로 X선과 자외선 영역에서 관측됩니다.

2. 광학적 적색편이의 개념

광학적 적색편이(optical redshift)는 천체에서 방출된 빛의 파장이 지구로 올 때 길어지는 현상을 말합니다. 이는 주로 두 가지 이유로 발생합니다:

  • 도플러 효과: 천체가 우리로부터 멀어지면 빛의 파장이 길어지며, 적색편이가 발생합니다. 이는 마치 기차가 지나가면서 소리가 낮게 들리는 현상과 비슷한 원리입니다.
  • 우주 팽창: 우주는 계속 팽창하고 있기 때문에, 멀리 있는 천체에서 오는 빛은 우주의 팽창으로 인해 파장이 늘어나게 됩니다. 이 현상은 '우주적 적색편이'라고도 합니다.

광학적 적색편이는 이러한 이유로 별이나 은하가 우리로부터 멀어지고 있다는 증거가 됩니다.

 

3. 퀘이사의 광학적 적색편이는 어떻게 측정되는지

퀘이사의 광학적 적색편이는 보통 스펙트럼 분석을 통해 측정됩니다. 퀘이사에서 오는 빛을 분광기로 측정하여, 빛의 스펙트럼에서 특정 흡수선이나 방출선이 어떻게 이동했는지 확인합니다. 빛의 파장이 길어지면 적색편이가 증가하고, 반대로 파장이 짧아지면 청색편이가 발생합니다. 이 적색편이의 크기를 측정하면 퀘이사의 속도와 거리를 추정할 수 있습니다.

 

4. 퀘이사의 광학적 적색편이를 수집하는 목적

퀘이사의 광학적 적색편이를 수집하는 주된 목적은 우주 팽창과 우주의 구조에 대한 이해를 높이는 것입니다. 광학적 적색편이는 다음과 같은 중요한 과학적 목적을 가지고 있습니다:

  • 우주의 팽창 속도 측정: 적색편이는 천체가 우리로부터 얼마나 빠르게 멀어지고 있는지를 알려줍니다. 이를 통해 우주의 팽창 속도(허블 상수)를 계산할 수 있습니다.
  • 우주의 나이 추정: 퀘이사의 적색편이를 이용해 매우 먼 과거에 발생한 빛을 관측할 수 있기 때문에, 우주의 나이를 추정하는 데 중요한 데이터를 제공합니다.
  • 초기 우주의 연구: 퀘이사는 아주 먼 과거에서 온 빛을 가지고 있기 때문에, 우주의 초기 상태에 대한 중요한 단서를 제공합니다. 예를 들어, 초기에 형성된 별과 은하의 진화 과정을 이해하는 데 도움이 됩니다.
  • 은하와 블랙홀의 진화 추적: 퀘이사 주변의 초대형 블랙홀과 그 주변 환경을 연구함으로써 블랙홀의 성장과 은하의 형성 과정을 이해할 수 있습니다.

이러한 목적들을 통해, 퀘이사의 광학적 적색편이는 우주와 그 구조에 대한 중요한 정보를 제공하는 중요한 관측 도구가 됩니다.

 


 

< 광학적 관측과 분광학적 관측 >

 

1. 광학적 관측 (Optical Observation)

광학적 관측은 우리가 일반적으로 사용하는 "눈으로 보는" 방식에 해당합니다. 이는 가시광선(즉, 인간의 눈으로 볼 수 있는 빛)의 범위에서 천체를 관측하는 방법입니다. 별, 은하, 행성 등 다양한 천체의 밝기, 위치, 형태 등을 측정할 수 있습니다.

  • 측정 가능한 특성:
    • 밝기: 천체의 밝기를 관측할  있으며, 이를 통해 거리나 크기를 추정할  있습니다.
    • 위치: 천체가 하늘에서 차지하는 위치와 이동을 추적할 있습니다.
    • 형태: 천체의 모양과 크기 등을 관찰할  있습니다.
  • 제한점:
    • 가시광선 범위에서만 관측이 가능하므로, 가시광선 이외의 영역(: 자외선, X, 적외선) 정보를 놓칠 있습니다.
    • 대기 조건이나 공해의 영향을 받을 있습니다.

 

2. 분광학적 관측 (Spectroscopic Observation)

분광학적 관측은 천체에서 나오는 빛을 스펙트럼으로 분해하여 분석하는 방법입니다. 이는 천체에서 방출되거나 흡수된 빛의 파장과 강도를 측정하여, 천체의 속성에 대한 심층적인 정보를 얻을 수 있습니다.

  • 측정 가능한 특성:
    • 스펙트럼 분석: 천체에서 나오는 빛을 분해하여, 그것이 어떤 화학 원소로 구성되어 있는지, 온도, 밀도 등을   있습니다.
    • 속도: 도플러 효과를 이용해 천체의 이동 속도(청색편이 또는 적색편이)를 측정할  있습니다.
    • 거리와 나이 추정: 빛의 스펙트럼을 분석하여 천체의 나이, 연령, 거리를 추정할  있습니다.
    • 천체의 상태: 별이나 은하의 내부 물리적 상태와 진화 과정을 분석할  있습니다.
  • 장점:
    • 천체의 화학적 성분, 온도, 속도, 밀도  다양한 정보를 얻을  있습니다.
    • 빛의 파장 분석을 통해 우리가   없는 물리적 특성을 파악할  있습니다.
  • 제한점:
    • 고급 장비가 필요하며, 분광기와 같은 특수 장비를 사용해야 합니다.
    • 대기 영향을 피하기 위해서는 고산지대나 우주에서 관측해야 있습니다.

 

3.  비교

항목 광학적 관측 분광학적 관측
측정할 있는 밝기, 위치, 형태 화학 성분, 온도, 속도, 밀도, 나이
사용하는 장비 망원경, 카메라 분광기, 분광망원경
장점 간단하고 직관적, 널리 사용됨 천체의 물리적, 화학적 특성 분석 가능
제한점 가시광선에만 의존, 다른 파장 정보 없음 고급 장비 필요, 분석이 복잡함

 

  • 광학적 관측은 천체의 위치와 밝기 등을 간단하게 알 수 있는 방법으로, 직접적으로 눈으로 볼 수 있는 정보만을 다룹니다.
  • 분광학적 관측은 천체의 화학 성분, 온도, 속도 등과 같은 깊이 있는 정보를 제공하며, 천체의 상태나 거리를 추정하는 데 중요한 도구입니다.

따라서, 두 가지 관측 방법은 상호 보완적인 역할을 하며, 함께 사용하면 천체에 대한 더 풍부하고 정확한 이해를 할 수 있습니다.

 

 


 

 

📚 연구 목적

퀘이사의 적색 편이를 멀티 모달리티를 이용해 학습 및 예측하는 것
-  광학적 관측 결과분광학적 관측 결과를 결합하여 멀티 모달리티 구축
-  생성형 AI GAN을 이용하여 광학적 관측 결과를 통해 분광학적 데이터 생성

 

📌 사용 데이터

SDSS 데이터 릴리즈 17 (SDSS DR17)

 

📌 AI 모델 구성

1. 단일 모드 기계 학습을 통한 광학적 적색편이 예측 (3.1)
단일 모드에서는 15개의 입력 특성만을 사용하여 광학적 적색편이를 예측합니다. 이를 위해 4개의 레이어로 구성된 인공 신경망(ANN)을 사용하여 예측 모델을 구성합니다. 이 모델은 입력층, 두 개의 은닉층, 출력층으로 이루어져 있으며, ReLU 활성화 함수를 사용하여 비선형성을 추가합니다. 훈련 과정에서 L1 손실 함수를 사용하여 예측된 적색편이와 실제 적색편이의 절대 오차를 최소화합니다.

2. Photometric to Spectral Feature Transformation (3.2.1)
광학적 데이터만으로는 높은 예측 정확도를 얻기 어려운 문제를 해결하기 위해, 광학적 데이터와 스펙트럼 데이터의 쌍을 하나의 통합된 특성 공간으로 표현하고, 이를 PhotoSpecTransformer 모델을 통해 광학적 데이터를 스펙트럼 특성으로 변환합니다. 모델은 CNN을 기반으로 구성되며, 입력은 3600D의 스펙트럼 데이터, 출력은 128D의 스펙트럼 벡터입니다.

3. Photometric Redshift Estimation using Multimodal Transfer Learning (3.2.2)
광학적 데이터에서 생성된 128D 스펙트럼 벡터를 사용하여 PhotoRedshift-TL 모델을 훈련시킵니다. 이 모델은 CNN과 CAP 모듈로 구성되며, 광학적 데이터와 생성된 스펙트럼 데이터를 결합하여 적색편이를 예측합니다. 훈련 중에는 두 가지 입력을 결합한 벡터를 사용하여 더 정확한 예측을 합니다.

 

📑 연구 결과

PhotoRedshift-MML 모델은 적색편이 예측 정확도를 기존 방법보다 향상시킴
평가 지표: |z| = |(zphot− zspec)/(1 + zspec)|
-  평균 정확도가 4.04% 향상
-  |z| < 0.1인 데이터 비율:
    -  MML 모델 사용: 84.45%
    - 단일 모달 광학 데이터 사용: 80.41%
- Root Mean Square(RMS)
   - 오차 감소:0.1332 → 0.1235 (오차 감소)

 


 

💼 내 생각

결국 이 연구에서는 두가지에 초점을 맞춘 것 같은데

1.  생성형 AI GAN을 이용하여 광학적 데이터를 통해 분광학적 데이터 생성

2.  생성된 분광학적 데이터와 광학적 데이터를 결합하여 멀티 모달리티 모델 구축

 

흠...

1번은 값비싼 분광기를 사용하지 않고 분광학적 데이터를 얻을 수 있다는 점에서 의의가 있다고 생각되나

2번같은 경우 결국 질이 떨어지는 광학적 데이터와 분광학적 데이터를 굳이굳이 결합한 느낌..

근데 이제 분광학적 데이터의 정확성도 확실하게 보장할 수 없는...

 

 


 

🗂 관련 논문들

 

https://arxiv.org/abs/2203.03679

 

Quasar photometric redshifts from incomplete data using Deep Learning

Forthcoming astronomical surveys are expected to detect new sources in such large numbers that measuring their spectroscopic redshift measurements will be not be practical. Thus, there is much interest in using machine learning to yield the redshift from t

arxiv.org

 

https://academic.oup.com/mnras/article/512/2/2099/6546165

 

https://iopscience.iop.org/article/10.3847/1538-4365/ad79ee