👽 졸업 논문 ( 16 ) - 논문 분석 : CLASSIFICATION OF QUASARS, GALAXIES,AND STARS USING MULTI-MODAL DEEPLEARNING
2025. 5. 6. 15:53ㆍ개발/👽 졸업 논문
🌌 멀티모달 딥러닝을 활용한 천체 분류
CLASSIFICATION OF QUASARS, GALAXIES,AND STARS USING MULTI-MODAL DEEPLEARNING
https://arxiv.org/pdf/2205.10745
이미지 데이터 + 수치 데이터를 인풋한 멀티모달 AI 연구이기 때문에 우리 연구와 접점이 많을 듯해서 분석해보려고 한다
Abstract / Introduction
연구 목표 : 천체 이미지 데이터와 수치형 데이터를 인풋한 머신러닝, 딥러닝, 멀티모달 딥러닝 모델의 은하, 별, 퀘이사 분류 성능 비교
사용 데이터 : Sloan Digital Sky Survey (SDSS) Data Release 16
모델 및 알고리즘 : 머신러닝(수치형 데이터), 딥러닝(이미지 데이터), 멀티모달 딥러닝(수치 + 이미지 데이터)
머신러닝
: Logistic Regression, Random Forest, Decision Tree, Adaboost, LightGBM, Artificial Neural Networks (ANN)
딥러닝
: ResNet50, VGG16, EfficientNetB2, Xception, DenseNet121
멀티모달 딥러닝
- 이미지 + 표 데이터를 결합하여 학습
- 단일 모달 모델보다 높은 정확도, 정밀도, 재현율, F1 스코어 달성
- 클래스 불균형 문제 처리에 강함
Related Work
기존 머신러닝 연구
- 데이터셋 : SDSS-3, DR-12, DR-14의 광학 측정 매개변수(수치형 데이터)
- 알고리즘 : Logistic Regression, Random Forest, Naive Bayes Classifier, Gradient Boosting, Decision Tree
- 다중 분류, 이중 분류
기존 딥러닝 연구
- 데이터셋 : SDSS DR 9, Galaxy Zoo2의 광학 측정 매개변수를 사용해 이미지 생성
- 알고리즘
- CNN 구조 -> Temporal Convolution, Filter Convolution 등 다양한 CNN 변형
- CNN과 머신러닝 모델(KNN, Random Forest)을 결합하여 성능 향상
멀티모달 학습 관련 연구
- 황반변성(AMD) 분류 및 진단
- 모달리티 : OCT(광간섭단층촬영 - 이미지), OCT-Angiography, Color Fundus Photography(컬러 안저 사진)
- 모델 구조 : Resnet - Inception - V2
- 전립선 암의 악성/양성 병변 및 임상적으로 중요한 비활성 전립선암의 진단, 분류
- 모달리티 : ADC, T2 가중 이미지
- 모델 : CNN 아키텍처에 Resnet 50, GoogleNet 22, VGG 16 등 적용
다중 모달 아키텍처에서의 융합 기법
- 각 모달리티를 개별적으로 학습한 뒤 Max Pooling 레벨에서 융합
- 완전 연결층 병합
- 피처 맵의 요소별 합
- PCA를 통한 병합 벡터의 차원 축소
융합 기법
- 조기 융합 - Alexnet
- 지연 융합 - softmax 이전에 융합
기타
- 네트워크 융합 기법 - 덧셈 방식, 곱셈 방식(곱셈 방식이 더 좋은 성능 나타냄)
- 부스팅 확장 - 잘못 분류된 클래스에만 패널티 부여
Methodology
SDSS-4 DR16 데이터 구성
- 수치형 데이터
- 광학 스펙트럼, 적외선 스펙트럼, IFU 스펙트럼(MaNGA), 항성 라이브러리 스펙트럼(MaStar), 그리고 카탈로그 데이터(스펙트럼에서 얻어진 광도 및 적색편이 등 매개변수들)
- SDSS 웹사이트에서 사용자 정의 SQL 쿼리를 통해 다운로드
- 이미지 데이터
- SDSS API를 통해 ra(적경)와 dec(적위) 좌표를 기반으로 받아왔으며, 확대(scale=0.1)를 통해 중심 천체만 포함되도록 하여 정확도를 향상
- 1000개의 샘플 사용, 학습:검증 데이터 비율은 70:30
데이터 전처리
수치형 데이터
- 6개의 연속적인 수치형 독립변수 와 1개의 범주형 타깃변수로 구성
- 결측값 및 이상치(outlier) 확인, 타겟 라벨 인코딩, 클래스 불균형 처리(가중치 적용), 표준화 수행
이미지 데이터
- 모든 이미지를 중심 확대(scale=0.1) 후 512x512 픽셀로 리사이즈
- 이미지 정규화
- 정규화하지 않은 이미지도 실험적으로 사용하여 정확도에 미치는 영향 분석
이미지 정규화 방식
Min-Max 정규화 : 픽셀 값을 0~1 사이로 정규화
Z-score 정규화 : 평균을 0, 표준편차를 1로 맞추는 방식
Mean-Subtraction : 각 픽셀에서 평균값을 빼는 방식
Predefined Normalization : 대형 데이터셋 학습에 사용된 모델을 재사용(전이학습)할 때 사용하는 정규화 방식
Unit Vector : 픽셀 벡터를 L2 정규화하여 길이를 1로 만드는 방식
사용된 모델
머신러닝 모델
- PyCaret 라이브러리를 사용
- 평가 지표: 정확도, 재현율, 정밀도, F1 점수
- 인공신경망(ANN) 모델은 3개의 Dense Layer로 구성
PyCaret 라이브러리
머신러닝 모델을 빠르고 간단하게 실험하고 비교할 수 있는 Python 라이브러리
scikit-learn, XGBoost, LightGBM, CatBoost, ANN 등을 포함한 다양한 알고리즘을 한 줄 코드로 학습, 튜닝, 비교, 예측
멀티모달 딥러닝 아키텍처
- 탭형 데이터는 ANN에, 이미지 데이터는 전이학습 기반 CNN 모델(ResNet50, Xception, EfficientNetB2)에 입력
- ANN과 CNN의 출력 벡터를 결합(late fusion)하여 최종 분류 수행
- TensorFlow-Keras의 Functional API - CNN의 마지막 컨볼루션 층의 출력을 1차원 벡터로 변환 / ANN의 출력 벡터와 결합
- 최종 출력은 Fully Connected, Softmax layer로 다중 클래스 분류 수행
손실 함수 및 평가 지표
손실 함수
: Categorical CrossEntropy 사용 (다중 클래스 분류에 적합)
C: 클래스의 총 개수
ti : 정답 레이블을 one-hot encoding한 값 (정답 클래스면 1, 아니면 0)
si : 모델이 예측한 확률 (softmax의 출력값)
log(si): 정답 클래스에 대한 로그 확률
정답 클래스의 확률이 높을수록 loss가 작아지고, 낮을수록 커지는 형태
평가 지표
- 정확도(Accuracy)
- 재현율(Recall)
- 정밀도(Precision)
- F1 Score
'개발 > 👽 졸업 논문' 카테고리의 다른 글
👽 졸업 논문 ( 18 ) - 논문 분석 : Attention Is All You Need (1) | 2025.05.18 |
---|---|
👽 졸업 논문 ( 17 ) - Zoobot 분석 (0) | 2025.05.13 |
👽 졸업 논문 ( 15 ) - 서울대학교 김이곤, 이가인 연구원님 면담 (0) | 2025.05.04 |
👽 졸업 논문 ( 14 ) - 서울대학교 황호성 교수님 면담 (0) | 2025.04.10 |
👽 졸업 논문 ( 13 ) - 은하 병합 여부 판별 멀티모달 AI 아키텍처 설계 (1) | 2025.04.08 |