2분반-Brain Overflow

cdc wiki
Com239 (토론 | 기여)님의 2025년 6월 18일 (수) 19:59 판 (설계사양)
이동: 둘러보기, 검색

프로젝트 개요

기술개발 과제

국문 : 종단 3차원 뇌 MRI 생성을 통한 알츠하이머병 진행 예측

영문 : Alzheimer’s Disease Progression Prediction by Generating Longitudinal 3D Brain MRI

과제 팀명

Brain Overflow

지도교수

김민호 교수님

개발기간

2025년 3월 ~ 2025년 6월 (총 4개월)

구성원 소개

서울시립대학교 컴퓨터과학부 2019920003 권준호 (팀장)

서울시립대학교 컴퓨터과학부 2020920002 구효근

서울시립대학교 컴퓨터과학부 2020920032 석우진

서울시립대학교 컴퓨터과학부 2021920020 김혜주

서울시립대학교 컴퓨터과학부 2022920029 박영빈

서울시립대학교 컴퓨터과학부 2022920038 송채희

서론

개발 과제의 개요

개발 과제 요약

본 프로젝트는 알츠하이머병의 진행 상태를 예측하는 인공지능 모델을 개발하는 것을 목표로 한다. 구체적으로는 종단 3D s-MRI 데이터를 기반으로 미래 시점의 뇌 영상을 생성하는 image prediction generation 기술을 구현한다. 또한, 생성 모델의 성능뿐만 아니라 실제 서비스화까지를 염두에 두고 있으며, 안정적인 시스템 구현을 위해 RAFT 기반의 데이터 동기화, 메시지 큐(MQ)를 활용한 비동기 처리, Java Virtual Thread를 통한 고성능 동시성 제어, React 기반 UI 최적화 등의 기술적 요소들을 도입하고 연구 중이다. 이러한 기술 역량을 바탕으로 본 프로젝트는 AI 모델의 구현을 넘어 의료 및 신경과학 분야에 실질적으로 활용 가능한 웹 기반 서비스로의 확장을 지향한다.

개발 과제의 배경 및 효과

알츠하이머병의 조기 진단과 진행 경로 예측은 임상 및 치료 전략 수립에 매우 중요한 문제다. 그러나 환자 1인에 대해 다중 시점의 3D MRI 데이터를 확보하는 것은 현실적으로 어렵기 때문에, 기존 모델은 단일 시점 분석에 한정되거나 데이터 불균형으로 성능 저하를 겪는다. 이를 해결하기 위해 본 프로젝트는 longitudinal image synthesis를 통해 종단 데이터의 공백을 메우고, 이를 기반으로 한 예측을 가능하게 한다. 또한, 고해상도 3D 이미지를 효율적으로 처리하기 위해 Latent Diffusion Model(LDM)을 채택하고, 의료적 신뢰성을 평가하기 위한 Human Evaluation, Lesion Consistency, Plausibility 등의 정성적 평가 지표도 도입하였다. 이와 함께, AI 모델을 서비스화하여 다양한 사용자(의사, 연구자, 제약사 등)가 쉽게 접근할 수 있도록 하여 기술의 실질적 활용도를 높이고자 한다.

개발 과제의 목표 및 내용

본 프로젝트의 구체적 목표는 다음과 같다:

  • AI 모델 개발
    • Task Definition
      • 입력: 종단 뇌 MRI 이미지 시퀀스(최소 2 장 이상)
      • 출력: 미래의 뇌 MRI 이미지 시퀀스를 생성 → 치매 진행 양상 예측
    • From Scratch 구현
      • cross-attention, ControlNet 기반 Condition Latent Diffusion Model을 PyTorch를 이용해 from scratch 구현
    • 실험적 가설에 대한 검증
      • 가설: Pretrained Voxelmorph 모델을 이용해 생성한 deformation field를 ControlNet 구조를 활용해 디퓨전 모델에 조건으로 줄 경우, 모델이 morphological changes를 학습 가능하여 예측 생성 성능이 개선될 것이다.
  • 시스템 아키텍처 구축
    • RAFT 기반 데이터 일관성 유지
    • 메시지 큐(RabbitMQ/Kafka) 기반 비동기 처리
    • Java Virtual Thread를 통한 고동시성 처리
  • 웹 서비스 배포
    • React 기반 UI, WebGPU 3D MRI 시각화
    • AI inference 서버 및 pipeline 배포 (Kubernetes 기반)

관련 기술의 현황

관련 기술의 현황 및 분석(State of art)

  • 전 세계적인 기술현황

최근의 연구들은 치매 진행 예측을 위한 생성 모델로서 Diffusion 기반의 아키텍처를 점점 더 적극적으로 도입하고 있다. 특히, Litrico et al.의 TADM(Temporally-aware Diffusion Model)은 시간 조건을 정교하게 설정함으로써 단일 시점에서 여러 미래 시점을 예측하는 접근을 제시하며, 기존 DDPM 모델의 mode collapse 문제를 개선하였다. 또한 Puglisi et al.의 BrLP 모델은 ControlNet과 Latent Average Stabilization 기법을 도입하여 생성 이미지의 정확성과 품질을 향상시킨 바 있다. 기존 GAN 기반 모델들이 의료 영상에서 흔히 발생하는 해상도 저하나 불안정한 생성 문제를 겪는 반면, Diffusion 기반 모델은 안정성과 품질 측면에서 우수한 성능을 보여준다. 본 프로젝트는 이러한 연구 흐름에 발맞추어 regional volume의 변화량과 deformation field 를 latent diffusion model에 컨디셔닝하는 구조를 설계하고, 이를 통해 치매 진행의 시계열적 변화를 반영하는 longitudinal 3D MRI 생성을 구현하고자 한다.

  • 특허조사 및 특허 전략 분석

경쟁력분석 과정에서 확인된 결과, 본 프로젝트의 중심 기술인 3D s-MRI 기반의 longitudinal image generation 및 diffusion 모델을 이용한 질병 예측에 대해 직접적으로 충돌하는 등록 특허는 발견되지 않았다. 다만 유사 영역에서 다음과 같은 특허가 간접적으로 존재한다:

  1. O2023183504A1: 의료 영상 초해상도 처리를 위한 딥러닝 방법
  2. O2018172540A1: 알츠하이머병 진행 예측을 위한 알고리즘적 접근

이러한 특허들은 주로 해상도 향상, 예측 정확도 향상 등에 초점을 맞추고 있으며, 본 프로젝트가 사용하는 multimodal conditioning, morphological deformation encoding, volumetric generation 등과는 핵심적 차별성이 존재한다.

본 프로젝트는 다음의 두 가지 특허 전략 방향을 병행하여 고려하고 있다.

  1. 회피 설계 전략 (Freedom to Operate, FTO): 기존 특허들은 주로 단일 시점 영상의 향상이나 수치 예측에 집중되어 있으므로, 본 프로젝트는 longitudinal data, age-conditioned generation, volumetric diffusion이라는 특화된 요소들을 강조함으로써 회피 설계를 확보한다.
  2. 선점형 특허 전략 (Offensive IP Strategy): 시계열 3D MRI 생성을 포함하는 다중 연령 조건 기반의 이미지 생성 방식과 이를 의료 예측 태스크에 적용하는 방법론을 청구항으로 구성할 수 있다. 다만, 관련 기술이 빠르게 공개되고 있으며 유사 기술도 공지된 바 있으므로, 신규성과 진보성을 확보하기 위해서는 구체적 기술 요소의 결합 및 성능 기준 달성 여부가 중요하다.
  • 기술 로드맵

기술 로드맵 상에서, 본 프로젝트는 기존의 GAN 계열 방법과 최신의 Diffusion 계열 방법을 모두 검토하고 이를 통합하거나 대체하는 전략을 수립하였다.

GAN 계열 기술 흐름:

  1. 2019, Ravi et al. — DaniNet (degenerative progression을 adversarial 방식으로 모델링)
  2. 2022, Ravi et al. — 4D-DaniNet (시계열 4D 모델 확장)
  3. 2023, Pombo et al. — CounterSynth (morphologically constrained 3D GAN)

Diffusion 계열 기술 흐름:

  1. 2022, Kim et al. — DDM (Medical image synthesis for aging)
  2. 2022, Kim et al. — DiffuseMorph (unsupervised deformable registration)
  3. 2023, Yoon et al. — SADM (Sequence-aware diffusion)
  4. 2024, Litrico et al. — TADM (temporal-aware conditional diffusion)
  5. 2024, Puglisi et al. — BrLP (latent diffusion + prior control)

이러한 흐름 속에서 본 프로젝트는 BrLP 모델에서 volumetric changes를 반영하는 것에서 더 나아가, 모델이 deformation field 조건을 통해 morphological changes를 학습 가능하게 하고자 한다. 이를 통해, 기존 BrLP 모델이 morphological changes 학습에 부족함이 있는 한계를 보완하고자 한다.

시장상황에 대한 분석

  • 경쟁제품 조사 비교

현재 치매 예측을 위한 생성 모델 분야에서는 시간 조건부 생성(temporally-aware generation)과 고품질 의료 영상 합성에 초점을 맞춘 여러 연구가 제안되고 있다. 특히 MICCAI 2024에 발표된 TADM과 BrLP는 본 프로젝트와 가장 유사한 기술적 배경을 갖고 있다. TADM (Litrico et al., 2024)은 age gap을 condition으로 입력받아 단일 시점 이미지에서 향후 시점의 MRI를 예측하는 구조이며, classifier 기반의 loss를 사용해 출력의 신뢰도를 보장한다. 반면, BrLP (Puglisi et al., 2024)는 ControlNet을 도입해 미래 MRI의 volumetric changes를 외부 auxiliary model로부터 예측하고 이를 생성 조건으로 사용함으로써 정밀도를 높였다. LAS(Latent Average Stabilization)를 통해 생성 품질을 안정화하는 기법도 함께 도입되었다. 이에 비해 본 프로젝트는 단순 age나 volumetric 변화량을 넘어서, 추정한 deformation field 를 통해 morphological changes 까지 조건으로 사용하는 방식을 채택하고 있다. 이로 인해 기존 모델보다 구조적 일관성과 병리학적 타당성이 높은 결과물을 생성할 수 있는 가능성이 있으며, 조기진단에 특화된 시나리오에서도 경쟁우위를 확보할 수 있다. 또한, 기존 연구가 inference 전용 데모 수준에 머무는 반면, 본 프로젝트는 실시간 렌더링이 가능한 WebGPU 기반 3D 인터페이스, 백엔드 시스템 전체를 포함한 웹 플랫폼까지 구현하여 기술 상용화 가능성을 실질적으로 높였다는 점에서 차별화된다.

  • 마케팅 전략 제시

본 프로젝트는 의료 영상 기반 AI 서비스로서, 타겟 시장을 명확히 정의하고 진입 전략을 다음의 5단계로 구체화하였다:

  1. 타겟 시장 설정: 초기에는 신경과 병원, 뇌영상 연구소, 신약개발을 수행하는 제약회사 등 전문 사용자를 중심으로 채널을 설정하며, 고부가가치 유저를 확보하는 전략을 택한다.
  2. 기술 신뢰 확보: 학술 논문 발표, 백서(white paper) 배포 등을 통해 모델의 과학적 타당성과 기술력을 입증하고, 향후 임상 적용 가능성을 강조한다.
  3. 서비스 체험 유도: 웹 기반 데모와 클라우드 플랫폼을 통해 비설치형 체험 환경을 제공, 초기 사용자 확보와 피드백 수집을 병행한다. 무료 체험판 및 테스트 계정을 통한 접근성도 강화할 예정이다.
  4. 협력 및 공동 연구: 병원·연구소·디지털 헬스케어 기업과의 공동연구 혹은 MOU 체결을 통해 실사용 데이터 수집 및 기술 검증을 수행한다. 이를 통해 신뢰성과 시장 진입 속도를 동시에 확보할 수 있다.
  5. 규제 및 윤리 대응: AI 기반 의료 서비스의 한계와 윤리적 책임을 명확히 기술하고, 개인정보 보호, 보안 정책 등을 정립하여 향후 인증 획득과 제품화에 필요한 기반을 사전에 구축한다.

이와 같은 전략은 경쟁 기술보다 명확한 유저 타겟, 기술 신뢰 기반의 진입, 클라우드 기반 체험 제공, 그리고 임상 현장과의 연계 전략 측면에서 유리하며, 규제 대응 시나리오까지 포괄하는 계획적 마케팅 접근이라 할 수 있다.


개발과제의 기대효과

기술적 기대효과

본 과제는 조기 진단에 특화된 종단 3D MRI 생성 기술을 제안함으로써, 기존 단일 시점 분석 방식의 한계를 극복하고자 한다. 특히 AD 진행 예측을 위한 training data가 충분하지 않은 상황에서, 본 프로젝트는 synthetic data를 생성함으로써 분류기의 일반화 성능을 향상시킬 수 있는 가능성을 제시한다. 또한, Alzheimer’s Disease뿐만 아니라 전두측두엽 치매(FTD), 루이소체 치매(DLB) 등 다양한 아형에 따른 뇌 위축 패턴을 반영한 예측이 가능하며, 이는 진단과 치료 전략의 다양성 확보에 기여할 수 있다. 모델의 이미지 생성 성능은 SSIM, PSNR, NRMSE 등 주요 지표에서 기존 SOTA 수준을 상회하는 결과를 목표로 하며, 이는 의료 영상으로서의 실질적 사용 가능성을 뒷받침한다. 시스템 아키텍처 측면에서도 RAFT 알고리즘 기반의 데이터 일관성 유지, 메시지 큐 기반의 고속 비동기 처리, Java Virtual Thread를 활용한 고동시성 처리를 통해 고신뢰·고가용성 인프라를 실현한다. 더불어, React + WebGPU 기반의 직관적인 3D 시각화 인터페이스를 통해 사용자는 고해상도 뇌 MRI를 실시간으로 탐색할 수 있다.

경제적, 사회적 기대 및 파급효과

치매는 고령화 사회에서 가장 심각한 사회적·경제적 부담 중 하나로 부각되고 있으며, 조기 진단 및 예측 기술의 필요성이 날로 증가하고 있다. 본 프로젝트는 의료진의 진단 정확도 향상뿐만 아니라, 신약개발 연구자의 데이터 기반 의사결정을 지원함으로써, 전임상 단계에서의 시간과 비용 절감에도 기여할 수 있다. 또한, 별도의 설치 없이 웹 기반으로 실행 가능한 구조로 설계되어 의료 접근성이 낮은 지역이나 원격 협진 환경에서도 활용이 가능하며, 이는 디지털 헬스케어의 확산에 실질적인 기반이 될 수 있다. 나아가, 다중 환자군의 진행 시나리오를 예측할 수 있는 모델은 정책 수립이나 복지 자원 배분 등의 공공정책 도구로도 확장될 수 있는 잠재력을 지닌다.

기술개발 일정 및 추진체계

개발 일정

내용

구성원 및 추진체계

본 프로젝트는 총 6인의 팀원으로 구성되었으며, 기술 영역에 따라 MRI 팀과 서비스 개발 팀으로 역할을 분담하였다. 각 팀원은 설계, 개발, 실험, 검증 등 프로젝트의 전 단계를 공동으로 수행하였으며, 다음과 같은 기술적 책임을 맡아 프로젝트를 추진하였다.

이름 역할 주요 담당 분야
구효근 MRI 팀 / 렌더링 3D MRI Rendering
송채희 MRI 팀 / 생성형 AI 모델 설계 VCDM 모델 구조 설계 및 학습, 성능 실험 및 비교 검증
권준호 서비스 개발 / MLOps·RAFT RAFT 알고리즘 구현, Inference 파이프라인 구성
김혜주 서비스 개발 / 백엔드 MQ(Message Queue)
석우진 서비스 개발 / 인프라·서버 성능 최적화 서버 구조 설계
Java Virtual Thread 기반 서버 동시성 구조 설계
박영빈 서비스 개발 / 프론트엔드 React 기반 UI 개발, WebGPU MRI 시각화 구현

이 구성은 팀원이 단순 분업이 아닌 협업 가능한 역할 기반 구조로 배치되어 있어, 기술간 연계와 동시 병렬 작업이 가능하도록 설계되었다.

설계

설계사양

사용자 요구사항

  • R1: 사용자는 3D s-MRI 데이터를 업로드하고, 조건(연령, 성별, 인지 상태 등)을 설정하여 미래 시점의 MRI를 예측 생성할 수 있어야 한다.
  • R2: 생성 결과는 원본 MRI와 함께 실시간 3D 뷰어에 반영되어야 하며, 사용자는 이를 인터랙티브하게 탐색할 수 있어야 한다. (예: 회전, 슬라이싱, 줌인 등)
  • R3: 시스템은 사용자가 생성 버튼을 클릭한 후 평균 3초 이내에 결과를 반환해야 하며, 1,000건 이상의 동시 요청도 무중단으로 처리할 수 있어야 한다.
  • R4: 데이터 처리 및 전달 과정에서 메시지 유실이 없어야 하며, 장애 발생 시에도 로그 일관성과 복구 능력을 유지해야 한다.
  • R5: 웹 애플리케이션은 별도의 설치 없이 브라우저에서 바로 접근 가능해야 하며, 초기 로딩 시간은 1초 이내로 제한되어야 한다.
  • R6: 사용자는 생성된 MRI를 채팅 기능을 통해 다른 사용자에게 공유하고, 실시간으로 협업 및 피드백을 받을 수 있어야 한다.

사용자 요구사항 만족을 위한 기능 정의 및 기능별 정량 목표

  • F1: 사용자가 업로드한 3D s-MRI와 입력 조건(Target Age, Sex, Cognitive Status 등)을 기반으로, 향후 시점의 MRI를 자동 생성하는 기능 → SSIM ≥ 0.977, PSNR ≥ 33.7, NRMSE ≤ 0.087 (실측: 0.978 / 34.2 / 0.085)
  • F2: 생성된 MRI는 뷰어에서 기존 MRI와 함께 3D 볼륨 형태로 시각화되며, 슬라이스 탐색과 회전·확대·이동이 가능한 인터랙션 기능 제공 → 렌더링 프레임 속도 ≥ 60FPS (256³ 기준), 반응 지연 ≤ 50ms
  • F3: 생성 요청 이후 평균 3초 이내로 결과가 반환되며, 고부하 상황에서도 안정적인 응답 성능을 보장하는 기능 → 평균 응답시간 ≤ 50ms, 1,000 req/s 조건에서 장애 발생률 ≤ 5%
  • F4: 메시지 큐 기반 처리 흐름에서 데이터 유실 없이 안정적 전달을 보장하며, 장애 발생 시 RAFT를 통해 빠른 복구가 가능한 기능 → MQ 유실률 0%, RAFT 로그 일치율 ≥ 95%, 리더 재선출 시간 ≤ 1초
  • F5: 웹 애플리케이션은 별도의 설치 없이 사용 가능하며, 초기 로딩 시간 및 인터페이스 반응성을 최소화한 경량 구조 → 웹 LCP ≤ 1.0초 (실측: 0.82초), CLS ≤ 0.1
  • F6: 채팅 기능을 통해 사용자는 MRI 생성 결과를 공유하고, 다른 사용자와 실시간으로 메시지를 주고받을 수 있는 기능 → 메시지 송수신 지연 ≤ 100ms, 채팅 중 MRI 공유 시 뷰어 자동 연동

개념설계안

내용

이론적 계산 및 시뮬레이션

내용

상세설계 내용

내용

결과 및 평가

완료 작품의 소개

프로토타입 사진 혹은 작동 장면

내용

포스터

내용

관련사업비 내역서

내용

완료작품의 평가

내용

향후계획

내용

특허 출원 내용

내용