"1분반-ODISS"의 두 판 사이의 차이

cdc wiki
이동: 둘러보기, 검색
(프로젝트 개요)
(서론)
25번째 줄: 25번째 줄:
  
 
==서론==
 
==서론==
 +
 
===개발 과제의 개요===
 
===개발 과제의 개요===
 +
 
====개발 과제 요약====
 
====개발 과제 요약====
내용
+
본 개발 과제는 OCR 모델에 기초한 시니어 복약지도 에이전트 시스템인 ODISS를 구축하는 것을 목표로 한다. ODISS는 처방전 또는 복약 관련 정보를 자동으로 인식하고, 사용자가 이해하기 쉬운 방식으로 복약 안내를 제공하는 AI 기반 복약지도 서비스이다.
 +
 
 +
사용자는 처방전 사진, 복약 관련 질문, 음성 명령 등을 웹 또는 음성 인터페이스를 통해 입력할 수 있다. 시스템은 OCR을 이용하여 처방전 이미지에서 약품명, 용량, 복용 횟수, 투약 일수 등 핵심 정보를 추출하고, 이를 구조화하여 데이터베이스에 저장한다. 이후 DUR API와 LLM 기반 추론 엔진을 활용하여 병용금기, 중복 복용, 복용 주의사항 등 복약 안전성과 관련된 정보를 검토한다.
 +
 
 +
ODISS는 단순한 챗봇이 아니라, OCR 인식, 복약 정보 구조화, DUR API 연동, LLM 추론, 복용 기록 저장, 문서화, 음성 응답 기능을 하나의 서비스 흐름으로 연결하는 복약 중심 AI 에이전트 시스템이다. 최종적으로 시니어와 만성질환자가 자신의 복약 정보를 보다 쉽게 이해하고 관리할 수 있도록 돕고, 보호자 또는 가족이 복용기록과 안내 내용을 체계적으로 확인할 수 있는 복약관리 서비스를 구현하는 것을 목표로 한다.
 +
 
 +
초기 설계에서는 AI 스피커 형태의 하드웨어 기반 서비스도 고려하였다. 로컬 에이전트는 STT, OCR, TTS 기능을 담당하고, 서버 에이전트는 복약 정보 추론, 도구 호출, 기록 관리, 응답 생성을 담당하는 구조로 설계하였다. 또한 실제 사용자 테스트와 시연 가능성을 높이기 위해 웹 인터페이스와 모바일 앱 인터페이스를 함께 활용하는 방향으로 확장하였다.
 +
 
 
====개발 과제의 배경====
 
====개발 과제의 배경====
내용
+
우리 사회는 빠르게 고령화되고 있으며, 고령자와 만성질환자의 장기 복약 관리 문제는 점점 중요해지고 있다. 고혈압, 당뇨, 심혈관 질환 등 만성질환을 가진 사용자는 여러 약을 장기간 복용하는 경우가 많으며, 복용 시간이나 복용 방법을 놓치거나 헷갈리는 문제가 발생할 수 있다. 특히 시니어 사용자의 경우 처방전이나 약봉투에 적힌 정보를 직접 이해하기 어렵고, 여러 병원이나 약국에서 받은 약을 함께 복용하면서 중복 복용이나 병용금기 위험이 발생할 가능성도 존재한다.
 +
 
 +
기존 복약관리 방식은 보호자, 가족, 의료진의 지속적인 개입에 의존하는 경우가 많다. 그러나 보호자나 의료 인력이 항상 사용자의 복약 상황을 확인하기는 어렵고, 사용자의 기억에만 의존하는 방식은 누락이나 오복용 문제를 완전히 방지하기 어렵다. 또한 일반적인 생성형 AI 서비스는 복약 분야에서 정확한 근거 없이 답변을 생성할 수 있으며, 의료적 판단과 정보 제공의 경계가 불명확해질 위험이 있다.
 +
 
 +
ODISS는 이러한 문제를 해결하기 위해 처방전 OCR, DUR API 기반 사실 검증, LLM 기반 자연어 응답을 결합한다. 사용자는 복잡한 약물 정보를 직접 입력하지 않고도 처방전 사진이나 음성 질문을 통해 복약 정보를 등록하고 확인할 수 있다. 시스템은 OCR 결과를 구조화하고, DUR API를 통해 복약 안전성과 관련된 근거를 확인한 뒤, 시니어가 이해하기 쉬운 문장으로 안내한다.
 +
 
 +
또한 본 프로젝트는 단순히 AI가 답변을 생성하는 것을 넘어, 복용기록 저장과 문서화 기능을 포함한다. 이를 통해 일회성 질의응답에 그치지 않고, 사용자별 복약 이력을 지속적으로 관리하는 서비스로 확장될 수 있다. 이러한 구조는 시니어의 복약 안전성을 높이고, 보호자의 돌봄 부담을 줄이며, 향후 의료·헬스케어 서비스와 연계될 수 있는 기반이 된다.
 +
 
 
====개발 과제의 목표 및 내용====
 
====개발 과제의 목표 및 내용====
내용
+
본 개발 과제의 목표는 OCR과 AI 에이전트 기술을 활용하여 실제 활용 가능한 시니어 복약지도 서비스를 구현하는 것이다. 이를 위해 시스템은 처방전 이미지 인식, 복약 정보 구조화, DUR API 연동, LLM 기반 추론, 음성 대화, 기록 저장, 문서화 기능을 포함하도록 설계하였다.
 +
 
 +
첫째, 처방전 이미지를 입력받아 약품명, 용량, 복용 횟수, 투약 일수 등 복약지도에 필요한 핵심 정보를 정확하게 추출하는 OCR 기반 인식 기능을 구현한다. OCR 결과는 단순 텍스트가 아니라 이후 DUR 조회와 복약 상담에 활용될 수 있도록 구조화된 데이터 형태로 저장한다.
 +
 
 +
둘째, OCR로 수집된 약물 정보와 사용자의 복약 관련 질문을 바탕으로 DUR API를 연동한다. 이를 통해 병용금기, 중복 복용, 복용 주의사항 등 복약 안전성과 관련된 정보를 확인하고, LLM이 임의로 추측하지 않고 공신력 있는 데이터에 기반하여 응답하도록 한다.
 +
 
 +
셋째, LLM 기반 에이전트를 통해 시니어가 이해하기 쉬운 복약지도 문장을 제공한다. 의료적 진단이나 처방을 직접 수행하는 것이 아니라, 복약 정보 전달과 주의 환기, 필요 시 전문가 상담 권고를 제공하는 방식으로 안전성을 확보한다.
 +
 
 +
넷째, 복용기록 저장과 문서화 기능을 구현한다. 사용자의 복약 정보, 질의응답 내용, 복약 안내 결과를 저장하고, 필요 시 PDF 또는 보고서 형태로 정리하여 보호자나 사용자에게 제공할 수 있도록 한다. 이를 통해 ODISS는 단순한 질의응답 도구가 아니라 지속적인 복약관리 체계로 동작할 수 있다.
 +
 
 +
다섯째, 웹, 음성인식 스피커, 모바일 환경에서 사용할 수 있는 프로토타입을 구현한다. FastAPI 기반 서버와 로컬 에이전트 구조를 통해 OCR, STT, TTS, LLM 추론, DUR Tool 호출이 연결되도록 하며, 사용자가 실제로 말하고 확인할 수 있는 서비스 흐름을 구성한다.
  
 
===관련 기술의 현황===
 
===관련 기술의 현황===
 +
 
====관련 기술의 현황 및 분석(State of art)====
 
====관련 기술의 현황 및 분석(State of art)====
 +
 
*전 세계적인 기술현황
 
*전 세계적인 기술현황
내용
+
최근 AI 기반 헬스케어 서비스는 단순 정보 검색을 넘어, 사용자 입력을 이해하고 필요한 도구를 호출하여 근거 기반 응답을 생성하는 에이전트 구조로 발전하고 있다. 특히 복약관리 분야에서는 OCR, 음성인식, 자연어 처리, 의료정보 API, 모바일 서비스가 결합되는 방향으로 기술이 확장되고 있다.
 +
 
 +
OCR 기술은 처방전이나 약봉투와 같은 문서 이미지에서 약품명, 복용량, 복용 횟수 등의 정보를 추출하는 핵심 기술이다. 본 프로젝트에서는 한국어 처방전과 약학 용어 인식이 중요하므로, 일반 문서 OCR보다 의약품명과 복약 정보 필드 추출 성능이 중요하다. OCR 결과는 이후 DUR 조회와 LLM 추론의 입력으로 사용되기 때문에, 단순 문자 인식률뿐 아니라 약품명 정규화와 구조화 정확도까지 함께 고려해야 한다.
 +
 
 +
음성인식 기술은 시니어 사용자가 키보드나 복잡한 앱 조작 없이 시스템과 상호작용하기 위한 핵심 기술이다. 사용자는 “이 약 같이 먹어도 돼?”, “오늘 약 뭐 먹어?”, “처방전 사진 찍을게”처럼 자연스러운 발화를 사용할 수 있어야 한다. 따라서 STT 모델은 짧고 불완전한 발화, 잡음이 섞인 발화, 고령층 발화 특성을 어느 정도 처리할 수 있어야 한다.
 +
 
 +
LLM 기반 추론 기술은 사용자의 복약 질문을 이해하고, 필요한 경우 DUR API나 내부 복약 기록을 활용하여 답변을 생성하는 데 사용된다. 그러나 의료·복약 영역에서 LLM을 단독으로 사용할 경우 환각이나 부정확한 답변 위험이 있으므로, ODISS는 DUR API와 검증용 LLM을 함께 사용하여 근거 기반 응답을 생성하는 구조를 지향한다.
 +
 
 +
또한 로컬 에이전트와 서버 에이전트를 분리하는 구조도 중요하다. 로컬 에이전트는 OCR, STT, TTS와 같이 사용자와 직접 접촉하는 입출력 기능을 담당하고, 서버 에이전트는 추론, 기록 관리, 도구 호출, 응답 생성을 담당한다. 이를 통해 제한된 하드웨어 환경에서도 실시간성과 안정성을 확보하고, 복잡한 추론 작업은 서버에서 처리할 수 있다.
 +
 
 
*특허조사 및 특허 전략 분석
 
*특허조사 및 특허 전략 분석
내용
+
관련 특허를 조사한 결과, 스마트 약통, 복약 보조 장치, 사용자 맞춤형 의료정보 제공 시스템, 헬스케어 데이터 비식별화 장치 등 복약관리와 헬스케어 정보 제공을 다루는 선행기술이 존재한다. 기존 특허 중 상당수는 약을 보관하고 알림을 제공하는 스마트 약통 또는 복약 보조 장치에 가까우며, LLM 기반 에이전트가 OCR, DUR API, 음성 대화, 복약 기록을 통합적으로 처리하는 구조와는 차이가 있다.
 +
 
 +
ODISS의 특허 전략은 단순한 약통 장치 자체보다는 복약지도 AI 에이전트의 처리 흐름과 데이터 관리 방식에 초점을 둘 수 있다. 예를 들어 처방전 OCR 결과를 약품 정보로 구조화하고, 이를 DUR API 조회와 LLM 추론에 연결하는 과정, 민감한 개인정보를 분리·검열한 뒤 복약 메타데이터를 관리하는 방식, 복약 관련 질의에서 안전한 응답을 생성하기 위한 프롬프트 및 도구 호출 구조 등이 차별화 요소가 될 수 있다.
 +
 
 +
또한 환자 데이터 활용 측면에서는 개인정보 보호와 비식별화 전략이 중요하다. 복약 정보는 건강 상태를 추정할 수 있는 민감한 정보이기 때문에, 서비스 구현 시 사용자의 식별정보와 복약 메타데이터를 분리하고, 연구나 분석에 활용되는 데이터는 법적 기준에 맞게 비식별화해야 한다. 따라서 특허 전략뿐 아니라 개인정보 보호 설계와 안전한 데이터 활용 전략이 함께 고려되어야 한다.
 +
 
 
*기술 로드맵
 
*기술 로드맵
내용
+
ODISS의 기술 로드맵은 로컬 에이전트 구축, 서버 에이전트 구축, AI 추론 및 도구 호출 고도화, 사용자 인터페이스 확장, 안정화 및 테스트 단계로 나눌 수 있다.
 +
 
 +
1단계에서는 로컬 에이전트의 기본 구조를 구현한다. 로컬 에이전트는 Wake-a-word 감지, STT, OCR, TTS 기능을 포함하며, 사용자의 음성 발화와 처방전 촬영 데이터를 서버로 전송하는 역할을 수행한다. 초기에는 제한된 하드웨어 환경에서 동작 가능한 경량 모델과 입력·출력 파이프라인을 구성하는 것이 중요하다.
 +
 
 +
2단계에서는 FastAPI 기반 AI 서버를 구축한다. 서버는 OCR 결과와 사용자 질의를 JSON 형태로 수신하고, 메모리 엔진, 추론 엔진, 대화 엔진, 프론티어 LLM 검증 엔진, MCP 도구 호출 모듈을 통해 응답을 생성한다. DUR API, 외부 LLM API, 기록 저장 기능은 MCP 도구를 통해 연결되도록 구성한다.
 +
 
 +
3단계에서는 복약 정보 추론과 안전성 판단을 고도화한다. OCR 결과를 약품명, 용량, 복용 횟수 등으로 구조화하고, 약품명 정규화 및 품목 식별 과정을 통해 DUR 조회에 사용할 수 있는 형태로 변환한다. 이후 병용금기, 중복 복용, 주의사항을 확인하고, 시니어가 이해하기 쉬운 문장으로 안내한다.
 +
 
 +
4단계에서는 웹 및 모바일 앱 인터페이스를 확장한다. 웹은 사용자 발화와 AI 응답, OCR 촬영 흐름을 시각적으로 확인할 수 있는 테스트 환경으로 활용한다. 모바일 앱은 실제 사용자가 스마트폰에서 복약지도 서비스를 사용할 수 있도록 하는 확장 방향으로 설계한다.
 +
 
 +
5단계에서는 성능 최적화와 안정화 테스트를 수행한다. OCR 정확도, 복약 안전성 판단 정확도, 응답 품질, 처리 속도, 시스템 안정성, 개인정보 보호 수준을 평가하고, 제한된 GPU 및 메모리 환경에서 안정적으로 동작할 수 있도록 양자화 및 메모리 최적화 기술을 적용한다.
  
 
====시장상황에 대한 분석====
 
====시장상황에 대한 분석====
 +
 
*경쟁제품 조사 비교
 
*경쟁제품 조사 비교
내용
+
기존 시장에는 AI 스피커, 스마트 약통, 복약 알림 앱, 헬스케어 정보 제공 서비스 등이 존재한다. 그러나 이들 제품은 ODISS가 목표로 하는 OCR 기반 처방전 인식, DUR API 연동, LLM 기반 복약지도, 음성 대화, 복용기록 저장 기능을 모두 통합적으로 제공하는 형태와는 차이가 있다.
 +
 
 +
Google의 Gemini 기반 음성 어시스턴트나 기존 AI 스피커는 일반적인 음성 명령과 생활 편의 기능에 초점을 두고 있으며, 복약지도에 특화된 에이전트 시스템으로 제공되지는 않는다. KT, SKT, LG 등 국내 AI 스피커 서비스 역시 초기에는 음성비서 시장에서 주목받았지만, LLM 기반의 고도화된 의료·복약 전문 에이전트 서비스로 발전한 사례는 제한적이다.
 +
 
 +
스마트 약통이나 복약 알림 앱은 사용자가 약을 제때 먹도록 돕는 데에는 유용하지만, 처방전 내용을 자동으로 인식하거나, DUR API를 통해 병용금기와 중복 복용을 검증하거나, 사용자의 질문에 자연어로 복약 안내를 제공하는 기능은 제한적이다. 따라서 ODISS는 기존 복약관리 제품과 달리, “약 정보 입력 자동화”, “복약 안전성 검증”, “AI 기반 질의응답”, “기록 관리”를 하나의 흐름으로 통합한다는 점에서 차별성을 가진다.
 +
 
 +
또한 단순 하드웨어 판매 모델은 현실성과 확장성 측면에서 한계가 있을 수 있다. 따라서 ODISS는 전용 하드웨어 자체를 최종 제품으로 삼기보다, 복약지도 AI 엔진과 웹·앱 인터페이스를 포함한 R&D 기반 서비스 검증 모델로 접근하는 것이 적절하다. 이를 통해 기존 헬스케어 앱, 약국 서비스, 지자체 돌봄 서비스, AI 스피커 플랫폼과 연계 가능한 소프트웨어 중심 서비스로 확장할 수 있다.
 +
 
 
*마케팅 전략 제시
 
*마케팅 전략 제시
내용
+
ODISS의 주요 대상 사용자는 시니어, 만성질환자, 다제복용자, 보호자, 가족, 방문 돌봄 인력이다. 이들은 복약 누락, 중복 복용, 복약 정보 이해 어려움, 보호자 확인 부담과 같은 문제를 경험할 가능성이 높다. 따라서 마케팅 전략은 단순히 “AI 스피커”나 “챗봇”을 판매하는 방향이 아니라, “복약 정보를 쉽게 등록하고 안전하게 확인할 수 있는 AI 복약지도 서비스”라는 메시지를 중심으로 구성하는 것이 적절하다.
 +
 
 +
첫 번째 전략은 시니어와 보호자를 대상으로 한 사용성 중심 홍보다. 복잡한 약물 정보를 직접 입력하지 않아도 처방전 사진과 음성 질문을 통해 복약 정보를 확인할 수 있다는 점을 강조한다. 특히 “부모님의 약 복용을 보호자가 함께 확인할 수 있다”, “약 정보를 쉽게 이해할 수 있다”, “중복 복용이나 주의사항을 확인할 수 있다”는 메시지가 효과적이다.
 +
 
 +
두 번째 전략은 약국, 병원, 지역 보건소, 지자체 돌봄 서비스와의 연계이다. ODISS는 처방전 OCR과 복약 기록 관리 기능을 제공할 수 있으므로, 약국 복약지도 보조 도구나 지역사회 만성질환 관리 서비스의 일부로 활용될 수 있다. 이 경우 개별 사용자에게 직접 판매하는 B2C 방식뿐 아니라, 기관과 연계하는 B2B 또는 B2G 방식도 고려할 수 있다.
 +
 
 +
세 번째 전략은 R&D 검증 기반의 산업체 제공이다. 본 프로젝트는 완제품 판매보다는 복약지도 AI 엔진, DUR API 연동 구조, OCR 기반 약물 정보 구조화, 음성 대화 인터페이스를 검증하는 프로토타입 성격이 강하다. 따라서 산업체 제공 시에는 하드웨어 판매 모델보다 기존 헬스케어 서비스에 연동 가능한 AI 복약지도 모듈로 제안하는 것이 현실적이다.
 +
 
 +
네 번째 전략은 데이터 활용 가능성이다. 단, 복약 데이터는 민감한 개인정보에 해당할 수 있으므로, 사용자의 동의와 비식별화 처리를 전제로 해야 한다. 적절히 비식별화된 복약 메타데이터는 장기적으로 복약 패턴 분석, 다제복용 위험 연구, 복약 순응도 개선 연구에 활용될 수 있다. 따라서 ODISS의 데이터 전략은 개인정보 보호와 서비스 고도화를 동시에 만족하는 방향으로 설계되어야 한다.
  
 
===개발과제의 기대효과===
 
===개발과제의 기대효과===
 +
 
====기술적 기대효과====
 
====기술적 기대효과====
내용
+
ODISS의 기술적 기대효과는 OCR, 음성인식, LLM 추론, DUR API, 기록 관리, 웹·앱 인터페이스를 하나의 복약지도 서비스 흐름으로 통합한다는 점에서 나타난다. 기존의 복약관리 서비스는 단순 알림이나 수동 기록에 머무르는 경우가 많았지만, ODISS는 처방전 인식부터 복약 안전성 검증, 자연어 안내, 기록 저장까지 연결된 구조를 제공한다.
 +
 
 +
첫째, OCR 기반 처방전 인식을 통해 사용자의 복약 정보 입력 부담을 줄일 수 있다. 약품명, 용량, 복용 횟수, 투약 일수와 같은 핵심 정보를 자동으로 추출하고 구조화하면, 사용자가 직접 복잡한 약물 정보를 입력하지 않아도 된다. 이는 시니어 사용자의 접근성을 높이는 데 중요한 효과를 가진다.
 +
 
 +
둘째, DUR API와 LLM 추론을 결합하여 복약 안내의 신뢰성을 높일 수 있다. 일반 LLM은 의료·복약 분야에서 부정확한 답변을 생성할 수 있지만, ODISS는 DUR API를 근거 데이터로 활용하여 병용금기, 중복 복용, 복용 주의사항 등을 확인한다. 또한 프론티어 LLM 검증 엔진을 통해 내부 추론 결과를 재검토함으로써 응답의 안전성과 설명 품질을 높일 수 있다.
 +
 
 +
셋째, 음성 기반 인터페이스를 통해 시니어 친화적인 사용 환경을 제공할 수 있다. 사용자는 복잡한 앱 조작 없이 자연어로 질문하고, 시스템은 STT와 TTS를 통해 음성 대화 형태로 응답할 수 있다. 이는 기존 텍스트 중심 서비스보다 고령층 접근성 측면에서 장점을 가진다.
 +
 
 +
넷째, 로컬 에이전트와 서버 에이전트를 분리한 구조를 통해 실제 서비스화 가능성을 높일 수 있다. 로컬 에이전트는 입력과 출력, 서버 에이전트는 추론과 기록 관리를 담당함으로써 제한된 하드웨어 환경에서도 기능을 분산 처리할 수 있다. 또한 양자화 및 메모리 최적화 기술을 적용하면 GPU와 메모리 제약이 있는 환경에서도 효율적인 실행을 기대할 수 있다.
 +
 
 +
다섯째, 복용기록 저장과 문서화 기능을 통해 지속적인 복약관리 체계를 만들 수 있다. 사용자의 복약 정보와 상담 이력을 저장하고, 필요 시 PDF 또는 보고서 형태로 정리하면 보호자, 사용자, 의료진이 복약 패턴을 더 체계적으로 확인할 수 있다.
 +
 
 
====경제적, 사회적 기대 및 파급효과====
 
====경제적, 사회적 기대 및 파급효과====
내용
+
ODISS는 시니어와 만성질환자의 복약 안전성 향상, 보호자 부담 완화, 헬스케어 서비스 고도화 측면에서 사회적 파급효과를 기대할 수 있다. 고령화 사회에서는 만성질환자의 장기 복약 관리가 중요한 문제이며, 복약 누락이나 중복 복용은 건강 악화와 의료비 증가로 이어질 수 있다. ODISS는 사용자가 약 정보를 쉽게 이해하고 안전하게 복용할 수 있도록 도와 이러한 문제를 줄이는 데 기여할 수 있다.
 +
 
 +
사회적 측면에서 ODISS는 독거노인이나 보호자가 항상 곁에 있기 어려운 사용자에게 복약 관리 보조 수단을 제공한다. 사용자는 음성으로 복약 정보를 확인할 수 있고, 보호자는 복용기록과 안내 내용을 확인할 수 있다. 이를 통해 가족과 돌봄 인력이 매번 직접 복약 여부를 확인해야 하는 부담을 줄일 수 있다.
 +
 
 +
경제적 측면에서는 복약 순응도 개선을 통해 불필요한 의료 이용과 돌봄 비용을 줄이는 데 기여할 가능성이 있다. 물론 ODISS가 질병을 직접 치료하거나 의료 판단을 대체하는 것은 아니지만, 복약 누락과 오복용 가능성을 줄이는 보조 시스템으로 활용될 경우 만성질환 관리의 효율성을 높일 수 있다.
 +
 
 +
산업적 측면에서는 기존 AI 스피커나 복약 알림 앱과 차별화된 복약지도 AI 서비스 시장을 개척할 수 있다. 단순 하드웨어 판매가 아니라 OCR, DUR API, LLM 추론, 기록 관리 모듈을 포함한 AI 복약지도 엔진을 제공하는 방식으로 확장할 수 있으며, 기존 헬스케어 앱, 약국 서비스, 지역 보건 서비스와 연계할 수 있다.
 +
 
 +
데이터 활용 측면에서도 기대효과가 있다. 사용자의 동의와 비식별화 처리를 전제로 장기 복약 패턴 데이터를 축적하면, 다제복용 위험 분석, 복약 순응도 개선 연구, 시니어 건강관리 정책 수립에 활용될 수 있다. 다만 이러한 데이터 활용은 개인정보 보호와 윤리적 책임을 전제로 해야 하며, 사용자의 민감한 건강 정보가 노출되지 않도록 설계되어야 한다.
  
 
===기술개발 일정 및 추진체계===
 
===기술개발 일정 및 추진체계===
 +
 
====개발 일정====
 
====개발 일정====
내용
+
ODISS의 개발 일정은 2026년 3월부터 2026년 6월까지 약 3개월 동안 진행되도록 계획되었다. 전체 개발 과정은 기획 및 요구사항 분석, 핵심 모듈 설계, 모델 및 서버 구현, 통합 테스트, 사용자 테스트 및 최종 공개 단계로 구성된다.
 +
 
 +
3월에는 프로젝트 주제 확정, 요구사항 분석, 경쟁력 분석, 관련 기술 조사, 시스템 구조 설계를 진행한다. 이 단계에서는 OCR 기반 처방전 인식, DUR API 연동, LLM 기반 복약지도, 로컬 에이전트와 서버 에이전트의 역할 분담을 정의한다. 또한 개발에 필요한 하드웨어와 소프트웨어 도구를 선정하고, 평가 항목과 목표치를 설정한다.
 +
 
 +
4월에는 DUR API Wrapper 개발, MCP 서버 및 LLM 에이전트 시스템 설계, OCR 모델 테스트, 프롬프트 엔지니어링, LLM 데이터셋 개발을 진행한다. 이 단계에서는 OCR 결과가 약품 정보로 구조화될 수 있는지 확인하고, LLM이 DUR API를 올바르게 호출할 수 있도록 도구 호출 구조를 설계한다. 또한 로컬 에이전트와 AI 서버 사이의 JSON 기반 통신 구조를 구체화한다.
 +
 
 +
5월에는 Docker 서버 시스템 배포 준비, LLM 에이전트 시스템 배포화, 프롬프트 엔지니어링 테스트, 데이터 추론 훈련, 프로젝트 통합 및 연결 작업을 수행한다. 이 단계에서는 개별 모듈을 하나의 서비스 흐름으로 연결하고, 처방전 입력부터 복약 질의응답, 기록 저장까지 이어지는 시나리오를 테스트한다. 또한 제한된 GPU와 메모리 환경에서 시스템이 안정적으로 동작할 수 있도록 양자화와 메모리 최적화 가능성을 검토한다.
 +
 
 +
6월에는 기능 구현 테스트, 알파 테스트 출시, 기능 보완 및 유지보수, 논문 집필, 사용자 테스트 반복, 프로젝트 및 데이터셋 공개를 진행한다. 최종 단계에서는 웹 및 모바일 인터페이스를 통해 실제 사용 흐름을 시연하고, 복약지도 AI 엔진의 정확성, 안정성, 사용성, 개인정보 보호 수준을 종합적으로 점검한다.
 +
 
 
====구성원 및 추진체계====
 
====구성원 및 추진체계====
내용
+
ODISS 팀은 서버 및 에이전트 설계, OCR 테스트, DUR API 개발, 프롬프트 엔지니어링, 데이터셋 개발, 배포 및 테스트 업무를 나누어 수행한다. 전체 추진체계는 로컬 에이전트와 AI 서버를 병렬적으로 개발한 뒤, JSON 기반 입출력 프로토콜을 통해 통합하는 방식으로 구성된다.
 +
 
 +
팀장은 전체 일정 수립과 진행 상황 점검을 담당하며, MCP 서버 및 LLM 에이전트 시스템 설계, LLM 데이터셋 개발, 추론 훈련, 시스템 배포화, 프로젝트 통합 및 연결을 총괄한다. 또한 알파 테스트와 사용자 테스트, 논문 집필 과정에도 참여하여 전체 산출물의 방향성을 관리한다.
 +
 
 +
OCR 및 배포·테스트 담당자는 처방전 OCR 모델이 약품명, 용량, 복용 횟수, 투약 일수 등 핵심 정보를 정확히 추출하는지 테스트한다. 이후 Docker 서버 시스템 배포 준비와 기능 구현 테스트를 수행하고, 사용자 테스트 반복 및 최종 산출물 정리에 참여한다.
 +
 
 +
DUR API 및 프롬프트 담당자는 DUR API Wrapper 개발을 수행하고, LLM 에이전트가 복약 관련 질의에서 적절한 도구를 호출할 수 있도록 프롬프트 엔지니어링을 진행한다. 이후 프롬프트 테스트와 알파 테스트 출시, 기능 보완 및 유지보수에 참여한다.
 +
 
 +
데이터셋 및 추론 담당자는 LLM 에이전트 데이터셋 개발과 데이터 추론 훈련을 담당한다. 또한 DUR API Wrapper 개발과 유지보수 업무에도 참여하여 시스템이 실제 복약 시나리오에서 안정적으로 동작할 수 있도록 지원한다.
 +
 
 +
추진체계 측면에서 ODISS는 기능별 모듈 개발 후 통합하는 방식으로 진행된다. OCR 모듈은 처방전 이미지에서 약물 정보를 추출하고, DUR Tool은 복약 안전성 검증을 수행하며, 추론 엔진은 사용자 질의를 분석하고 필요한 도구 호출을 계획한다. 대화 엔진은 최종 응답을 시니어가 이해하기 쉬운 형태로 정리하고, 로컬 에이전트는 STT와 TTS를 통해 사용자와 상호작용한다. 이와 같은 역할 분담을 통해 각 구성요소가 독립적으로 개발되면서도 최종적으로 하나의 복약지도 서비스로 통합될 수 있도록 한다.
  
 
==설계==
 
==설계==

2026년 6월 8일 (월) 22:35 판

프로젝트 개요

기술개발 과제

국문 : OCR 모델에 기초한 시니어 복약지도 에이전트 시스템

영문 : OCR based DUR Instuction Senior Service

과제 팀명

ODISS

지도교수

최혁 교수님

개발기간

2026년 3월 ~ 2026년 6월 (총 4개월)

구성원 소개

서울시립대학교 자유전공학부·과 2023890052 이재석(팀장)

서울시립대학교 컴퓨터과학부·과 2021920055 정현기

서울시립대학교 컴퓨터과학부·과 2022920042 유재휘

서울시립대학교 컴퓨터과학부·과 2023920058 주현우

서론

개발 과제의 개요

개발 과제 요약

본 개발 과제는 OCR 모델에 기초한 시니어 복약지도 에이전트 시스템인 ODISS를 구축하는 것을 목표로 한다. ODISS는 처방전 또는 복약 관련 정보를 자동으로 인식하고, 사용자가 이해하기 쉬운 방식으로 복약 안내를 제공하는 AI 기반 복약지도 서비스이다.

사용자는 처방전 사진, 복약 관련 질문, 음성 명령 등을 웹 또는 음성 인터페이스를 통해 입력할 수 있다. 시스템은 OCR을 이용하여 처방전 이미지에서 약품명, 용량, 복용 횟수, 투약 일수 등 핵심 정보를 추출하고, 이를 구조화하여 데이터베이스에 저장한다. 이후 DUR API와 LLM 기반 추론 엔진을 활용하여 병용금기, 중복 복용, 복용 주의사항 등 복약 안전성과 관련된 정보를 검토한다.

ODISS는 단순한 챗봇이 아니라, OCR 인식, 복약 정보 구조화, DUR API 연동, LLM 추론, 복용 기록 저장, 문서화, 음성 응답 기능을 하나의 서비스 흐름으로 연결하는 복약 중심 AI 에이전트 시스템이다. 최종적으로 시니어와 만성질환자가 자신의 복약 정보를 보다 쉽게 이해하고 관리할 수 있도록 돕고, 보호자 또는 가족이 복용기록과 안내 내용을 체계적으로 확인할 수 있는 복약관리 서비스를 구현하는 것을 목표로 한다.

초기 설계에서는 AI 스피커 형태의 하드웨어 기반 서비스도 고려하였다. 로컬 에이전트는 STT, OCR, TTS 기능을 담당하고, 서버 에이전트는 복약 정보 추론, 도구 호출, 기록 관리, 응답 생성을 담당하는 구조로 설계하였다. 또한 실제 사용자 테스트와 시연 가능성을 높이기 위해 웹 인터페이스와 모바일 앱 인터페이스를 함께 활용하는 방향으로 확장하였다.

개발 과제의 배경

우리 사회는 빠르게 고령화되고 있으며, 고령자와 만성질환자의 장기 복약 관리 문제는 점점 중요해지고 있다. 고혈압, 당뇨, 심혈관 질환 등 만성질환을 가진 사용자는 여러 약을 장기간 복용하는 경우가 많으며, 복용 시간이나 복용 방법을 놓치거나 헷갈리는 문제가 발생할 수 있다. 특히 시니어 사용자의 경우 처방전이나 약봉투에 적힌 정보를 직접 이해하기 어렵고, 여러 병원이나 약국에서 받은 약을 함께 복용하면서 중복 복용이나 병용금기 위험이 발생할 가능성도 존재한다.

기존 복약관리 방식은 보호자, 가족, 의료진의 지속적인 개입에 의존하는 경우가 많다. 그러나 보호자나 의료 인력이 항상 사용자의 복약 상황을 확인하기는 어렵고, 사용자의 기억에만 의존하는 방식은 누락이나 오복용 문제를 완전히 방지하기 어렵다. 또한 일반적인 생성형 AI 서비스는 복약 분야에서 정확한 근거 없이 답변을 생성할 수 있으며, 의료적 판단과 정보 제공의 경계가 불명확해질 위험이 있다.

ODISS는 이러한 문제를 해결하기 위해 처방전 OCR, DUR API 기반 사실 검증, LLM 기반 자연어 응답을 결합한다. 사용자는 복잡한 약물 정보를 직접 입력하지 않고도 처방전 사진이나 음성 질문을 통해 복약 정보를 등록하고 확인할 수 있다. 시스템은 OCR 결과를 구조화하고, DUR API를 통해 복약 안전성과 관련된 근거를 확인한 뒤, 시니어가 이해하기 쉬운 문장으로 안내한다.

또한 본 프로젝트는 단순히 AI가 답변을 생성하는 것을 넘어, 복용기록 저장과 문서화 기능을 포함한다. 이를 통해 일회성 질의응답에 그치지 않고, 사용자별 복약 이력을 지속적으로 관리하는 서비스로 확장될 수 있다. 이러한 구조는 시니어의 복약 안전성을 높이고, 보호자의 돌봄 부담을 줄이며, 향후 의료·헬스케어 서비스와 연계될 수 있는 기반이 된다.

개발 과제의 목표 및 내용

본 개발 과제의 목표는 OCR과 AI 에이전트 기술을 활용하여 실제 활용 가능한 시니어 복약지도 서비스를 구현하는 것이다. 이를 위해 시스템은 처방전 이미지 인식, 복약 정보 구조화, DUR API 연동, LLM 기반 추론, 음성 대화, 기록 저장, 문서화 기능을 포함하도록 설계하였다.

첫째, 처방전 이미지를 입력받아 약품명, 용량, 복용 횟수, 투약 일수 등 복약지도에 필요한 핵심 정보를 정확하게 추출하는 OCR 기반 인식 기능을 구현한다. OCR 결과는 단순 텍스트가 아니라 이후 DUR 조회와 복약 상담에 활용될 수 있도록 구조화된 데이터 형태로 저장한다.

둘째, OCR로 수집된 약물 정보와 사용자의 복약 관련 질문을 바탕으로 DUR API를 연동한다. 이를 통해 병용금기, 중복 복용, 복용 주의사항 등 복약 안전성과 관련된 정보를 확인하고, LLM이 임의로 추측하지 않고 공신력 있는 데이터에 기반하여 응답하도록 한다.

셋째, LLM 기반 에이전트를 통해 시니어가 이해하기 쉬운 복약지도 문장을 제공한다. 의료적 진단이나 처방을 직접 수행하는 것이 아니라, 복약 정보 전달과 주의 환기, 필요 시 전문가 상담 권고를 제공하는 방식으로 안전성을 확보한다.

넷째, 복용기록 저장과 문서화 기능을 구현한다. 사용자의 복약 정보, 질의응답 내용, 복약 안내 결과를 저장하고, 필요 시 PDF 또는 보고서 형태로 정리하여 보호자나 사용자에게 제공할 수 있도록 한다. 이를 통해 ODISS는 단순한 질의응답 도구가 아니라 지속적인 복약관리 체계로 동작할 수 있다.

다섯째, 웹, 음성인식 스피커, 모바일 환경에서 사용할 수 있는 프로토타입을 구현한다. FastAPI 기반 서버와 로컬 에이전트 구조를 통해 OCR, STT, TTS, LLM 추론, DUR Tool 호출이 연결되도록 하며, 사용자가 실제로 말하고 확인할 수 있는 서비스 흐름을 구성한다.

관련 기술의 현황

관련 기술의 현황 및 분석(State of art)

  • 전 세계적인 기술현황

최근 AI 기반 헬스케어 서비스는 단순 정보 검색을 넘어, 사용자 입력을 이해하고 필요한 도구를 호출하여 근거 기반 응답을 생성하는 에이전트 구조로 발전하고 있다. 특히 복약관리 분야에서는 OCR, 음성인식, 자연어 처리, 의료정보 API, 모바일 서비스가 결합되는 방향으로 기술이 확장되고 있다.

OCR 기술은 처방전이나 약봉투와 같은 문서 이미지에서 약품명, 복용량, 복용 횟수 등의 정보를 추출하는 핵심 기술이다. 본 프로젝트에서는 한국어 처방전과 약학 용어 인식이 중요하므로, 일반 문서 OCR보다 의약품명과 복약 정보 필드 추출 성능이 중요하다. OCR 결과는 이후 DUR 조회와 LLM 추론의 입력으로 사용되기 때문에, 단순 문자 인식률뿐 아니라 약품명 정규화와 구조화 정확도까지 함께 고려해야 한다.

음성인식 기술은 시니어 사용자가 키보드나 복잡한 앱 조작 없이 시스템과 상호작용하기 위한 핵심 기술이다. 사용자는 “이 약 같이 먹어도 돼?”, “오늘 약 뭐 먹어?”, “처방전 사진 찍을게”처럼 자연스러운 발화를 사용할 수 있어야 한다. 따라서 STT 모델은 짧고 불완전한 발화, 잡음이 섞인 발화, 고령층 발화 특성을 어느 정도 처리할 수 있어야 한다.

LLM 기반 추론 기술은 사용자의 복약 질문을 이해하고, 필요한 경우 DUR API나 내부 복약 기록을 활용하여 답변을 생성하는 데 사용된다. 그러나 의료·복약 영역에서 LLM을 단독으로 사용할 경우 환각이나 부정확한 답변 위험이 있으므로, ODISS는 DUR API와 검증용 LLM을 함께 사용하여 근거 기반 응답을 생성하는 구조를 지향한다.

또한 로컬 에이전트와 서버 에이전트를 분리하는 구조도 중요하다. 로컬 에이전트는 OCR, STT, TTS와 같이 사용자와 직접 접촉하는 입출력 기능을 담당하고, 서버 에이전트는 추론, 기록 관리, 도구 호출, 응답 생성을 담당한다. 이를 통해 제한된 하드웨어 환경에서도 실시간성과 안정성을 확보하고, 복잡한 추론 작업은 서버에서 처리할 수 있다.

  • 특허조사 및 특허 전략 분석

관련 특허를 조사한 결과, 스마트 약통, 복약 보조 장치, 사용자 맞춤형 의료정보 제공 시스템, 헬스케어 데이터 비식별화 장치 등 복약관리와 헬스케어 정보 제공을 다루는 선행기술이 존재한다. 기존 특허 중 상당수는 약을 보관하고 알림을 제공하는 스마트 약통 또는 복약 보조 장치에 가까우며, LLM 기반 에이전트가 OCR, DUR API, 음성 대화, 복약 기록을 통합적으로 처리하는 구조와는 차이가 있다.

ODISS의 특허 전략은 단순한 약통 장치 자체보다는 복약지도 AI 에이전트의 처리 흐름과 데이터 관리 방식에 초점을 둘 수 있다. 예를 들어 처방전 OCR 결과를 약품 정보로 구조화하고, 이를 DUR API 조회와 LLM 추론에 연결하는 과정, 민감한 개인정보를 분리·검열한 뒤 복약 메타데이터를 관리하는 방식, 복약 관련 질의에서 안전한 응답을 생성하기 위한 프롬프트 및 도구 호출 구조 등이 차별화 요소가 될 수 있다.

또한 환자 데이터 활용 측면에서는 개인정보 보호와 비식별화 전략이 중요하다. 복약 정보는 건강 상태를 추정할 수 있는 민감한 정보이기 때문에, 서비스 구현 시 사용자의 식별정보와 복약 메타데이터를 분리하고, 연구나 분석에 활용되는 데이터는 법적 기준에 맞게 비식별화해야 한다. 따라서 특허 전략뿐 아니라 개인정보 보호 설계와 안전한 데이터 활용 전략이 함께 고려되어야 한다.

  • 기술 로드맵

ODISS의 기술 로드맵은 로컬 에이전트 구축, 서버 에이전트 구축, AI 추론 및 도구 호출 고도화, 사용자 인터페이스 확장, 안정화 및 테스트 단계로 나눌 수 있다.

1단계에서는 로컬 에이전트의 기본 구조를 구현한다. 로컬 에이전트는 Wake-a-word 감지, STT, OCR, TTS 기능을 포함하며, 사용자의 음성 발화와 처방전 촬영 데이터를 서버로 전송하는 역할을 수행한다. 초기에는 제한된 하드웨어 환경에서 동작 가능한 경량 모델과 입력·출력 파이프라인을 구성하는 것이 중요하다.

2단계에서는 FastAPI 기반 AI 서버를 구축한다. 서버는 OCR 결과와 사용자 질의를 JSON 형태로 수신하고, 메모리 엔진, 추론 엔진, 대화 엔진, 프론티어 LLM 검증 엔진, MCP 도구 호출 모듈을 통해 응답을 생성한다. DUR API, 외부 LLM API, 기록 저장 기능은 MCP 도구를 통해 연결되도록 구성한다.

3단계에서는 복약 정보 추론과 안전성 판단을 고도화한다. OCR 결과를 약품명, 용량, 복용 횟수 등으로 구조화하고, 약품명 정규화 및 품목 식별 과정을 통해 DUR 조회에 사용할 수 있는 형태로 변환한다. 이후 병용금기, 중복 복용, 주의사항을 확인하고, 시니어가 이해하기 쉬운 문장으로 안내한다.

4단계에서는 웹 및 모바일 앱 인터페이스를 확장한다. 웹은 사용자 발화와 AI 응답, OCR 촬영 흐름을 시각적으로 확인할 수 있는 테스트 환경으로 활용한다. 모바일 앱은 실제 사용자가 스마트폰에서 복약지도 서비스를 사용할 수 있도록 하는 확장 방향으로 설계한다.

5단계에서는 성능 최적화와 안정화 테스트를 수행한다. OCR 정확도, 복약 안전성 판단 정확도, 응답 품질, 처리 속도, 시스템 안정성, 개인정보 보호 수준을 평가하고, 제한된 GPU 및 메모리 환경에서 안정적으로 동작할 수 있도록 양자화 및 메모리 최적화 기술을 적용한다.

시장상황에 대한 분석

  • 경쟁제품 조사 비교

기존 시장에는 AI 스피커, 스마트 약통, 복약 알림 앱, 헬스케어 정보 제공 서비스 등이 존재한다. 그러나 이들 제품은 ODISS가 목표로 하는 OCR 기반 처방전 인식, DUR API 연동, LLM 기반 복약지도, 음성 대화, 복용기록 저장 기능을 모두 통합적으로 제공하는 형태와는 차이가 있다.

Google의 Gemini 기반 음성 어시스턴트나 기존 AI 스피커는 일반적인 음성 명령과 생활 편의 기능에 초점을 두고 있으며, 복약지도에 특화된 에이전트 시스템으로 제공되지는 않는다. KT, SKT, LG 등 국내 AI 스피커 서비스 역시 초기에는 음성비서 시장에서 주목받았지만, LLM 기반의 고도화된 의료·복약 전문 에이전트 서비스로 발전한 사례는 제한적이다.

스마트 약통이나 복약 알림 앱은 사용자가 약을 제때 먹도록 돕는 데에는 유용하지만, 처방전 내용을 자동으로 인식하거나, DUR API를 통해 병용금기와 중복 복용을 검증하거나, 사용자의 질문에 자연어로 복약 안내를 제공하는 기능은 제한적이다. 따라서 ODISS는 기존 복약관리 제품과 달리, “약 정보 입력 자동화”, “복약 안전성 검증”, “AI 기반 질의응답”, “기록 관리”를 하나의 흐름으로 통합한다는 점에서 차별성을 가진다.

또한 단순 하드웨어 판매 모델은 현실성과 확장성 측면에서 한계가 있을 수 있다. 따라서 ODISS는 전용 하드웨어 자체를 최종 제품으로 삼기보다, 복약지도 AI 엔진과 웹·앱 인터페이스를 포함한 R&D 기반 서비스 검증 모델로 접근하는 것이 적절하다. 이를 통해 기존 헬스케어 앱, 약국 서비스, 지자체 돌봄 서비스, AI 스피커 플랫폼과 연계 가능한 소프트웨어 중심 서비스로 확장할 수 있다.

  • 마케팅 전략 제시

ODISS의 주요 대상 사용자는 시니어, 만성질환자, 다제복용자, 보호자, 가족, 방문 돌봄 인력이다. 이들은 복약 누락, 중복 복용, 복약 정보 이해 어려움, 보호자 확인 부담과 같은 문제를 경험할 가능성이 높다. 따라서 마케팅 전략은 단순히 “AI 스피커”나 “챗봇”을 판매하는 방향이 아니라, “복약 정보를 쉽게 등록하고 안전하게 확인할 수 있는 AI 복약지도 서비스”라는 메시지를 중심으로 구성하는 것이 적절하다.

첫 번째 전략은 시니어와 보호자를 대상으로 한 사용성 중심 홍보다. 복잡한 약물 정보를 직접 입력하지 않아도 처방전 사진과 음성 질문을 통해 복약 정보를 확인할 수 있다는 점을 강조한다. 특히 “부모님의 약 복용을 보호자가 함께 확인할 수 있다”, “약 정보를 쉽게 이해할 수 있다”, “중복 복용이나 주의사항을 확인할 수 있다”는 메시지가 효과적이다.

두 번째 전략은 약국, 병원, 지역 보건소, 지자체 돌봄 서비스와의 연계이다. ODISS는 처방전 OCR과 복약 기록 관리 기능을 제공할 수 있으므로, 약국 복약지도 보조 도구나 지역사회 만성질환 관리 서비스의 일부로 활용될 수 있다. 이 경우 개별 사용자에게 직접 판매하는 B2C 방식뿐 아니라, 기관과 연계하는 B2B 또는 B2G 방식도 고려할 수 있다.

세 번째 전략은 R&D 검증 기반의 산업체 제공이다. 본 프로젝트는 완제품 판매보다는 복약지도 AI 엔진, DUR API 연동 구조, OCR 기반 약물 정보 구조화, 음성 대화 인터페이스를 검증하는 프로토타입 성격이 강하다. 따라서 산업체 제공 시에는 하드웨어 판매 모델보다 기존 헬스케어 서비스에 연동 가능한 AI 복약지도 모듈로 제안하는 것이 현실적이다.

네 번째 전략은 데이터 활용 가능성이다. 단, 복약 데이터는 민감한 개인정보에 해당할 수 있으므로, 사용자의 동의와 비식별화 처리를 전제로 해야 한다. 적절히 비식별화된 복약 메타데이터는 장기적으로 복약 패턴 분석, 다제복용 위험 연구, 복약 순응도 개선 연구에 활용될 수 있다. 따라서 ODISS의 데이터 전략은 개인정보 보호와 서비스 고도화를 동시에 만족하는 방향으로 설계되어야 한다.

개발과제의 기대효과

기술적 기대효과

ODISS의 기술적 기대효과는 OCR, 음성인식, LLM 추론, DUR API, 기록 관리, 웹·앱 인터페이스를 하나의 복약지도 서비스 흐름으로 통합한다는 점에서 나타난다. 기존의 복약관리 서비스는 단순 알림이나 수동 기록에 머무르는 경우가 많았지만, ODISS는 처방전 인식부터 복약 안전성 검증, 자연어 안내, 기록 저장까지 연결된 구조를 제공한다.

첫째, OCR 기반 처방전 인식을 통해 사용자의 복약 정보 입력 부담을 줄일 수 있다. 약품명, 용량, 복용 횟수, 투약 일수와 같은 핵심 정보를 자동으로 추출하고 구조화하면, 사용자가 직접 복잡한 약물 정보를 입력하지 않아도 된다. 이는 시니어 사용자의 접근성을 높이는 데 중요한 효과를 가진다.

둘째, DUR API와 LLM 추론을 결합하여 복약 안내의 신뢰성을 높일 수 있다. 일반 LLM은 의료·복약 분야에서 부정확한 답변을 생성할 수 있지만, ODISS는 DUR API를 근거 데이터로 활용하여 병용금기, 중복 복용, 복용 주의사항 등을 확인한다. 또한 프론티어 LLM 검증 엔진을 통해 내부 추론 결과를 재검토함으로써 응답의 안전성과 설명 품질을 높일 수 있다.

셋째, 음성 기반 인터페이스를 통해 시니어 친화적인 사용 환경을 제공할 수 있다. 사용자는 복잡한 앱 조작 없이 자연어로 질문하고, 시스템은 STT와 TTS를 통해 음성 대화 형태로 응답할 수 있다. 이는 기존 텍스트 중심 서비스보다 고령층 접근성 측면에서 장점을 가진다.

넷째, 로컬 에이전트와 서버 에이전트를 분리한 구조를 통해 실제 서비스화 가능성을 높일 수 있다. 로컬 에이전트는 입력과 출력, 서버 에이전트는 추론과 기록 관리를 담당함으로써 제한된 하드웨어 환경에서도 기능을 분산 처리할 수 있다. 또한 양자화 및 메모리 최적화 기술을 적용하면 GPU와 메모리 제약이 있는 환경에서도 효율적인 실행을 기대할 수 있다.

다섯째, 복용기록 저장과 문서화 기능을 통해 지속적인 복약관리 체계를 만들 수 있다. 사용자의 복약 정보와 상담 이력을 저장하고, 필요 시 PDF 또는 보고서 형태로 정리하면 보호자, 사용자, 의료진이 복약 패턴을 더 체계적으로 확인할 수 있다.

경제적, 사회적 기대 및 파급효과

ODISS는 시니어와 만성질환자의 복약 안전성 향상, 보호자 부담 완화, 헬스케어 서비스 고도화 측면에서 사회적 파급효과를 기대할 수 있다. 고령화 사회에서는 만성질환자의 장기 복약 관리가 중요한 문제이며, 복약 누락이나 중복 복용은 건강 악화와 의료비 증가로 이어질 수 있다. ODISS는 사용자가 약 정보를 쉽게 이해하고 안전하게 복용할 수 있도록 도와 이러한 문제를 줄이는 데 기여할 수 있다.

사회적 측면에서 ODISS는 독거노인이나 보호자가 항상 곁에 있기 어려운 사용자에게 복약 관리 보조 수단을 제공한다. 사용자는 음성으로 복약 정보를 확인할 수 있고, 보호자는 복용기록과 안내 내용을 확인할 수 있다. 이를 통해 가족과 돌봄 인력이 매번 직접 복약 여부를 확인해야 하는 부담을 줄일 수 있다.

경제적 측면에서는 복약 순응도 개선을 통해 불필요한 의료 이용과 돌봄 비용을 줄이는 데 기여할 가능성이 있다. 물론 ODISS가 질병을 직접 치료하거나 의료 판단을 대체하는 것은 아니지만, 복약 누락과 오복용 가능성을 줄이는 보조 시스템으로 활용될 경우 만성질환 관리의 효율성을 높일 수 있다.

산업적 측면에서는 기존 AI 스피커나 복약 알림 앱과 차별화된 복약지도 AI 서비스 시장을 개척할 수 있다. 단순 하드웨어 판매가 아니라 OCR, DUR API, LLM 추론, 기록 관리 모듈을 포함한 AI 복약지도 엔진을 제공하는 방식으로 확장할 수 있으며, 기존 헬스케어 앱, 약국 서비스, 지역 보건 서비스와 연계할 수 있다.

데이터 활용 측면에서도 기대효과가 있다. 사용자의 동의와 비식별화 처리를 전제로 장기 복약 패턴 데이터를 축적하면, 다제복용 위험 분석, 복약 순응도 개선 연구, 시니어 건강관리 정책 수립에 활용될 수 있다. 다만 이러한 데이터 활용은 개인정보 보호와 윤리적 책임을 전제로 해야 하며, 사용자의 민감한 건강 정보가 노출되지 않도록 설계되어야 한다.

기술개발 일정 및 추진체계

개발 일정

ODISS의 개발 일정은 2026년 3월부터 2026년 6월까지 약 3개월 동안 진행되도록 계획되었다. 전체 개발 과정은 기획 및 요구사항 분석, 핵심 모듈 설계, 모델 및 서버 구현, 통합 테스트, 사용자 테스트 및 최종 공개 단계로 구성된다.

3월에는 프로젝트 주제 확정, 요구사항 분석, 경쟁력 분석, 관련 기술 조사, 시스템 구조 설계를 진행한다. 이 단계에서는 OCR 기반 처방전 인식, DUR API 연동, LLM 기반 복약지도, 로컬 에이전트와 서버 에이전트의 역할 분담을 정의한다. 또한 개발에 필요한 하드웨어와 소프트웨어 도구를 선정하고, 평가 항목과 목표치를 설정한다.

4월에는 DUR API Wrapper 개발, MCP 서버 및 LLM 에이전트 시스템 설계, OCR 모델 테스트, 프롬프트 엔지니어링, LLM 데이터셋 개발을 진행한다. 이 단계에서는 OCR 결과가 약품 정보로 구조화될 수 있는지 확인하고, LLM이 DUR API를 올바르게 호출할 수 있도록 도구 호출 구조를 설계한다. 또한 로컬 에이전트와 AI 서버 사이의 JSON 기반 통신 구조를 구체화한다.

5월에는 Docker 서버 시스템 배포 준비, LLM 에이전트 시스템 배포화, 프롬프트 엔지니어링 테스트, 데이터 추론 훈련, 프로젝트 통합 및 연결 작업을 수행한다. 이 단계에서는 개별 모듈을 하나의 서비스 흐름으로 연결하고, 처방전 입력부터 복약 질의응답, 기록 저장까지 이어지는 시나리오를 테스트한다. 또한 제한된 GPU와 메모리 환경에서 시스템이 안정적으로 동작할 수 있도록 양자화와 메모리 최적화 가능성을 검토한다.

6월에는 기능 구현 테스트, 알파 테스트 출시, 기능 보완 및 유지보수, 논문 집필, 사용자 테스트 반복, 프로젝트 및 데이터셋 공개를 진행한다. 최종 단계에서는 웹 및 모바일 인터페이스를 통해 실제 사용 흐름을 시연하고, 복약지도 AI 엔진의 정확성, 안정성, 사용성, 개인정보 보호 수준을 종합적으로 점검한다.

구성원 및 추진체계

ODISS 팀은 서버 및 에이전트 설계, OCR 테스트, DUR API 개발, 프롬프트 엔지니어링, 데이터셋 개발, 배포 및 테스트 업무를 나누어 수행한다. 전체 추진체계는 로컬 에이전트와 AI 서버를 병렬적으로 개발한 뒤, JSON 기반 입출력 프로토콜을 통해 통합하는 방식으로 구성된다.

팀장은 전체 일정 수립과 진행 상황 점검을 담당하며, MCP 서버 및 LLM 에이전트 시스템 설계, LLM 데이터셋 개발, 추론 훈련, 시스템 배포화, 프로젝트 통합 및 연결을 총괄한다. 또한 알파 테스트와 사용자 테스트, 논문 집필 과정에도 참여하여 전체 산출물의 방향성을 관리한다.

OCR 및 배포·테스트 담당자는 처방전 OCR 모델이 약품명, 용량, 복용 횟수, 투약 일수 등 핵심 정보를 정확히 추출하는지 테스트한다. 이후 Docker 서버 시스템 배포 준비와 기능 구현 테스트를 수행하고, 사용자 테스트 반복 및 최종 산출물 정리에 참여한다.

DUR API 및 프롬프트 담당자는 DUR API Wrapper 개발을 수행하고, LLM 에이전트가 복약 관련 질의에서 적절한 도구를 호출할 수 있도록 프롬프트 엔지니어링을 진행한다. 이후 프롬프트 테스트와 알파 테스트 출시, 기능 보완 및 유지보수에 참여한다.

데이터셋 및 추론 담당자는 LLM 에이전트 데이터셋 개발과 데이터 추론 훈련을 담당한다. 또한 DUR API Wrapper 개발과 유지보수 업무에도 참여하여 시스템이 실제 복약 시나리오에서 안정적으로 동작할 수 있도록 지원한다.

추진체계 측면에서 ODISS는 기능별 모듈 개발 후 통합하는 방식으로 진행된다. OCR 모듈은 처방전 이미지에서 약물 정보를 추출하고, DUR Tool은 복약 안전성 검증을 수행하며, 추론 엔진은 사용자 질의를 분석하고 필요한 도구 호출을 계획한다. 대화 엔진은 최종 응답을 시니어가 이해하기 쉬운 형태로 정리하고, 로컬 에이전트는 STT와 TTS를 통해 사용자와 상호작용한다. 이와 같은 역할 분담을 통해 각 구성요소가 독립적으로 개발되면서도 최종적으로 하나의 복약지도 서비스로 통합될 수 있도록 한다.

설계

설계사양

제품의 요구사항

내용

설계 사양

내용

개념설계안

내용

이론적 계산 및 시뮬레이션

내용

상세설계 내용

내용

결과 및 평가

완료 작품의 소개

프로토타입 사진 혹은 작동 장면

내용

포스터

내용

관련사업비 내역서

내용

완료작품의 평가

내용

향후계획

내용

특허 출원 내용

내용