2분반-Chat이루매
cdc wiki
프로젝트 개요
기술개발 과제
국문 : Chat 이루매
영문 : Chat Irumae
과제 팀명
컴종설 2조
지도교수
박관용 교수님
개발기간
2025년 9월 ~ 2025년 12월 (총 3개월)
구성원 소개
서울시립대학교 컴퓨터과학과 2019920055 채민관
서울시립대학교 컴퓨터과학과 2022920009 김도훈
서울시립대학교 컴퓨터과학과 2020920063 최재용
서울시립대학교 컴퓨터과학과 2020920057 정윤재
서울시립대학교 컴퓨터과학과 2020920050 이학림
서론
개발 과제의 개요
개발 과제 요약
서울시립대학교 학생들이 학사 규정, 시설, 식단, 행사 등의 학교생활 전반에 대한 정보를 신속하고 정확하게 얻는 것은 학업 효율성과 캠퍼스 생활 만족도를 높이는 중요한 요소입니다. 그러나 현재는 정보가 학사 공지, 포탈, 커뮤니티(에브리타임) 등 여러 곳에 분산되어 있어 학생들이 직접 탐색해야 하는 불편함이 있습니다. 이를 해결하기 위해 Vector DB 기반 RAG 구조와 LLM을 활용한 질의응답 시스템 'Chat 이루매'를 개발하였습니다. 이 시스템은 질문 유형에 따라 최적화된 응답 경로(Path Routing)를 제공하며, LLM의 불확실한 답변 문제를 최소화하기 위해 관련 규정 페이지, 부서 연락처 등 신뢰할 수 있는 출처를 함께 제공합니다. 또한 다국어 지원, 음성 입력, 캠퍼스 공간 인식 기반 경로 안내 기능을 통합하여 접근성을 높였습니다.
개발 과제의 배경
서울시립대학교는 매년 학사제도 변경, 장학금, 수강 신청 등 다양한 행정 정보를 공지하지만, 학생들은 이를 UOS 포털, 학사 공지, 단과대별 공지 등 분산된 시스템에서 확인해야 합니다. 이 과정에서 정보 누락이나 반복적인 행정실 문의가 발생하여 업무 비효율을 초래하고 있습니다. 또한 대학 구성원의 70% 이상이 모바일 기반으로 정보를 탐색하는 환경임에도, 기존 FAQ 방식은 검색 정확도와 접근성이 낮아 만족도가 떨어지는 문제가 있었습니다. 이러한 문제를 해결하기 위해 자연어 기반 질문을 실시간으로 처리하고, 학사 편람·공지 사항 등 공신력 있는 자료를 기반으로 정확한 답변을 제공하는 서울시립대 전용 RAG 기반 챗봇 시스템이 필요하게 되었습니다.
개발 과제의 목표 및 내용
본 과제의 핵심 목표는 서울시립대학교 학사·행정 정보를 정확하고 신뢰성 있게 제공하는 AI 챗봇을 구축하는 것입니다. 이를 달성하기 위한 주요 개발 내용은 다음과 같습니다.
RAG 기반 시스템 구축: 실제 문서에서 근거를 검색하고 답변을 생성하는 구조로, 사용자 질문 파싱, 벡터 DB 기반 문서 검색, LLM 답변 생성, 출처 제시의 4단계 파이프라인을 구성하였습니다
데이터 처리 및 저장: 학사편람, 학사공지, 장학제도, 수강신청 안내문 등을 크롤링·전처리하여 ChromaDB에 임베딩하고, MongoDB에 메타데이터를 저장하였습니다.
백엔드 및 최적화: Spring Boot 백엔드가 검색·생성 과정을 제어하며, Redis를 시맨틱 캐시로 활용하여 응답 속도를 높였습니다.
사용자 인터페이스: 웹 기반 프론트엔드(React)를 통해 학생이 자연어로 질문하면 즉시 답변을 받을 수 있도록 설계하였으며, 정확도 평가를 위한 테스트 데이터셋을 구축하여 성능을 검증하였습니다.
관련 기술의 현황
관련 기술의 현황 및 분석(State of art)
-전 세계적인 기술현황 Retrieval-Augmented Generation(RAG)은 대형 언어모델(LLM)의 생성 능력에 문서 검색을 결합해 사실 기반 답변을 만드는 표준 아키텍처로 자리 잡았습니다. 최근 연구들은 검색과 생성을 병렬·적응적으로 결합해 지연(latency)을 줄이고 품질을 높이는 방향(예: PipeRAG)으로 진화하고 있습니다. 검색 기술로는 의미 임베딩 기반의 Dense retrieval과 키워드 기반의 Sparse 검색을 혼합한 Hybrid search가 보편적이며, 정밀도를 높이기 위해 Cross-encoder를 활용한 재랭킹(Reranking) 전략이 널리 채택되고 있습니다. 인프라 측면에서는 Chroma와 같은 벡터 DB와 LangChain 같은 오케스트레이션 툴이 표준 스택으로 활용됩니다.
-특허조사 및 특허 전략 분석 본 과제와 관련된 주요 특허로는 US20240346256A1(Response generation using a retrieval augmented AI model)이 있습니다. 이 특허는 쿼리와 관련된 정보를 검색하고 LLM을 통해 답변을 생성하는 시스템에 관한 것으로, 본 프로젝트의 RAG 구조 및 LLM 활용 방식과 유사한 기술적 배경을 가지고 있습니다.
-기술 로드맵 기술 개발은 크게 3단계로 진행됩니다. 0–1개월(기초구축)에는 원자료 수집 및 크롤러 완성, 문서 전처리(Chunking), Chroma 컬렉션 구축 및 프로토타입 RAG 파이프라인을 완성합니다. 1–3개월(성능고도화)에는 하이브리드 검색 도입, Reranker(교차 인코더) 추가, Redis 캐싱 및 신뢰성 모듈(출처 표기)을 적용하여 성능을 향상합니다. 3–6개월(운영·확장)에는 멀티턴 대화 관리, 다국어(영·중·일) 확장, 음성 입력 인터페이스 추가 및 데이터 자동 갱신 파이프라인 구축을 목표로 합니다.
시장상황에 대한 분석
-경쟁제품 조사 비교 이화여대, 고려대, 서울시 교육청 등의 기존 챗봇과 비교 분석하였습니다. 타 챗봇들은 주로 단순 키워드 매칭이나 정해진 FAQ 답변을 제공하는 방식(백과사전식)으로, 구체적인 상황에 대한 유연한 답변이 어렵습니다. 예를 들어 정수기와 화장실 위치를 물었을 때 동일하게 단순 지도만 제시하는 식입니다. 반면 Chat 이루매는 Vector DB와 RAG를 활용하여 질문에 대해 구체적이고 자세한 답변을 생성하며, 학교 데이터와 직접 관련이 없는 질문에도 LLM을 활용해 답변할 수 있다는 차별점이 있습니다.
-마케팅 전략 제시 마케팅 목표는 학생·교직원 채택률 확대와 행정 문의 감소입니다. 첫째, 학기 초나 오리엔테이션 기간에 파일럿(시범운영)을 배포하여 피드백을 수집하고 즉시 패치합니다. 둘째, 학교 포털, 에브리타임, SNS 채널을 통해 사용법과 FAQ 영상을 배포하는 디지털 통합 마케팅을 진행합니다. 셋째, 행정 부서(장학팀, 교무팀 등)와 협력하여 챗봇의 문의 해결률 지표를 공유하고 운영 개선에 반영합니다. 넷째, 답변에 출처 제시 기능을 강조하는 신뢰성 캠페인을 통해 사용자의 신뢰를 확보합니다.
개발과제의 기대효과
기술적 기대효과
내용
경제적, 사회적 기대 및 파급효과
내용
기술개발 일정 및 추진체계
개발 일정
내용
구성원 및 추진체계
내용
설계
설계사양
제품의 요구사항
내용
설계 사양
내용
개념설계안
내용
이론적 계산 및 시뮬레이션
내용
상세설계 내용
내용
결과 및 평가
완료 작품의 소개
프로토타입 사진 혹은 작동 장면
내용
포스터
내용
관련사업비 내역서
내용
완료작품의 평가
내용
향후계획
내용
특허 출원 내용
내용