정부 입찰 RFP 분석 고도화 RAG 시스템
4가지 Retrieval 전략 비교 분석을 통한 검색 파이프라인 최적화
<aside>
<img src="/icons/target_lightgray.svg" alt="/icons/target_lightgray.svg" width="40px" />
💡 Project Summary
정부 입찰 RFP 100건을 대상으로 사용자가 검색을 진행하면 LLM이 저장된 문서중 가장 올바른 문서를 찾아내어 정리하고 요약해주는 RAG 시스템
Core Problem & Solution
- 문제(Pain Point)
- Retry 기반의 Adaptive Retrieval은 응답 시간이 최대 5배까지 지연되며, 유사 사업 혼재 시 환각(Hallucination) 발생
- 해결(Solution)
- Retry를 제거하고 Multi-Search(Semantic + Metadata) + Cross-Encoder Reranking 파이프라인으로 전환하여 사전 정확도 확보
- 결과(Impact)
- 검색 정확도 향상 및 예측 가능한 응답 시간(Latency Stability) 확보
</aside>
1. 프로젝트 개요
- 기간: 2025.11.10 - 2025.11.28 (3주)
- 역할: Retriever Lead (기여도 25%)
- Retrieval 전략 설계 및 성능 비교 (LangChain vs LangGraph)
- 한국어 특화 Reranking 및 문서 전처리 파이프라인 구축
- Github: Link
- 협업일지: Link
2. 핵심 성과
- 검색 정확도 극대화
- Hybrid Multi-Search 및 Cross-Encoder Reranking 도입으로 정성적 정확도 85% 향상.
- 응답 속도 안정화
- Adaptive Retrieval(재시도 방식)의 한계인 간헐적 레이턴시 급증(최대 5배) 문제를 사전 최적화 방식으로 해결하여 예측 가능한 응답 시간 확보.
- 비교 분석 기능 구현
- 독립 검색 및 병합(Merge) 파이프라인을 구축하여 기존 RAG에서 처리가 불가능했던 복수 사업 비교 질의 완벽 처리.
3. 의사결정 및 문제 해결
A. Adaptive → Multi-Search 전환
- 문제:
초기 도입한
Adaptive Retrieval(품질 미달 시 재검색) 방식은 품질은 확보되나, Retry 발생 시 응답 시간이 최대 5배까지 지연되는 성능 불확실성 존재.
- 해결:
재시도(Retry) 의존도를 제거하고, 첫 검색의 정밀도를 높이는
Hybrid Multi-Search 전략으로 아키텍처 변경.
- Semantic Search: 의미 기반 검색으로 포괄적 문맥 확보.
- Metadata Recall: 발주 기관, 예산 등 키워드 기반 필터링 병행.
- Deduplication & Merge: 두 검색 결과의 중복 제거 및 통합.
- 결과:
Retry 로직 완전 제거를 통해 응답 시간의 변동성을 없애고 안정적인 서비스 품질 확보.