경계에서 새는 문맥
Parent Node의 Chunk 경계에서 문맥이 소실되는 문제가 발생하므로, 검색된 Leaf Node가 Parent Node의 맨 앞/맨 마지막 노드인 경우, 인접 Leaf Node의 내용을 이어붙여 같이 반환
공군 GPT 에이전트 AiRWARDS의 RAG 파이프라인에서는 청크를 작게 자를수록 검색은 정밀해졌지만, LLM에 전할 문맥은 줄어드는 trade-off가 있었습니다. Leaf Node로 정밀하게 검색하고 Parent Node로 풍부한 문맥을 반환하는 Small-to-Big 청킹으로, 정밀한 검색과 풍부한 문맥을 함께 얻었습니다.
개발 과정에서의 어려움과 해결 방법.
Parent Node의 Chunk 경계에서 문맥이 소실되는 문제가 발생하므로, 검색된 Leaf Node가 Parent Node의 맨 앞/맨 마지막 노드인 경우, 인접 Leaf Node의 내용을 이어붙여 같이 반환
검색 단계에서 Parent Node와 Leaf Node 사이의 중복 발생으로 인한 Top-K 잠식 문제가 발생하므로, Result Collapsing을 통한 Retrieval 결과 중복 처리가 필요. 서로 겹치는 Parent-Leaf Node가 있을 경우 Parent만 반환. 같은 부모를 공유하는 Leaf Node들이 여러 개 검색될 경우 하나의 Parent만 반환
부모 노드의 크기를 초과하는 표는 여전히 청크 경계에 의해 잘려나가 정보가 소실될 수 있음
본 개발노트에서는 검색 성능 및 답변 품질 향상을 정성적으로 분석하였으나, Recall@K, Precision@K, MRR, nDCG 등의 검색 성능 지표에 따른 정량 평가는 수행하지 못함. 따라서 제안 방식의 효과를 보다 체계적으로 검증하기 위해서는 향후 정량 평가가 필요함
Leaf Node 기반 검색은 세부 질의에 대한 정밀한 매칭을 가능하게 하지만, 최종적으로 Parent Node를 반환하는 과정에서 질의와 직접 관련 없는 주변 문맥까지 함께 포함될 수 있음. 이로 인해 LLM의 입력 컨텍스트가 불필요하게 증가하거나, 일부 질의에서는 답변 생성 과정에 노이즈가 유입될 가능성이 있음
공군 AiRWARDS 시스템의 RAG 파이프라인에서 발생한 chunk size에 따른 검색 정밀도와 문맥 정보량 사이의 trade-off를 해결하기 위해 Small-to-Big 청킹 전략을 적용하였다. Leaf Node를 정밀한 검색 단위로, Parent Node를 풍부한 문맥 제공 단위로 활용함으로써 세부 질의에 대한 검색 정확도와 답변 생성에 필요한 문맥 확보를 동시에 달성하고자 했다.
또한 Multi-Granularity Indexing, Result Collapsing, Context Stitching을 함께 적용하여 다양한 질의 유형에 대응하고, 중복 검색 결과와 청크 경계로 인한 문맥 소실 문제를 완화하였다. 이를 통해 여러 문단에 근거가 분산된 질의나 표 데이터처럼 문맥 보존이 중요한 문서에서도 보다 안정적인 답변 생성을 지원할 수 있었다.
향후에는 정량 평가를 통해 기존 fixed-size chunking 방식 대비 성능 향상을 검증하고, 문서 유형별 특성을 반영한 adaptive chunking 전략으로 확장할 여지가 있다.