검색은 정밀하게, 정보량은 풍부하게.
Small-to-Big 계층형 청킹으로 검색 정밀도와 정보량 사이의 trade-off를 풀었습니다. 검색은 작은 단위로 정밀하게, 에이전트가 받는 정보량은 충분하게 만들었습니다.
LlamaIndex·LangChain으로 자동 청킹 아키텍처를 짰습니다.
검색은 작은 단위로, 참조는 큰 단위로. Parent-Child로 둘을 연결했습니다.
AiRWARDS의 검색 정밀도와 참조 정보량이 같이 올라갔습니다.
대한민국 법령의 장–절–조 계층 맞춤형 파서를 직접 짰습니다.
청크의 주변 문맥을 임베딩에 반영했습니다. 의미 손실을 막았습니다.
VLM으로 문서 이미지의 맥락을 추출했습니다. description으로 정형화해 검색에 노출했습니다.
다중 헤더 군 행정문서 테이블도 전처리·구조화했습니다.