Research Ideas

현재 연구 질문을 세 개의 실험 가능한 프레임으로 압축합니다.

카드에는 핵심만 남기고, 이 페이지에는 문제의식과 방법의 뼈대를 둡니다. ORAG는 서버의 연구 작업공간 문서를 기준으로 정리했습니다.

ORAG

Observer-triggered Retrieval-Augmented Generation

코딩 에이전트가 검색해야 할 순간을 놓치는 문제를 다룹니다.

ORAG는 repository-level coding agent의 plan, search, edit, test trajectory를 별도의 Observer가 관찰하고, 정보 결핍이 보이면 code, test, docs, log evidence를 수집해 구조화된 evidence packet으로 전달하는 프레임워크입니다.

Core claim

병목은 검색 품질만이 아니라, 작업 중 retrieval necessity를 인지하지 못하는 데 있다.

Mechanism

Observer Retriever가 trajectory state를 추적하고, 정보 질문을 만들고, evidence board와 delivery gate를 운영한다.

Boundary

Observer는 코드를 직접 고치지 않고, 다음 안전한 boundary에서 use-or-ignore advisory packet만 노출한다.

Next step

Agentic Observer Retriever replay를 scikit-learn/Django trajectory에 적용하고 Active Scout baseline과 비교한다.

ATI

Adaptive Teacher Intervention

작은 RL agent가 막히는 순간에만 교사가 한 스텝 개입합니다.

DAVID-GRPO 계열이 cold-start를 넘긴 뒤 plateau에서 무너지는 지점을 단일 스텝 수준 개입과 curriculum decay로 다루는 동적 증류 아이디어입니다. 목표는 teacher cost를 상시 투입하지 않고도 trajectory 전환이 필요한 구간만 찾아내는 것입니다.

RFAR

Reranker-Free Adaptive Retrieval

문서 그래프가 충분히 성숙하면 리랭커 의존도를 줄입니다.

리랭커를 부트스트래핑 교사로 사용하고, 누적 문서 그래프를 장기 메모리로 활용하는 점진적 리랭커 제거 프레임워크입니다. graph maturity 기반 gating policy로 full, selective, graph-only reranking 사이를 전환해 비용과 성능의 균형을 찾습니다.