박민재
Minjae Park
CS UNDERGRADUATE
- Birth2001.10.05
- Home경기도 수원시
- Education가천대학교 컴퓨터공학과 · 컴퓨터공학부
COMPUTER SCIENCE · UNDERGRADUATE
Minjae Park
NLP · RAG · LLM Agent를 중심으로
논문과 프로젝트, 아키텍처 구현을 함께 쌓아 온 컴퓨터공학 학부생입니다.
PROFILE
Minjae Park
CS UNDERGRADUATE
바이오메디컬 BERT 모델의 임베딩 공간에 내재된 약물-부작용 관계 정보를 활용해, 기존 데이터베이스에 명시되지 않은 잠재적 ADR 관계 후보를 예측하고, SIDER·FAERS·문헌 검토를 통해 그 예측 가능성을 검증했습니다.p < .001)을 함께 설계했고, 리뷰 대응 과정에서 한계와 주장 범위를 스스로 정리했습니다.
Biomedical NLP · ADR Prediction · Parametric Knowledge
BioBERT 임베딩 공간에 담긴 약물-부작용 관계 신호를 이용해, 기존 데이터베이스에 없는 잠재적 ADR 후보를 예측
약물·부작용 유사도와 알려진 관계 구조를 결합해 relation score를 만들었습니다. 이후 SIDER 내부 평가와 FAERS 외부 검증을 함께 수행해, 모델 점수가 실제 약물감시 데이터와도 연결되는지 확인했습니다.
기존 임베딩이 바이오메디컬 텍스트의 복잡한 문맥과 관계를 충분히 반영하지 못한다는 문제점
약물 부작용은 환자 안전과 신약 개발에 직접 연결되기 때문에, 알려진 부작용을 넘어 잠재 관계를 조기에 찾는 것이 중요합니다. 이 연구는 PubMed/PMC 기반 BERT가 Word2Vec보다 더 풍부한 도메인 관계 정보를 담고 있는지 확인하고자 했습니다.
바이오메디컬 BERT 임베딩이 알려지지 않은 약물-부작용 관계 예측에 실제로 유용한지 검증
먼저 SIDER의 알려진 관계를 얼마나 잘 복원하는지 평가했습니다. 그다음 SIDER에는 없지만 FAERS나 최신 문헌에서 관찰되는 후보와도 연결되는지 확인해, 벤치마크 성능과 실제 약물감시 활용 가능성을 함께 보려 했습니다.
SIDER 관계 그래프와 언어모델 임베딩 유사도를 결합해 모든 약물-부작용 후보의 relation score를 계산
SIDER 4.1의 158,096개 관계, 1,345개 약물, 6,123개 부작용을 기반으로 8,235,435개 후보 쌍을 평가했습니다. BioBERT, BiomedBERT, PharmBERT, vanilla BERT, Word2Vec을 비교해 도메인 사전학습의 효과를 분리해 보았습니다. 외부 검증에는 FAERS의 901,361개 관계를 사용했습니다.
clagator/biobert_v1.1이 AUC 0.915로 가장 높은 성능. Word2Vec과 vanilla BERT보다 높은 성능을 보이며 BERT의 양방향 context-aware 임베딩과 domain adaptation에 따른 성능 향상을 입증
FAERS 외부 검증에서도 모델 예측과 보고 관계 사이에 유의한 연결이 확인되었습니다(P < .001, OR 4.822). 이는 모델이 높게 점수화한 후보가 실제 보고 데이터에서도 더 자주 관찰된다는 뜻입니다. 상위 후보 일부는 2016년 이후 문헌에서도 보고되어, 단순 복원이 아니라 잠재 관계 탐색 가능성을 보여주었습니다.
AI신기술체계개발대 데이터관리병으로 복무하며 AiRWARDS 공군 GPT의 RAG 파이프라인을 구축하고, LLMOps 대시보드와 법률·판례·군사용어 도메인 데이터 수집 및 적재 파이프라인을 개발했습니다.
Leaf Node로 정밀하게 검색하고 Parent Node로 문맥을 반환해 정밀도–정보량 trade-off를 완화.
장-절-조를 hierarchy metadata로 보존, 계층 문맥을 embedding에 반영해 규정 검색 개선.
Langfuse·RAG 지표·PCA 분포·Hit Rate를 React 19 · FastAPI로 시각화해 검색 품질 추적.
Data Science & AI Convergence Lab · 가천대학교. Biomedical NLP 연구를 수행했고, JMIR Medical Informatics 공동 1저자 publication으로 이어졌습니다.
English Language Institute · Fall C 2022. 영어 학습과 Reading & Writing 트랙에서 Academic Excellence를 수상했습니다.
서버에 살아 있는 agent runtime을 모바일과 데스크톱에서 이어 다루는 웹 기반 작업 공간.
핵심 요약·접수 단계·발의자를 한 카드에 모아, 스크롤만으로 입법 흐름을 훑습니다.
Summary Feed
핵심 요약·접수 단계·발의자·스크랩 수를 한 카드에 모아, 스크롤만으로 입법 흐름을 훑습니다.
AI Bill Summary
GPT-5가 긴 원문을 짧은 요약으로 줄여, 원문을 다 읽지 않아도 핵심을 파악합니다.
Timeline
접수·처리·가결 현황과 날짜별 위원회 심사를 한 줄기로 이어, 진행을 시간으로 읽습니다.
Ask & Discover
키워드 대신 질문으로 법안과 진행 상황을 묻고, 추천 질문으로 빠르게 탐색합니다.
AI/NLP, RAG, LLM Agent를 중심으로 연구 문제를 찾고 구현으로 검증해 왔습니다. 연구실 지원, 면담, 프로젝트·논문 피드백과 관련해 메일 주시면 관심 주제와 준비 과정을 정리해 빠르게 답장드리겠습니다.