Dec 18

[개발/엔지니어링] PaperRun: 논문 재현 자동화 플랫폼

📌 프로젝트 소개

AI가 연구 논문(PDF)을 분석해 코드를 자동 생성하고 실행하여, 누구나 쉽게 논문 실험을 재현할 수 있게 하는 웹 기반 플랫폼입니다.
Empty space, drag to resize

🧐 문제 정의

최근 인공지능 및 데이터 과학 분야에서 수많은 논문이 매일 발표되지만, 실제로 논문 속 실험을 재현하기 위해서는 복잡한 환경 설정, 코드 구현, 데이터 준비 등 높은 진입 장벽이 존재합니다. 이로 인해 연구 결과의 재현성(reproducibility) 이 낮아지고, 연구자·학생들이 아이디어를 실험해볼 기회가 제한되는 문제가 있습니다. 또한 논문별로 코드 공개 형태가 다르거나 아예 코드가 존재하지 않아, 연구 효율성과 신뢰성이 저하되는 현상이 지속되고 있습니다.
Empty space, drag to resize

💡 문제 해결

본 프로젝트는 논문 PDF를 업로드하면 AI가 자동으로 내용을 분석하고, 핵심 알고리즘과 실험 절차를 추출해 실행 가능한 Jupyter Notebook(.ipynb) 코드와 실행 결과를 제공합니다. n8n 워크플로우를 기반으로 각 노드에 역할을 부여하여 프로세스를 구성하며, Upstage Document Parse로 논문 구조를 파싱하고 Solar Pro2 LLM을 통해 코드 자동 생성과 환경 설정이 이루어집니다. 사용자는 별도의 개발 지식 없이 클릭 한 번으로 논문 실험을 재현할 수 있으며, 이는 연구 재현성 향상과 학습 효율 개선에 크게 기여합니다.
Empty space, drag to resize

⚙️ 핵심 기능

논문 PDF 자동 분석 및 코드 변환 시스템은 업스테이지 Document Parse API와 두 단계의 Solar Pro2(LLM) 에이전트가 함께 동작하는 구조로 이루어져 있습니다. 
먼저 논문을 업로드하면 Document Parse가 본문, 표, 수식, 코드 블록 등 문서 구조를 정교하게 분리하고, 1단계 에이전트가 이를 기반으로 논문의 핵심 실험 요소인 모델 구조, 데이터셋, 전처리 방식, 학습 파라미터, 평가 지표, 실험 절차를 표준화된 Json 형태로 추출합니다. 
이후 2단계 에이전트는 1단계 에이전트에서 출력된 Json을 입력받아 논문 내용을 재현할 수 있는 코드 내용 Json 파일을 자동 생성하며, 모델 정의·데이터 로딩·학습·평가 코드까지 포함된 일관된 실행 환경을 다시 Json 형식으로 구성합니다. 이렇게 생성된 JSON파일을 n8n workflow 내부의 Code라는 노드를 통해 Json에서 Ipynb파일로 변환합니다. 
이러한 흐름을 통해 “논문 PDF → 구조 분석 → 실험 요약 JSON → 실행 가능한 Notebook 코드”로 이어지는 자동화 파이프라인이 완성되며, 연구자는 문서 해석이나 코드 작성 대신 재현 실험에 집중할 수 있게 됩니다.
Empty space, drag to resize

🎬 데모 영상

Write your awesome label here.
Empty space, drag to resize

👥 팀원 소개

윤여헌 - 아이디어 구축 및 workflow 설계

조우석 - workflow 설계 보조 및 발표자료 준비
김태경 - workflow 설계 보조 및 발표

Empty space, drag to resize

💾 참고 자료