Dec 17

[문서 처리] SLIDIFY: AI 프레젠테이션 자동 생성기

📌 프로젝트 소개

사내 문서·데이터·회의록 등 다양한 소스를 분석해 맞춤형 프레젠테이션 슬라이드와 발표 대본을 자동 생성함으로써 업무 보고 및 발표 준비 시간을 획기적으로 단축하는 n8n 기반 업무 자동화 에이전트입니다.
Empty space, drag to resize

🧐 문제 정의

[Information Overload & Standardization Limits]
1. 반복적인 보고 자료 작성 부담: 주간/월간 보고, 프로젝트 현황 공유, 경영진 보고 등을 위해 매번 사내 문서, 스프레드시트, 회의록을 수동으로 취합하고 정리하는 데 과도한 시간이 소요됩니다.
2. 데이터 소스의 이질성: 웹페이지와 같은 비정형 데이터(Unstructured Data)와 논문처럼 형식이 갖춰진 정형/반정형(structured Data) 데이터를 동일한 프로세스로 처리할 경우, 할루시네이션이 발생하거나 정보의 깊이가 얕아지는 문제가 있습니다.
3. 자동화 도구의 디자인 한계: 기존의 슬라이드 생성 도구(Marp 기본 기능 등)는 디자인이 단조롭고 획일화되어 있어, 실제 프레젠테이션에 활용하기에는 시각적 매력도가 떨어집니다.
Empty space, drag to resize

💡 문제 해결

1. 데이터 소스별 맞춤형 처리 전략

A. URL to PPT (Agentic Design 적용)

  • 대상: 뉴스, 블로그 등 형식이 불규칙한 웹페이지

  • 방식: Playwright로 정보 수집 후, LLM Agent가 문맥을 판단해 핵심 내용 발췌 (데이터 가변성에 대응하는 유연한 패턴 사용)

  • 기능: 이미지 기반 슬라이드 생성 지원

B. Arxiv to PPT (Workflow Design 적용)

  • 대상: 긴 문맥과 명확한 구조(Abstract, Method 등)를 가진 학술 논문

  • 방식: 품질 저하 방지를 위한 Multi-step Workflow 설계 (HTML 미지원 시 PDF 파싱 병행)

  • 상세 단계:

    1. 정보 추출: 논문 구조 기반 섹션별(초록, 방법론, 성능, 결론) 핵심 내용 추출

    2. 비동기 처리: 슬라이드 타입 결정 및 JSON 데이터 병렬 생성으로 누락 방지


2. 기술적 난제 해결

  • 이미지 매핑 오류 해결: 논문 도표/이미지 파싱 시 발생하는 LLM 환각(Hallucination) 방지를 위해 figure_id 부여 및 렌더링 직전 실제 URL 재매핑 로직 구현

  • Upstage Solar 최적화: n8n 공식 노드 한계 극복을 위해 reasoning_effort 등 옵션 제어가 가능한 Custom Node 직접 개발로 추론 성능 극대화


3. 디자인 차별화

  • 동적 템플릿 시스템: Marp 디자인 한계 극복을 위한 커스텀 CSS 및 12종의 전용 슬라이드 스키마 정의

  • Jinja2 템플릿 엔진: LLM 생성 JSON 데이터를 Jinja 템플릿을 통해 고품질 마크다운 및 디자인 코드로 정밀 변환


Empty space, drag to resize

⚙️ 핵심 기능


[핵심 기능 및 기술 사양]


1. 다중 소스 기반 지능형 요약 및 슬라이드 생성

사용자가 입력한 URL의 유형을 자동으로 감지하여 최적의 파이프라인으로 PPT와 발표 대본을 생성합니다.

  • Web to PPT: 뉴스 기사(IPO 등), 기술 블로그의 핵심 내용을 요약 및 시각화합니다.

  • Paper to PPT: Arxiv 링크 입력 시, '앤드류 응 교수의 논문 읽기법' 기반의 구조적 요약으로 변환합니다. (예: SOLAR 10.7B, Attention is All You Need 등 대응 가능)


2. 향상된 시각화 및 자동화

  • 자동화된 레이아웃 결정: 텍스트 양과 성격에 따라 12가지 슬라이드 타입(표지, 목차, 도표/텍스트 중심 등) 중 최적의 레이아웃을 AI가 자동 선택합니다.

  • 도표 및 이미지 통합: 논문 내 주요 Figure를 인식하고 슬라이드 적재적소에 자동으로 배치합니다.


3. 추후 개발 로드맵

  • 멀티미디어 지원 확대: YouTube 영상 및 오디오 파일(Wav) 분석 후 슬라이드 변환 기능 (프로토타입 단계).

  • 사용자 맞춤형 테마: 기업 CI나 개인 선호도에 맞춘 커스텀 CSS 테마 선택 기능 제공 예정.


4. 활용 기술 (Tech Stack)

  • Main LLM: 모든 프로세스에 Solar-pro 모델 사용

  • PDF Analysis: 정교한 문서 구조 파악을 위한 Upstage Document Parse 적용

Empty space, drag to resize

🎬 데모 영상

Write your awesome label here.
Write your awesome label here.

🎬 데모 바로가기

Empty space, drag to resize

👥 팀원 소개

임근석 - 총괄
프로필 링크
성항용 - Agent system
soundlayerd@gmail.com
권준호 - Infra & Midia workflow & Backend
프로필 링크
이호민 - Workflow system & Marp rendering API
프로필 링크
김남희 - Evaluation system
knh0503@pusan.ac.kr
류준하 - Evaluation system
jhryu6@pusan.ac.kr
Empty space, drag to resize

💾 참고 자료