Dec 17

[IT/데이터 관리/분석] 싹싹파일: AI 기반 문서 정리 및 자동 분류 시스템

📌 프로젝트 소개

AI 기반 파일 관리 솔루션 "싹싹파일" 출시

현대인은 수많은 디지털 파일 속에서 원하는 문서를 찾는 데 상당한 시간을 소모합니다. "싹싹파일"은 이러한 문제를 해결하기 위해 Upstage의 Solar Pro 2와 Upstage Embed for Agent를 활용한 AI 기반 파일 정돈 및 검색 자동화 프로그램입니다. 사용자의 로컬 디렉토리를 체계적으로 분류하고, 파일 내용 기반 검색을 지원하여 업무 효율성을 혁신적으로 개선합니다.

Empty space, drag to resize

🧐 문제 정의

문제 정의: 무질서한 파일 관리의 고통

대부분의 사용자는 파일명 또는 저장 위치를 정확히 기억하지 못해 문서 검색에 어려움을 겪습니다. 예를 들어, "지난분기 마케팅 보고서"라는 주제는 기억나지만 정확한 파일명이나 경로를 모를 경우, 수십 분 동안 폴더를 탐색해야 합니다. 이는 생산성 저하로 이어지며, 특히 대규모 문서를 다루는 조직에서는 심각한 비효율성을 초래합니다.

Empty space, drag to resize

💡 문제 해결

해결 방안: AI 기반 파일 분석 및 구조화

1. 타겟 디렉토리 선정
   사용자가 지정한 로컬 디렉토리 또는 자주 접근하는 저장소를 분석 대상으로 설정합니다.  

2. 파일 스캔 및 확장자 분류
   디렉토리 내 모든 파일을 스캔한 후 확장자별로 분류하여 처리 효율성을 높입니다.  

3. 임베딩 및 카테고리 생성
   - Solar Pro 2와 Upstage Embed for Agent를 활용해 파일을 벡터 임베딩합니다.  
   - 임베딩 값을 기반으로 카테고리를 자동 추출하고, 계층적 트리 구조로 정리합니다.  
   - 최종 출력은 JSON 형식의 트리 구조로, 사용자는 파일 절대 경로를 통해 즉시 문서에 접근할 수 있습니다.  

4. 키워드 기반 검색
   파일 내용이 아닌 키워드나 주제만으로 원하는 문서를 검색할 수 있습니다. 예를 들어, "2023년 3분기 매출"이라는 키워드로 관련 파일을 필터링할 수 있습니다.

Empty space, drag to resize

⚙️ 핵심 기능

핵심 기능: 효율성과 정확성을 위한 기술 구현

1. 비동기 병렬 프로세스
   - 확장자별 파일을 Solar Pro 2와 Upstage Embed for Agent로 병렬 처리하여 분석 속도를 최적화합니다.  
   - 대용량 파일도 빠르게 임베딩 및 분류할 수 있습니다.  

2. 디렉토리 카테고리 자동 정렬 
   - 임베딩 결과를 바탕으로 Solar Pro 2가 카테고리를 추출하고, 트리 구조(JSON)로 시각화합니다.  
   - 사용자는 계층적 폴더 구조를 통해 직관적으로 파일을 탐색할 수 있습니다.  

3. 내용 기반 검색
   - 파일명이 아닌 문서 내용을 분석해 검색 결과를 제공합니다.  
   - "AI 기술 동향"과 같은 키워드로 관련 파일을 즉시 찾을 수 있습니다.
Empty space, drag to resize

👥 팀원 소개

- 김광원: 파일 읽기 및 병렬 처리 워크플로우 설계  
- 김호영: 임베딩 모델 설계 및 최적화  
- 박현식: UI 구현 및 웹훅 워크플로우 개발  

"싹싹파일"은 Upstage의 최신 AI 기술을 활용해 파일 관리 문제를 혁신적으로 해결한 사례입니다. 앞으로도 지속적인 업데이트를 통해 사용자 경험을 개선할 예정입니다.
Empty space, drag to resize

💾 참고 자료