01. RFP 요구사항 분석 — 정책자금 신청서 자동 생성
출처: 중소벤처기업진흥공단「OPEN DATA 챌린지」정책자금 신청서 작성 설명회 자료(01_[설명회 자료] 정책자금 융자 신청서 자동 생성(중진공).pdf).
1. 출제 배경 / 정책 문제
| 구분 |
내용 |
| 대상 |
정책자금 신청기업 |
| 빈도 |
연간 약 20,000건 (최근 3개년 평균) |
| 문제 ① 작성 시간 |
사업계획서 1건 완성 평균 3시간, 전담인력 없는 소규모 기업 경영 공백 |
| 문제 ② 외부 비용 |
컨설팅·대행 업체 활용 비용 발생, 영세기업 정책자금 접근성 저하 |
| 문제 ③ 내부 부담 |
공단 심사 담당자의 보완 요청·안내 업무 비중 증가 |
| 정책 목표 |
① 신청 편의 제고(공공 AX 전환) ② 제3자 부당 개입(대행) 차단 |
2. 과제 정의 (AI 기반 사업계획서 자동 생성)
2.1 핵심 과제
- AI 기반 사업계획서 자동 생성 — 민간 LLM 연계 · 핵심 키워드 기반 기업 맞춤형 초안 자동 생성
- 자금별 유형 반영 맞춤형 분류체계 설계 (예: 창업기반지원자금, 혁신성장지원자금)
- RAG 파이프라인 + 프롬프트 엔지니어링 → 공고문·서식 기반 문구 생성 및 할루시네이션 최소화
- 서식 출력 — 융자신청서 원본 레이아웃 유지·다운로드
- 서식 개정 시 재학습 없이 프롬프트 수정만으로 즉시 반영되는 운영체계
2.2 공단이 명시한 기술 고려사항(웹폼 입력 방식)
민간 LLM API 연계 / 오픈소스 LLM 구축 · 토큰·클라우드 비용 · 개인정보 · 보안 · 인증 · 프롬프트 · RAG · 답변 퀄리티 · 트래픽 · 할루시네이션 · 국내 공공 클라우드
3. PoC 정량 목표 및 검증 기준
| 구분 |
성능 목표 |
검증 방법 |
| 초안 생성 시간 |
키워드 입력 후 30초 이내 (첫 응답 5초 이내) |
오픈 전 단일·동시 부하 테스트 |
| 작성 소요 시간 |
기존 대비 70% 이상 단축 |
— |
| 생성 초안 적합도 |
전문가 평균 기준 80% 이상 |
발주기관 참여 실사용 테스트 |
| 동시 사용자 |
50인 이상 지연 없이 처리 |
부하 테스트(미달 시 튜닝 후 재실시), Queue 방식 |
| 가용률 |
연간 99.5% 이상 |
SLA 기반 장애 이력 모니터링 |
| 결함 기준 |
Critical/High 0건 상태 오픈 |
UAT(인수 테스트) |
4. PoC 결과물 정의
| 구분 |
내용 |
| 유형 |
정책자금 융자신청서 초안 자동 생성 AI 기반 반응형 웹 서비스 |
| 기술 |
민간 LLM + RAG 파이프라인 + 프롬프트 엔지니어링 |
| 인프라 |
CSAP 인증 IaaS/PaaS 외부망 독립 구축 (CPU 기반) |
| 연동 |
공단 고객 포털 SSO 로그인 및 HWP·PDF 서식 다운로드 |
| 구현 범위 |
전 유형 서식 대응 · SSO · 웹 에디터 · HWP/PDF · 반응형 웹(PC·태블릿·모바일) · KWCAG 2.2 준수 |
5. 핵심 기능 명세 (공단 요구)
| 기능 구분 |
요구사항 |
주요 내용 |
| 로그인·정보 연동 |
SSO 연동 |
고객 포털 재인증 없이 접근, 기업 기본정보 자동 연동 |
| 서식 유형 분류 |
자금종류별 신청서 서식 자동 분류 |
신청서 서식에 따른 작성 항목 상이 |
| AI 초안 생성 |
유형별 맞춤형 LLM 초안 자동 생성 |
유형별 프롬프트 + RAG 컨텍스트 → 항목별 초안 스트리밍 생성 |
| 입력 도우미 |
업종별 추천 키워드·툴팁 |
추천 키워드 태그·자동완성·필수 항목 경고 |
| 초안 수정 |
웹 에디터 인라인 편집 |
항목별 독립 편집·재생성(5회/항목 제한)·임시저장·미리보기 |
| 서식 다운로드 |
HWP·PDF 원본 다운로드 |
원본 표·폰트·여백 완전 보존 변환, 다운로드 후 임시 데이터 삭제 |
| Fallback 처리 |
LLM 장애 대응 자동 전환 |
주 타임아웃(30초) 시 대체 자동 전환, 전체 장애 시 수동 모드 |
| 관리자 대시보드 |
비용·장애·피드백 통합 모니터링 |
토큰 소비·비용 실시간 조회, 예산 80%·100% 초과 시 자동 알림·차단 |
사용자 이용 시나리오
로그인(SSO) → 키워드 입력(5~10개) → AI 초안 생성(첫 응답 5초 미만) → 초안 수정·보완(항목별 최대 5회 재생성) → 미리보기·HWP/PDF 다운로드(서버 임시 데이터 즉시 삭제) → 피드백 제출
6. 제공 데이터 및 처리 흐름
처리 파이프라인: 입력 → 파싱·정제·벡터화 → 벡터 DB + RAG 검색 → 유형별 프롬프트 → LLM 호출 + Fallback → 안전 필터·면책 문구 → 출력
| # |
제공 데이터 |
형식 |
활용 목적 |
| 1 |
정책자금 공고문 |
HWP·PDF |
RAG 지식베이스 구축 / 프롬프트 설계 |
| 2 |
융자신청서 서식 |
HWP·PDF·DOCX |
서식 매칭 테이블 구축 / 변환 다운로드 |
| 3 |
사업계획서 예시 (제조업/비제조업, 유형별 3~5건) |
HWP·PDF |
Few-Shot 프롬프트 예시 / RAG 품질 향상 |
| 4 |
가이드라인·메뉴얼 |
HWP·PDF·텍스트 |
프롬프트 설계 / 툴팁 가이드 |
| 5 |
기업 기본정보 |
DB 연동(SSO) |
유형 자동 분류 (기업명·업종·규모·매출·종업원수 등) |
7. 개인정보·보안 요구
| 요구 |
내용 |
| 식별정보 마스킹 |
기업명·사업자등록번호 등 LLM 호출 시 마스킹 후 전송 |
| Zero Data Retention |
LLM 제공사와 DPA 체결 및 '데이터 비저장·비학습 확약서' 제출 |
| Secure Delete |
다운로드 완료/미완료 데이터 즉시 시큐어 삭제 / 7일 후 자동 영구 삭제 |
| 처리 기록 |
개인정보 처리 활동 기록 3년 보존 |
| 감사 로그 |
운영 DB와 물리·논리적 분리 관리 |
| 학습 데이터 |
별도 Fine-Tuning 불필요 (RAG + Few-Shot으로 충족) |
8. 명시된 현재 한계(공단 인지)
- Fine-Tuning 없는 프롬프트 기반 구현으로 초특화 품질 제약
- 생성물 최종 검토 책임은 신청 기업
- LLM API 귀책 장애 시 생성 품질 일시 저하 가능
- 트래픽 집중 시 Queue 대기 안내