페르소나 에이전트 시뮬레이션과 다층 검증 파이프라인 기반 서비스 콘텐츠 생성

— Direct LLM의 한계를 극복하는 Fact-Render 분리 접근 —

A Persona-Agent Simulation and Multi-Layer Validation Pipeline for Service Content Generation: A Fact-Render Separation Approach to Overcoming the Limits of Direct LLM Generation

서진규*, 김동현*, 이성찬*, 정주원*, 황호찬*, 권준희**


요약

커뮤니티 기반 플랫폼은 서비스 초기 단계에서 사용자, 콘텐츠, 상호작용 이력이 부족한 콜드스타트 문제에 직면한다. 최근에는 LLM을 이용해 초기 콘텐츠를 직접 생성하는 접근(Direct LLM 생성)이 시도되고 있으나, 이 방식은 존재하지 않는 지역·시설에 대한 환각, 동일 대상에 대한 콘텐츠 간 비정합, 실제 지역 특성을 반영하지 못하는 맥락 결여, 그리고 유사 패턴의 반복으로 인한 다양성 부족이라는 구조적 한계를 가진다. 본 논문에서는 이러한 한계를 극복하기 위해 사실(fact)의 결정과 자연어 렌더링을 분리하고, 여기에 상태를 가진 페르소나 에이전트 시뮬레이션6-layer 검증 파이프라인을 결합한 콘텐츠 생성 구조를 제안한다. 지역 POI(Point of Interest) 데이터로부터 산출된 지역 친화도가 페르소나 에이전트의 행동을 앵커링하고, 시뮬레이션이 생성한 구조화된 이벤트 로그가 LLM 프롬프트의 사실 토대를 제공한다. 생성된 콘텐츠는 스키마, 규칙, 스팟 단위 정합성, 샘플링 기반 critic, 다양성 검사를 거쳐 최종 점수화되며, 임계치 미만 시 재생성된다. 제안 구조는 크라우드펀딩형 취미 공유 플랫폼에 적용되었으며, 본 논문에서는 각 계층의 설계 원칙과 수식을 구체화한다.

Key words: synthetic content generation, persona-agent simulation, LLM validation pipeline, fact-render separation, cold-start


Ⅰ. 서 론

LLM의 발전은 서비스 초기 단계의 콘텐츠 부재 문제를 "LLM으로 일단 뽑아보자"는 단순한 접근으로 유도하고 있다. 실제로 Direct LLM 생성은 프롬프트만 설계하면 수천 건의 피드·리뷰·소개글을 즉시 확보할 수 있다는 장점이 있다. 그러나 실제 서비스에 적용 가능한 수준의 품질을 확보하려 할 때 다음 네 가지 한계가 반복적으로 관찰된다.

첫째, **환각(hallucination)**이다. 존재하지 않는 지역명, 실제로 없는 상호, 지리적으로 불가능한 조합이 생성된다. 둘째, 콘텐츠 간 비정합성이다. 동일 대상에 대한 피드 미리보기, 상세 페이지, 안내 메시지, 리뷰가 인원·금액·카테고리·시간에서 서로 모순되는 값을 가진다. 셋째, 지역 맥락 결여이다. 해당 지역의 실제 상권, 시설 밀도, 활동 적합도를 반영하지 못한 채 평균적인 도시의 모습만 반복된다. 넷째, 다양성 부족이다. 동일 카테고리에서 유사한 문장 구조와 표현 패턴이 반복되어, 다량 생성 시 템플릿화된 느낌이 두드러진다.

본 논문은 이러한 한계가 "LLM에 사실 결정과 자연어 생성을 동시에 맡긴 구조" 자체에서 기인한다고 보고, 두 역할을 명시적으로 분리한 콘텐츠 생성 파이프라인을 제안한다. 제안 구조의 기여는 다음 세 가지이다.

제안 구조는 크라우드펀딩형 취미 공유 플랫폼에 적용되었으며, 이를 응용 사례로 기술한다.


Ⅱ. 본 론

Ⅱ-1. 전체 시스템 구조