seo-jinseok/regulation_manager/rag-quality-local
RAG 시스템의 포괄적인 품질 평가 시스템입니다. 6가지 사용자 페르소나를 시뮬레이션하는 서브에이전트(팀원)들이 병렬로 작동하여 150+개의 테스트 시나리오를 실행하고, LLM-as-Judge 방식으로 답변 정확도를 평가하며, 자동으로 개선 SPEC을 생성합니다. 사용 시나리오: - 다양한 사용자 유형(학생, 교수, 교직원, 유학생 등)으로 RAG 시스템 테스트 - 단일 턴, 다중 턴, 엣지 케이스, 시간적 쿼리 등 포괄적인 테스트 실행 - 정답 검증 및 정확도 메트릭 계산 (Precision, Recall, F1, Context Relevance) - 실패 패턴 분석 및 개선 권장사항 자동 생성 - 평가 결과 JSON 저장 및 추세 분석
Risk Score
0
out of 100
Popularity
0
Stars
0
Forks
Feb 13, 2026
Updated
CodeThreat AppSec
Full SAST + SCA agentic security analysis for MCP servers and Skills.