Add 3-verdict system (PASS/FAIL/ESCALATE) with priority handling across simple and phased pipelines. Senior reviewers can now escalate issues requiring human intervention, immediately breaking the review loop. - ESCALATE verdict extraction with highest priority over PASS/FAIL - Issue Tracker tables (ISS-NNN) carried across iterations - Auto-escalate heuristic using (file, keyword) composite fingerprints - Report restructuring: executive view first (verdict → tracker → metrics) - Onboarding: `doctor`, `demo`, `init --guided` commands - Exit codes: PASS=0, FAIL=1, ESCALATE=2 - 87 tests passing (54 config + 25 onboarding + 8 integration) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
3.3 KiB
3.3 KiB
cross-eval
AI 에이전트 간 교차 검증을 자동화하는 CLI 도구.
기획서와 체크리스트를 기반으로 "코딩 → 리뷰 → 피드백 → 재코딩" 루프를 자동으로 돌려서, 과최적화 / 오탐 / 누락 문제를 잡아냅니다.
설치
# 1. 저장소 클론
git clone <repository-url>
cd cross-eval
# 2. 설치 (editable 모드 — 코드 수정 시 재설치 불필요)
pip3 install -e .
설치 후 터미널 어디서든 cross-eval 명령어를 사용할 수 있습니다.
cross-eval --version
요구사항
- Python 3.9+
- Claude CLI 설치 및 인증 완료
사용법
1. 프로젝트 초기화
cd my-project
cross-eval init
.cross-eval/ 폴더 안에 config.yaml, plan-sample.md, checklist-sample.md가 생성됩니다.
2. 기획서 작성
샘플 파일을 복사하여 기획서와 체크리스트를 작성합니다.
cp .cross-eval/plan-sample.md .cross-eval/plan.md
cp .cross-eval/checklist-sample.md .cross-eval/checklist.md
# plan.md, checklist.md 편집
3. 실행
# 기본 실행 (코딩 → 리뷰, 최대 3회 반복)
cross-eval run
# 프롬프트만 확인 (에이전트 호출 없이, 비용 절약)
cross-eval run --dry-run
# 최대 반복 횟수 변경
cross-eval run --max-iter 5
# 입력 파일 오버라이드
cross-eval run --input plan=./docs/spec.md
# 설정 파일 지정
cross-eval run --config .cross-eval/config.yaml
4. 결과 확인
output/
├── v1/
│ ├── coding.md # 에이전트 코딩 결과
│ └── review.md # 에이전트 리뷰 결과
├── v2/
│ ├── coding.md
│ └── review.md
└── final-report.md # 전체 요약 리포트
설정 (.cross-eval/config.yaml)
output_dir: output
max_iterations: 3
language: ko # ko 또는 en (프롬프트 템플릿 언어)
inputs:
plan: plan.md # config.yaml 기준 상대경로
checklist: checklist.md
agents:
coder:
command: claude
args: ["-p", "--model", "sonnet", "--permission-mode", "auto"]
system_prompt: "You are a senior software engineer."
reviewer:
command: claude
args: ["-p", "--model", "opus", "--permission-mode", "plan"]
system_prompt: "You are a meticulous code reviewer."
pipeline: preset:simple
실행 중에 config.yaml을 수정하면 다음 반복부터 자동으로 반영됩니다.
파이프라인 프리셋
| 프리셋 | 설명 |
|---|---|
simple |
Agent A가 코딩, Agent B가 리뷰 (기본값) |
cross-review |
둘 다 코딩, 서로 교차 리뷰 |
plan-review |
구현 전 기획서/체크리스트/참고문서를 검토하고 필요시 현재 코드베이스와의 정합성도 확인 |
review-only |
기존 코드만 감사 용도로 검토 |
review-fix |
리뷰 결과를 취합한 뒤 자동 수정과 재검증까지 반복 |
coding-review-fix |
초기 코딩 1회 후 리뷰 결과를 취합해 자동 수정과 재검증을 반복 |
# 초기화 옵션
cross-eval init --preset cross-review # 교차 리뷰 프리셋
cross-eval init --preset plan-review # 구현 전 문서 검토 프리셋
cross-eval init --lang en # 영어 템플릿