chungyeong d5fcc258b7 fix: unset CLAUDECODE env var to allow nested Claude subprocess calls
Claude Code refuses to launch inside another Claude Code session.
Strip the CLAUDECODE marker from the inherited environment so that
cross-eval can spawn Claude as a subprocess from within Claude Code.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-13 23:05:16 +09:00
2026-03-13 21:47:54 +09:00
2026-03-11 21:53:14 +09:00

cross-eval

AI 에이전트 간 교차 검증을 자동화하는 CLI 도구.

기획서와 체크리스트를 기반으로 "코딩 → 리뷰 → 피드백 → 재코딩" 루프를 자동으로 돌려서, 과최적화 / 오탐 / 누락 문제를 잡아냅니다.

설치

# 1. 저장소 클론
git clone <repository-url>
cd cross-eval

# 2. 설치 (editable 모드 — 코드 수정 시 재설치 불필요)
pip3 install -e .

설치 후 터미널 어디서든 cross-eval 명령어를 사용할 수 있습니다.

cross-eval --version

요구사항

사용법

1. 프로젝트 초기화

cd my-project
cross-eval init

.cross-eval/ 폴더 안에 config.yaml, plan-sample.md, checklist-sample.md가 생성됩니다.

2. 기획서 작성

샘플 파일을 복사하여 기획서와 체크리스트를 작성합니다.

cp .cross-eval/plan-sample.md .cross-eval/plan.md
cp .cross-eval/checklist-sample.md .cross-eval/checklist.md
# plan.md, checklist.md 편집

3. 실행

# 기본 실행 (코딩 → 리뷰, 최대 3회 반복)
cross-eval run

# 프롬프트만 확인 (에이전트 호출 없이, 비용 절약)
cross-eval run --dry-run

# 최대 반복 횟수 변경
cross-eval run --max-iter 5

# 입력 파일 오버라이드
cross-eval run --input plan=./docs/spec.md

# 설정 파일 지정
cross-eval run --config .cross-eval/config.yaml

4. 결과 확인

output/
├── v1/
│   ├── coding.md      # 에이전트 코딩 결과
│   └── review.md      # 에이전트 리뷰 결과
├── v2/
│   ├── coding.md
│   └── review.md
└── final-report.md    # 전체 요약 리포트

설정 (.cross-eval/config.yaml)

output_dir: output
max_iterations: 3
language: ko              # ko 또는 en (프롬프트 템플릿 언어)

inputs:
  plan: plan.md           # config.yaml 기준 상대경로
  checklist: checklist.md

agents:
  coder:
    command: claude
    args: ["-p", "--model", "sonnet", "--permission-mode", "auto"]
    system_prompt: "You are a senior software engineer."
  reviewer:
    command: claude
    args: ["-p", "--model", "opus", "--permission-mode", "plan"]
    system_prompt: "You are a meticulous code reviewer."

pipeline: preset:simple

실행 중에 config.yaml을 수정하면 다음 반복부터 자동으로 반영됩니다.

파이프라인 프리셋

프리셋 설명
simple Agent A가 코딩, Agent B가 리뷰 (기본값)
cross-review 둘 다 코딩, 서로 교차 리뷰
plan-review 구현 전 기획서/체크리스트/참고문서를 검토하고 필요시 현재 코드베이스와의 정합성도 확인
review-only 기존 코드만 감사 용도로 검토
review-fix 리뷰 결과를 취합한 뒤 자동 수정과 재검증까지 반복
coding-review-fix 초기 코딩 1회 후 리뷰 결과를 취합해 자동 수정과 재검증을 반복
# 초기화 옵션
cross-eval init --preset cross-review   # 교차 리뷰 프리셋
cross-eval init --preset plan-review    # 구현 전 문서 검토 프리셋
cross-eval init --lang en               # 영어 템플릿
Description
No description provided
Readme 698 KiB
Languages
Python 100%