코딩 에이전트는 왜 런타임이 되는가
SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.
- AI Agent
- Coding Agent
- Agent Runtime
- SWE-bench
- Codex
- 개발 하네스
시리즈
공개 글 5개
SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.
Codex CLI의 persisted /goal 흐름을 기준으로 장시간 코딩 에이전트에 필요한 Goal Contract, Done Criteria, Stop Conditions 설계법을 정리합니다.
A2A Protocol v1.0과 MCP의 차이를 기준으로 Agent Card, Task, Artifact를 개발 하네스의 작업 위임과 산출물 계약으로 해석합니다.
GitHub Copilot Memory, Claude Code memory, 장기 기억 벤치마크를 기준으로 AI Memory와 RAG의 차이, Run Ledger, 실패 산출물, memory 승격 정책을 정리합니다.
Goal Runtime, A2A Task/Artifact, AI Memory, Run Ledger 개념을 실제 개발 하네스에 적용하기 위한 문서 템플릿 세트를 제공합니다.