코딩 에이전트는 왜 런타임이 되는가
SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.
- AI Agent
- Coding Agent
- Agent Runtime
- SWE-bench
- Codex
- 개발 하네스
카테고리
공개 글 20개
SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.
Codex CLI의 persisted /goal 흐름을 기준으로 장시간 코딩 에이전트에 필요한 Goal Contract, Done Criteria, Stop Conditions 설계법을 정리합니다.
A2A Protocol v1.0과 MCP의 차이를 기준으로 Agent Card, Task, Artifact를 개발 하네스의 작업 위임과 산출물 계약으로 해석합니다.
GitHub Copilot Memory, Claude Code memory, 장기 기억 벤치마크를 기준으로 AI Memory와 RAG의 차이, Run Ledger, 실패 산출물, memory 승격 정책을 정리합니다.
Goal Runtime, A2A Task/Artifact, AI Memory, Run Ledger 개념을 실제 개발 하네스에 적용하기 위한 문서 템플릿 세트를 제공합니다.
Codex CLI 0.128.0에 추가된 /goal 기능을 사용법, /plan·/resume과의 차이, 실무 적용 시나리오, 비용·보안 리스크 관점에서 정리합니다.
Codex CLI /goal 기능을 state DB, app server API, model tools, core runtime, continuation prompt 관점에서 코드 레벨로 분석합니다.
AI Agent에 온톨로지와 지식그래프가 언제 필요한지 정리합니다. 개인·팀 자동화와 조직 단위 자동화의 차이, RAG의 한계, 의미 불일치 문제를 실무 관점에서 설명합니다.
온톨로지, 지식그래프, RAG, GraphRAG, SHACL, SPARQL의 역할을 AI Agent 자동화 관점에서 정리합니다. 조직 지식 검색과 검증 아키텍처를 실무적으로 설명합니다.
팀 단위 AI 워크플로우를 조직 단위 AI 운영체계로 확장하는 전략을 정리합니다. 최소 온톨로지, 업무 지식그래프, 검증 규칙, 운영 거버넌스 도입 순서를 설명합니다.
Claude Code CLI 스냅샷을 runtime 관점으로 분석해 AI agent가 모델 호출이 아니라 입력, 도구, 권한, 기록 루프의 조합임을 설명합니다.
Claude Code CLI 분석을 바탕으로 agent runtime의 bootstrap 단계가 설정, 정책, 인증, 실행 모드를 어떻게 정리해야 하는지 설명합니다.
Claude Code CLI 분석을 통해 터미널 화면이 단순 출력 UI가 아니라 메시지, 입력, 승인, 실행 상태를 묶는 runtime shell임을 설명합니다.
Claude Code CLI 분석을 바탕으로 사용자의 한 줄 입력이 즉시 명령, 큐 항목, 모델 질의 중 하나로 분기되는 submit boundary를 설명합니다.
Claude Code CLI 분석에서 추출한 입력 정규화 패턴을 바탕으로 raw input, 첨부, command, hook을 model visible message로 바꾸는 방법을 설명합니다.
Claude Code CLI 분석을 바탕으로 slash command를 prompt 생성, local 실행, interactive UI, forked execution으로 나누는 runtime dispatch 패턴을 설명합니다.
Claude Code CLI 분석을 기반으로 agent query loop를 streaming model call, tool request, result injection이 반복되는 상태 기계로 설명합니다.
Claude Code CLI 분석을 바탕으로 model provider API 요청, streaming 응답, tool schema, usage/cost 처리를 runtime boundary로 분리하는 방법을 설명합니다.
Claude Code CLI 분석을 바탕으로 AI agent tool runtime을 capability registry, schema validation, permission gate, 실행 오케스트레이션으로 설명합니다.
Claude Code CLI 분석을 바탕으로 AI agent의 permission gate, transcript recording, usage/cost accounting을 제품 안정성의 핵심 계층으로 정리합니다.