전체 글
메뉴
Moonshot Notes orbit notebook mark
Moonshot NotesAI 도구와 개발 워크플로우 기록하는 공간

Posts

All Published Notes

Browse every published article in reverse chronological order.

Workflow · 2026-05-14 · 12분 읽기

사내 AI 에이전트 온보딩 가이드 만드는 법

사내에서 AI 에이전트를 적극적으로 사용하도록 만들기 위한 AX 온보딩 가이드 설계 방법을 정리합니다. 사용 사례, 보안 기준, 권한 관리, 4주 온보딩 프로그램, 실전 템플릿까지 다룹니다.

  • AI Agent
  • AX
  • AI Onboarding
  • AI Governance
  • Guardrails
  • Workflow

AI Backend · 2026-05-12 · 4분 읽기

LLM보다 백엔드 기본기가 먼저인 이유

LLM 서비스 개발에서 프롬프트와 프레임워크보다 API 계약, 데이터 모델, 캐시, 큐, 로그, 장애 대응 같은 백엔드 기본기가 먼저 필요한 이유를 정리합니다.

  • LLM
  • Backend
  • API
  • Cache
  • Queue

AI Backend · 2026-05-12 · 4분 읽기

운영 가능한 API 설계

LLM 백엔드에서 운영 가능한 API를 만들기 위해 성공 응답보다 실패 응답, trace ID, idempotency, rate limit, health check를 먼저 설계하는 방법을 정리합니다.

  • LLM
  • Backend
  • API Design
  • Trace ID
  • OpenAPI

AI Backend · 2026-05-12 · 4분 읽기

Redis Cache Aside로 LLM 응답 캐시 설계하기

LLM 서비스에서 Redis Cache Aside 패턴을 이용해 응답 비용과 지연을 줄이는 방법을 cache key, TTL, 개인정보, cache stampede 관점으로 정리합니다.

  • LLM
  • Backend
  • Redis
  • Cache
  • Cost Optimization

AI Backend · 2026-05-12 · 4분 읽기

Queue와 Idempotency

문서 색인, embedding 생성, 대량 요약처럼 오래 걸리는 AI 작업을 큐로 분리하고 idempotency key, retry, DLQ로 안정화하는 방법을 정리합니다.

  • LLM
  • Backend
  • Queue
  • Idempotency
  • Reliability

AI Backend · 2026-05-12 · 5분 읽기

Structured Outputs 실전

LLM 응답을 자유 텍스트가 아니라 JSON Schema 기반 API 계약으로 다루기 위해 Structured Outputs, validation, schema version, fallback을 설계하는 방법을 정리합니다.

  • LLM
  • Backend
  • Structured Outputs
  • JSON Schema
  • Validation

AI Backend · 2026-05-12 · 5분 읽기

Function Calling 설계

LLM이 내부 API를 호출하도록 만들 때 Function Calling을 어떻게 설계해야 하는지 tool boundary, 권한, 검증, 감사 로그, human approval 관점으로 정리합니다.

  • LLM
  • Backend
  • Function Calling
  • Tool Boundary
  • Security

AI Backend · 2026-05-12 · 5분 읽기

Prompt Caching과 Token Budget

LLM 서비스의 비용과 응답 지연을 줄이기 위해 Prompt Caching, token budget, prompt layout, usage metric을 어떻게 설계해야 하는지 정리합니다.

  • LLM
  • Backend
  • Prompt Caching
  • Token Budget
  • Cost Optimization

AI Backend · 2026-05-12 · 4분 읽기

RAG 논문 백엔드 관점으로 읽기

Retrieval Augmented Generation 논문을 백엔드 개발자 관점에서 읽고, parametric memory, non parametric memory, retriever, generator를 서비스 아키텍처로 해석합니다.

  • LLM
  • Backend
  • RAG
  • Paper Review
  • Retrieval

AI Backend · 2026-05-12 · 4분 읽기

pgvector로 사내 문서형 RAG 서비스 만들기

PostgreSQL의 pgvector 확장을 사용해 문서 chunk와 embedding을 저장하고, metadata filter와 vector similarity query로 문서형 RAG 서비스를 구현하는 방법을 정리합니다.

  • LLM
  • Backend
  • RAG
  • pgvector
  • PostgreSQL

AI Backend · 2026-05-12 · 4분 읽기

LLM Evals 입문

LLM 서비스에서 일반 테스트로 잡기 어려운 답변 품질을 Evals, golden set, grader, regression test로 측정하고 배포 기준으로 연결하는 방법을 정리합니다.

  • LLM
  • Backend
  • Evals
  • Quality
  • Regression Test

AI Backend · 2026-05-12 · 5분 읽기

OpenTelemetry로 LLM 요청 Trace 연결하기

LLM 서비스에서 OpenTelemetry를 사용해 API 요청, retrieval, LLM 호출, validation, DB 저장을 하나의 trace로 연결하고 지연과 실패 원인을 분석하는 방법을 정리합니다.

  • LLM
  • Backend
  • OpenTelemetry
  • Tracing
  • Observability

Workflow · 2026-05-11 · 8분 읽기

AI 시대의 개발자는 무엇을 설계해야 할까

AI 코딩 도구가 실무에 들어오면서 개발자가 새롭게 설계해야 할 컨텍스트, 도구, 권한, 검증, 추적 구조를 정리합니다.

  • AI Coding
  • Claude Code
  • MCP
  • AI Agent
  • Guardrails
  • Developer Workflow

Workflow · 2026-05-08 · 8분 읽기

Ctx2Skill을 개발 하네스에 적용해보니

Ctx2Skill 논문의 self-play와 Cross-Time Replay 아이디어를 AI 코딩 에이전트 하네스의 AWTL, RSME, MemoryGraph 승격 구조로 적용해 봅니다.

  • AI Agent
  • Coding Agent
  • Ctx2Skill
  • Developer Harness
  • MemoryGraph
  • AWTL
  • Workflow

Workflow · 2026-05-08 · 4분 읽기

MemoryGraph는 자동 저장소가 아니다

AI 코딩 에이전트의 장기 기억을 raw trace가 아니라 replay와 human approval을 통과한 compact rule로 운영해야 하는 이유를 정리합니다.

  • AI Agent
  • MemoryGraph
  • Developer Harness
  • Replay Gate
  • Ctx2Skill
  • AI Memory
  • Workflow

Workflow · 2026-05-08 · 5분 읽기

AWTL: 실패 로그를 다음 실행 힌트로 바꾸기

Agent Work Trace Logging으로 action, judge result, failure attribution, failed turn case, replay scorecard를 연결해 실패를 재발 방지 힌트로 바꾸는 구조를 정리합니다.

  • AI Agent
  • AWTL
  • Developer Harness
  • Failure Attribution
  • Replay Gate
  • MemoryGraph
  • Workflow

AI Agent · 2026-05-06 · 5분 읽기

코딩 에이전트는 왜 런타임이 되는가

SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.

  • AI Agent
  • Coding Agent
  • Agent Runtime
  • SWE-bench
  • Codex
  • 개발 하네스

AI Agent · 2026-05-06 · 4분 읽기

Codex /goal로 보는 목표 기반 개발

Codex CLI의 persisted /goal 흐름을 기준으로 장시간 코딩 에이전트에 필요한 Goal Contract, Done Criteria, Stop Conditions 설계법을 정리합니다.

  • Codex CLI
  • Goal Runtime
  • AI Agent
  • 개발 하네스
  • Done Criteria
  • Stop Conditions

AI Agent · 2026-05-06 · 4분 읽기

AI Memory는 RAG가 아니다

GitHub Copilot Memory, Claude Code memory, 장기 기억 벤치마크를 기준으로 AI Memory와 RAG의 차이, Run Ledger, 실패 산출물, memory 승격 정책을 정리합니다.

  • AI Memory
  • RAG
  • Run Ledger
  • Failure Artifact
  • GitHub Copilot
  • Claude Code

AI Development · 2026-05-02 · 4분 읽기

XML 태그와 출력 형식으로 Claude 응답을 안정화하는 법

Claude 프롬프트가 길어질수록 가장 먼저 무너지는 것은 정보의 경계입니다. 지시문, 참고자료, 예시, 사용자 입력, 출력 형식이 한 덩어리로 섞이면 Claude가 어느 문장이 명령이고 어느 문장이 데이터인지 헷갈릴 수 있습니다.

  • Claude
  • Prompt Engineering
  • XML
  • Claude API

AI Development · 2026-05-02 · 5분 읽기

Claude Thinking, effort, Tool Use를 실무에서 다루는 법

Claude 최신 모델을 운영할 때 프롬프트 내용만큼 중요한 것이 추론 깊이와 도구 사용 정책입니다. 복잡한 작업에서는 더 깊은 thinking이 필요하지만, 모든 요청에 높은 effort를 쓰면 비용과 지연 시간이 커집니다. 반대로 도구 사용 조건이 느슨하면 모델이 필요 이상으로 검색하거나, 위험한 액션을 시도할 수 있습니다.

  • Claude
  • AI Agent
  • Tool Use
  • Prompt Engineering

AI Development · 2026-05-02 · 3분 읽기

바로 쓰는 Claude 프롬프트 템플릿과 실전 체크리스트

프롬프트 품질을 안정화하려면 개인의 감각에 맡기면 안 됩니다. 자주 하는 작업은 템플릿으로 만들고, 작업 전 체크리스트로 빠진 조건을 확인해야 합니다.

  • Claude
  • Prompt Engineering
  • Developer Workflow
  • AI Agent

AI Agent · 2026-05-02 · 9분 읽기

Codex CLI /goal 기능 정리

Codex CLI 0.128.0에 추가된 /goal 기능을 사용법, /plan·/resume과의 차이, 실무 적용 시나리오, 비용·보안 리스크 관점에서 정리합니다.

  • Codex CLI
  • OpenAI Codex
  • Goal Mode
  • AI Agent
  • Workflow

AI Agent · 2026-05-02 · 8분 읽기

Codex CLI /goal 내부 구조 분석

Codex CLI /goal 기능을 state DB, app server API, model tools, core runtime, continuation prompt 관점에서 코드 레벨로 분석합니다.

  • Codex CLI
  • OpenAI Codex
  • Goal Runtime
  • AI Agent
  • Architecture
  • Rust

AI Agent · 2026-05-01 · 12분 읽기

AI Agent에 온톨로지와 지식그래프가 정말 필요할까?

AI Agent에 온톨로지와 지식그래프가 언제 필요한지 정리합니다. 개인·팀 자동화와 조직 단위 자동화의 차이, RAG의 한계, 의미 불일치 문제를 실무 관점에서 설명합니다.

  • AI Agent
  • 온톨로지
  • 지식그래프
  • RAG
  • 조직 자동화

AI Agent · 2026-05-01 · 13분 읽기

온톨로지, 지식그래프, RAG, GraphRAG 차이 정리

온톨로지, 지식그래프, RAG, GraphRAG, SHACL, SPARQL의 역할을 AI Agent 자동화 관점에서 정리합니다. 조직 지식 검색과 검증 아키텍처를 실무적으로 설명합니다.

  • AI Agent
  • 온톨로지
  • 지식그래프
  • RAG
  • GraphRAG

AI Agent · 2026-05-01 · 12분 읽기

팀 AI 워크플로우를 조직 AI 운영체계로 확장하는 방법

팀 단위 AI 워크플로우를 조직 단위 AI 운영체계로 확장하는 전략을 정리합니다. 최소 온톨로지, 업무 지식그래프, 검증 규칙, 운영 거버넌스 도입 순서를 설명합니다.

  • AI 운영체계
  • 온톨로지
  • 지식그래프
  • AI Agent
  • 조직 자동화

AI Agent · 2026-04-30 · 5분 읽기

한 줄 프롬프트가 Agent Turn이 되기까지

Claude Code CLI 분석을 바탕으로 사용자의 한 줄 입력이 즉시 명령, 큐 항목, 모델 질의 중 하나로 분기되는 submit boundary를 설명합니다.

  • Claude Code
  • AI Agent
  • Runtime
  • CLI

AI Agent · 2026-04-30 · 5분 읽기

Slash Command는 단축키가 아니라 Runtime Dispatch다

Claude Code CLI 분석을 바탕으로 slash command를 prompt 생성, local 실행, interactive UI, forked execution으로 나누는 runtime dispatch 패턴을 설명합니다.

  • Claude Code
  • AI Agent
  • Runtime
  • CLI

AI Agent · 2026-04-30 · 5분 읽기

Provider API를 제품 로직에서 분리하는 법

Claude Code CLI 분석을 바탕으로 model provider API 요청, streaming 응답, tool schema, usage/cost 처리를 runtime boundary로 분리하는 방법을 설명합니다.

  • Claude Code
  • AI Agent
  • Runtime
  • CLI

AI Agent · 2026-04-30 · 4분 읽기

Tool Runtime은 함수 호출 목록이 아니다

Claude Code CLI 분석을 바탕으로 AI agent tool runtime을 capability registry, schema validation, permission gate, 실행 오케스트레이션으로 설명합니다.

  • Claude Code
  • AI Agent
  • Runtime
  • CLI

Workflow · 2026-04-29 · 6분 읽기

Moonshot Phase Runner 구조 깊게 보기

Moonshot Phase Runner의 계획 디렉터리, 상태 파일, 실행 산출물, 검토 게이트를 통해 긴 AI 작업을 안정적으로 운영하는 방법을 정리합니다.

  • Phase Runner
  • Workflow
  • Automation
  • QA

Workflow · 2026-04-29 · 5분 읽기

AI 작업을 끝내는 법

복잡한 작업을 AI와 함께 진행할 때 계획, 실행, 확인, 기록을 단계별로 관리하는 방법을 쉽게 정리합니다.

  • AI
  • Workflow
  • Planning
  • QA