사내 AI 에이전트 온보딩 가이드 만드는 법
사내에서 AI 에이전트를 적극적으로 사용하도록 만들기 위한 AX 온보딩 가이드 설계 방법을 정리합니다. 사용 사례, 보안 기준, 권한 관리, 4주 온보딩 프로그램, 실전 템플릿까지 다룹니다.
- AI Agent
- AX
- AI Onboarding
- AI Governance
- Guardrails
- Workflow
Posts
Browse every published article in reverse chronological order.
사내에서 AI 에이전트를 적극적으로 사용하도록 만들기 위한 AX 온보딩 가이드 설계 방법을 정리합니다. 사용 사례, 보안 기준, 권한 관리, 4주 온보딩 프로그램, 실전 템플릿까지 다룹니다.
LLM 서비스를 PoC 수준에서 운영 가능한 백엔드 시스템으로 고도화하기 위한 학습 순서를 API, 캐시, 큐, RAG, Evals, Observability 관점으로 정리합니다.
LLM 서비스 개발에서 프롬프트와 프레임워크보다 API 계약, 데이터 모델, 캐시, 큐, 로그, 장애 대응 같은 백엔드 기본기가 먼저 필요한 이유를 정리합니다.
LLM 백엔드에서 운영 가능한 API를 만들기 위해 성공 응답보다 실패 응답, trace ID, idempotency, rate limit, health check를 먼저 설계하는 방법을 정리합니다.
LLM 서비스에서 Redis Cache Aside 패턴을 이용해 응답 비용과 지연을 줄이는 방법을 cache key, TTL, 개인정보, cache stampede 관점으로 정리합니다.
문서 색인, embedding 생성, 대량 요약처럼 오래 걸리는 AI 작업을 큐로 분리하고 idempotency key, retry, DLQ로 안정화하는 방법을 정리합니다.
LLM 응답을 자유 텍스트가 아니라 JSON Schema 기반 API 계약으로 다루기 위해 Structured Outputs, validation, schema version, fallback을 설계하는 방법을 정리합니다.
LLM이 내부 API를 호출하도록 만들 때 Function Calling을 어떻게 설계해야 하는지 tool boundary, 권한, 검증, 감사 로그, human approval 관점으로 정리합니다.
LLM 서비스의 비용과 응답 지연을 줄이기 위해 Prompt Caching, token budget, prompt layout, usage metric을 어떻게 설계해야 하는지 정리합니다.
Retrieval Augmented Generation 논문을 백엔드 개발자 관점에서 읽고, parametric memory, non parametric memory, retriever, generator를 서비스 아키텍처로 해석합니다.
PostgreSQL의 pgvector 확장을 사용해 문서 chunk와 embedding을 저장하고, metadata filter와 vector similarity query로 문서형 RAG 서비스를 구현하는 방법을 정리합니다.
LLM 서비스에서 일반 테스트로 잡기 어려운 답변 품질을 Evals, golden set, grader, regression test로 측정하고 배포 기준으로 연결하는 방법을 정리합니다.
LLM 서비스에서 OpenTelemetry를 사용해 API 요청, retrieval, LLM 호출, validation, DB 저장을 하나의 trace로 연결하고 지연과 실패 원인을 분석하는 방법을 정리합니다.
AI 코딩 도구가 실무에 들어오면서 개발자가 새롭게 설계해야 할 컨텍스트, 도구, 권한, 검증, 추적 구조를 정리합니다.
AI 코딩 도구를 팀 개발에 적용하기 위해 필요한 AI_GUIDE, TASK_CONTRACT, AI_WORK_LOG, VERIFY_REPORT, PR_TEMPLATE 작성법을 정리합니다.
MCP와 A2A가 AI 개발 환경을 어떻게 바꾸는지, IDE 중심 개발에서 Agent Runtime 중심 개발로 이동하는 흐름을 정리합니다.
Ctx2Skill 논문의 self-play와 Cross-Time Replay 아이디어를 AI 코딩 에이전트 하네스의 AWTL, RSME, MemoryGraph 승격 구조로 적용해 봅니다.
AI 코딩 에이전트의 장기 기억을 raw trace가 아니라 replay와 human approval을 통과한 compact rule로 운영해야 하는 이유를 정리합니다.
Agent Work Trace Logging으로 action, judge result, failure attribution, failed turn case, replay scorecard를 연결해 실패를 재발 방지 힌트로 바꾸는 구조를 정리합니다.
SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.
Codex CLI의 persisted /goal 흐름을 기준으로 장시간 코딩 에이전트에 필요한 Goal Contract, Done Criteria, Stop Conditions 설계법을 정리합니다.
A2A Protocol v1.0과 MCP의 차이를 기준으로 Agent Card, Task, Artifact를 개발 하네스의 작업 위임과 산출물 계약으로 해석합니다.
GitHub Copilot Memory, Claude Code memory, 장기 기억 벤치마크를 기준으로 AI Memory와 RAG의 차이, Run Ledger, 실패 산출물, memory 승격 정책을 정리합니다.
Goal Runtime, A2A Task/Artifact, AI Memory, Run Ledger 개념을 실제 개발 하네스에 적용하기 위한 문서 템플릿 세트를 제공합니다.
Andrej Karpathy의 microgpt.py를 한 파일짜리 GPT 실행체로 해부합니다. 문자 tokenizer, scalar autograd, Q/K/V attention, Adam update, autoregressive sampling이 어떻게 연결되는지 설명합니다.
Claude를 안정적으로 쓰는 첫 번째 기준은 프롬프트를 “질문”이 아니라 작업 명세서로 작성하는 것입니다.
Claude 프롬프트가 길어질수록 가장 먼저 무너지는 것은 정보의 경계입니다. 지시문, 참고자료, 예시, 사용자 입력, 출력 형식이 한 덩어리로 섞이면 Claude가 어느 문장이 명령이고 어느 문장이 데이터인지 헷갈릴 수 있습니다.
Claude 최신 모델을 운영할 때 프롬프트 내용만큼 중요한 것이 추론 깊이와 도구 사용 정책입니다. 복잡한 작업에서는 더 깊은 thinking이 필요하지만, 모든 요청에 높은 effort를 쓰면 비용과 지연 시간이 커집니다. 반대로 도구 사용 조건이 느슨하면 모델이 필요 이상으로 검색하거나, 위험한 액션을 시도할 수 있습니다.
프롬프트 품질을 안정화하려면 개인의 감각에 맡기면 안 됩니다. 자주 하는 작업은 템플릿으로 만들고, 작업 전 체크리스트로 빠진 조건을 확인해야 합니다.
Codex CLI 0.128.0에 추가된 /goal 기능을 사용법, /plan·/resume과의 차이, 실무 적용 시나리오, 비용·보안 리스크 관점에서 정리합니다.
Codex CLI /goal 기능을 state DB, app server API, model tools, core runtime, continuation prompt 관점에서 코드 레벨로 분석합니다.
AI Agent에 온톨로지와 지식그래프가 언제 필요한지 정리합니다. 개인·팀 자동화와 조직 단위 자동화의 차이, RAG의 한계, 의미 불일치 문제를 실무 관점에서 설명합니다.
온톨로지, 지식그래프, RAG, GraphRAG, SHACL, SPARQL의 역할을 AI Agent 자동화 관점에서 정리합니다. 조직 지식 검색과 검증 아키텍처를 실무적으로 설명합니다.
팀 단위 AI 워크플로우를 조직 단위 AI 운영체계로 확장하는 전략을 정리합니다. 최소 온톨로지, 업무 지식그래프, 검증 규칙, 운영 거버넌스 도입 순서를 설명합니다.
Claude Code CLI 스냅샷을 runtime 관점으로 분석해 AI agent가 모델 호출이 아니라 입력, 도구, 권한, 기록 루프의 조합임을 설명합니다.
Claude Code CLI 분석을 바탕으로 agent runtime의 bootstrap 단계가 설정, 정책, 인증, 실행 모드를 어떻게 정리해야 하는지 설명합니다.
Claude Code CLI 분석을 통해 터미널 화면이 단순 출력 UI가 아니라 메시지, 입력, 승인, 실행 상태를 묶는 runtime shell임을 설명합니다.
Claude Code CLI 분석을 바탕으로 사용자의 한 줄 입력이 즉시 명령, 큐 항목, 모델 질의 중 하나로 분기되는 submit boundary를 설명합니다.
Claude Code CLI 분석에서 추출한 입력 정규화 패턴을 바탕으로 raw input, 첨부, command, hook을 model visible message로 바꾸는 방법을 설명합니다.
Claude Code CLI 분석을 바탕으로 slash command를 prompt 생성, local 실행, interactive UI, forked execution으로 나누는 runtime dispatch 패턴을 설명합니다.
Claude Code CLI 분석을 기반으로 agent query loop를 streaming model call, tool request, result injection이 반복되는 상태 기계로 설명합니다.
Claude Code CLI 분석을 바탕으로 model provider API 요청, streaming 응답, tool schema, usage/cost 처리를 runtime boundary로 분리하는 방법을 설명합니다.
Claude Code CLI 분석을 바탕으로 AI agent tool runtime을 capability registry, schema validation, permission gate, 실행 오케스트레이션으로 설명합니다.
Claude Code CLI 분석을 바탕으로 AI agent의 permission gate, transcript recording, usage/cost accounting을 제품 안정성의 핵심 계층으로 정리합니다.
Moonshot Phase Runner의 계획 디렉터리, 상태 파일, 실행 산출물, 검토 게이트를 통해 긴 AI 작업을 안정적으로 운영하는 방법을 정리합니다.
복잡한 작업을 AI와 함께 진행할 때 계획, 실행, 확인, 기록을 단계별로 관리하는 방법을 쉽게 정리합니다.