메뉴

글

전체 공개 글

공개된 모든 글을 최신순으로 둘러봅니다.

AI Agent

AI 시대의 소프트웨어 엔지니어링: '이해의 병목' 극복을 위한 시스템 구현 전략

AI 에이전트가 코드를 자동 생성하는 시대, 개발의 새로운 제약으로 부상한 '이해의 병목'을 극복하기 위해 서술식 디프(Literate Diffs), 일회성 UI, MCP 공유 공간 등 구체적인 기술 아키텍처와 구현 전략을 제시합니다.

2026-07-16 · 8분 읽기

AI Agent

GPT-5.6 최적화 가이드: 7월 10일 공개 후 확인할 8가지

GPT-5.6 Sol·Terra·Luna의 가격과 사양, reasoning, 프롬프트 다이어트, 멀티에이전트, PTC, 캐시, 권한 경계를 공식 문서 기준으로 정리합니다.

2026-07-10 · 8분 읽기

AI Backend

RAG가 데모에서 망가지는 지점: 실제 문서, 토큰 예산, 프롬프트 인젝션

샘플 문서로 만든 RAG 흐름을 PDF, 웹 문서, Markdown 분할, token budget, prompt injection risk가 있는 운영 환경으로 옮길 때 확인할 경계를 정리합니다.

2026-07-09 · 7분 읽기

AI Backend

RAG 답변을 믿기 전에 봐야 할 것: 검색 평가, faithfulness, 출처 표시

RAG 답변이 그럴듯해 보여도 retriever 결과, answer faithfulness, citation, source attribution을 따로 확인해야 하는 이유와 점검 흐름을 정리합니다.

2026-07-08 · 7분 읽기

AI Backend

LangChain RAG 복습 04: 문서 구조를 살리는 검색 설계

LangChain RAG 학습 흐름을 따라 hybrid search, parent document retrieval, multi-vector retrieval로 검색 단위와 답변 단위를 분리하는 방법을 정리합니다.

2026-07-04 · 7분 읽기

AI Backend

LangChain RAG 복습 03: 검색 품질을 높이는 retriever 전략

LangChain RAG 학습 흐름을 따라 retriever 결과가 애매할 때 metadata filter, multi query retrieval, context compression, reranking으로 검색 품질을 점검하는 과정을 정리합니다.

2026-07-01 · 7분 읽기

AI Backend

LangChain RAG 복습 02: 검색기부터 프롬프트 체인까지

LangChain RAG 학습 흐름을 따라 chunk가 retriever 결과가 되고 prompt context와 chain 입력으로 이어지는 과정을 정리합니다.

2026-06-27 · 6분 읽기

AI Backend

LangChain RAG 복습 01: 문서 로딩부터 chunk까지

LangChain RAG 학습 흐름을 따라 예시 문서가 Document가 되고 검색 가능한 chunk로 나뉘는 과정을 정리합니다.

2026-06-24 · 6분 읽기

AI Agent

한국·미국 주식 인사이트 GPT 소개: 뉴스보다 먼저 확인 질문을 정리하는 도구

한국과 미국 주식 시장을 볼 때 종목명보다 먼저 확인해야 할 출처, 맥락, 리스크 질문을 정리하는 커스텀 GPT 사용법을 소개합니다.

2026-06-23 · 6분 읽기

Workflow

AI 코딩 작업이 끝났다는 증거를 남기는 법: Moonshot Relay 워크플로우

Claude Code와 Codex 작업에서 계획, 실행, 검증, 기록을 하나의 흐름으로 묶어 끝났다고 말할 근거를 남기는 Moonshot Relay 구조를 정리합니다.

2026-06-23 · 7분 읽기

Workflow

사내 AI 에이전트 온보딩 가이드 만드는 법

사내에서 AI 에이전트를 적극적으로 사용하도록 만들기 위한 AX 온보딩 가이드 설계 방법을 정리합니다. 사용 사례, 보안 기준, 권한 관리, 4주 온보딩 프로그램, 실전 템플릿까지 다룹니다.

2026-05-14 · 12분 읽기

AI Backend

LLM 서비스를 PoC에서 프로덕션으로 끌어올리는 백엔드 로드맵

LLM 서비스를 PoC 수준에서 운영 가능한 백엔드 시스템으로 고도화하기 위한 학습 순서를 API, 캐시, 큐, RAG, Evals, Observability 관점으로 정리합니다.

2026-05-12 · 6분 읽기

AI Backend

LLM보다 백엔드 기본기가 먼저인 이유

LLM 서비스 개발에서 프롬프트와 프레임워크보다 API 계약, 데이터 모델, 캐시, 큐, 로그, 장애 대응 같은 백엔드 기본기가 먼저 필요한 이유를 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

운영 가능한 API 설계

LLM 백엔드에서 운영 가능한 API를 만들기 위해 성공 응답보다 실패 응답, trace ID, idempotency, rate limit, health check를 먼저 설계하는 방법을 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

Redis Cache Aside로 LLM 응답 캐시 설계하기

LLM 서비스에서 Redis Cache Aside 패턴을 이용해 응답 비용과 지연을 줄이는 방법을 cache key, TTL, 개인정보, cache stampede 관점으로 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

Queue와 Idempotency

문서 색인, embedding 생성, 대량 요약처럼 오래 걸리는 AI 작업을 큐로 분리하고 idempotency key, retry, DLQ로 안정화하는 방법을 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

Structured Outputs 실전

LLM 응답을 자유 텍스트가 아니라 JSON Schema 기반 API 계약으로 다루기 위해 Structured Outputs, validation, schema version, fallback을 설계하는 방법을 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

Function Calling 설계

LLM이 내부 API를 호출하도록 만들 때 Function Calling을 어떻게 설계해야 하는지 tool boundary, 권한, 검증, 감사 로그, human approval 관점으로 정리합니다.

2026-05-12 · 6분 읽기

AI Backend

Prompt Caching과 Token Budget

LLM 서비스의 비용과 응답 지연을 줄이기 위해 Prompt Caching, token budget, prompt layout, usage metric을 어떻게 설계해야 하는지 정리합니다.

2026-05-12 · 6분 읽기

AI Backend

RAG 논문 백엔드 관점으로 읽기

Retrieval Augmented Generation 논문을 백엔드 개발자 관점에서 읽고, parametric memory, non parametric memory, retriever, generator를 서비스 아키텍처로 해석합니다.

2026-05-12 · 5분 읽기

AI Backend

pgvector RAG가 운영에서 버티려면: chunk, metadata filter, citation 설계

PostgreSQL pgvector로 문서형 RAG를 만들 때 chunk와 embedding 저장, metadata filter, vector similarity query, citation 연결을 운영 관점에서 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

LLM Evals 입문

LLM 서비스에서 일반 테스트로 잡기 어려운 답변 품질을 Evals, golden set, grader, regression test로 측정하고 배포 기준으로 연결하는 방법을 정리합니다.

2026-05-12 · 5분 읽기

AI Backend

OpenTelemetry로 LLM 요청 Trace 연결하기

LLM 서비스에서 OpenTelemetry를 사용해 API 요청, retrieval, LLM 호출, validation, DB 저장을 하나의 trace로 연결하고 지연과 실패 원인을 분석하는 방법을 정리합니다.

2026-05-12 · 6분 읽기

Workflow

AI 시대의 개발자는 무엇을 설계해야 할까

AI 코딩 도구가 실무에 들어오면서 개발자가 새롭게 설계해야 할 컨텍스트, 도구, 권한, 검증, 추적 구조를 정리합니다.

2026-05-11 · 8분 읽기

Workflow

AI 코딩 도구를 잘 쓰는 팀은 프롬프트가 아니라 작업 계약서를 만든다

AI 코딩 도구를 팀 개발에 적용하기 위해 필요한 AI_GUIDE, TASK_CONTRACT, AI_WORK_LOG, VERIFY_REPORT, PR_TEMPLATE 작성법을 정리합니다.

2026-05-11 · 6분 읽기

Workflow

MCP와 A2A 이후, 개발 환경은 IDE가 아니라 Agent Runtime이 된다

MCP와 A2A가 AI 개발 환경을 어떻게 바꾸는지, IDE 중심 개발에서 Agent Runtime 중심 개발로 이동하는 흐름을 정리합니다.

2026-05-11 · 8분 읽기

Workflow

Ctx2Skill을 개발 하네스에 적용해보니

Ctx2Skill 논문의 self-play와 Cross-Time Replay 아이디어를 AI 코딩 에이전트 하네스의 AWTL, RSME, MemoryGraph 승격 구조로 적용해 봅니다.

2026-05-08 · 8분 읽기

Workflow

MemoryGraph는 자동 저장소가 아니다

AI 코딩 에이전트의 장기 기억을 raw trace가 아니라 replay와 human approval을 통과한 compact rule로 운영해야 하는 이유를 정리합니다.

2026-05-08 · 5분 읽기

Workflow

AWTL: 실패 로그를 다음 실행 힌트로 바꾸기

Agent Work Trace Logging으로 action, judge result, failure attribution, failed turn case, replay scorecard를 연결해 실패를 재발 방지 힌트로 바꾸는 구조를 정리합니다.

2026-05-08 · 5분 읽기

AI Agent

코딩 에이전트는 왜 런타임이 되는가

SWE-bench, SWE-agent, Codex harness 흐름을 기준으로 AI 코딩 도구가 목표, 상태, 권한, 검증을 가진 개발 런타임으로 바뀌는 이유를 정리합니다.

2026-05-06 · 5분 읽기

AI Agent

Codex /goal로 보는 목표 기반 개발

Codex CLI의 persisted /goal 흐름을 기준으로 장시간 코딩 에이전트에 필요한 Goal Contract, Done Criteria, Stop Conditions 설계법을 정리합니다.

2026-05-06 · 5분 읽기

AI Agent

A2A와 MCP로 보는 멀티 에이전트 개발 워크플로우

A2A Protocol v1.0과 MCP의 차이를 기준으로 Agent Card, Task, Artifact를 개발 하네스의 작업 위임과 산출물 계약으로 해석합니다.

2026-05-06 · 4분 읽기

AI Agent

AI Memory는 RAG가 아니다

GitHub Copilot Memory, Claude Code memory, 장기 기억 벤치마크를 기준으로 AI Memory와 RAG의 차이, Run Ledger, 실패 산출물, memory 승격 정책을 정리합니다.

2026-05-06 · 5분 읽기

AI Agent

AI 에이전트에게 일을 맡기기 전에 고정해야 할 문서 세트

AI 에이전트 작업을 안전하게 맡기기 위해 goal.md, run ledger, artifact contract, memory policy로 작업 경계와 산출물 기준을 고정하는 방법을 정리합니다.

2026-05-06 · 5분 읽기

AI Development

Karpathy microgpt.py 해부: GPT 학습과 추론이 한 파일에서 돌아가는 방식

Andrej Karpathy의 microgpt.py를 한 파일짜리 GPT 실행체로 해부합니다. 문자 tokenizer, scalar autograd, Q/K/V attention, Adam update, autoregressive sampling이 어떻게 연결되는지 설명합니다.

2026-05-05 · 15분 읽기

AI Development

Claude 프롬프트는 질문이 아니라 작업 명세서다

Claude를 안정적으로 쓰는 첫 번째 기준은 프롬프트를 “질문”이 아니라 작업 명세서로 작성하는 것입니다.

2026-05-02 · 5분 읽기

AI Development

XML 태그와 출력 형식으로 Claude 응답을 안정화하는 법

Claude 프롬프트가 길어질수록 가장 먼저 무너지는 것은 정보의 경계입니다. 지시문, 참고자료, 예시, 사용자 입력, 출력 형식이 한 덩어리로 섞이면 Claude가 어느 문장이 명령이고 어느 문장이 데이터인지 헷갈릴 수 있습니다.

2026-05-02 · 4분 읽기

AI Development

Claude Thinking, effort, Tool Use를 실무에서 다루는 법

Claude 최신 모델을 운영할 때 프롬프트 내용만큼 중요한 것이 추론 깊이와 도구 사용 정책입니다. 복잡한 작업에서는 더 깊은 thinking이 필요하지만, 모든 요청에 높은 effort를 쓰면 비용과 지연 시간이 커집니다. 반대로 도구 사용 조건이 느슨하면 모델이 필요 이상으로 검색하거나, 위험한 액션을 시도할 수 있습니다.

2026-05-02 · 5분 읽기

AI Development

바로 쓰는 Claude 프롬프트 템플릿과 실전 체크리스트

프롬프트 품질을 안정화하려면 개인의 감각에 맡기면 안 됩니다. 자주 하는 작업은 템플릿으로 만들고, 작업 전 체크리스트로 빠진 조건을 확인해야 합니다.

2026-05-02 · 5분 읽기

AI Agent

Codex CLI /goal 기능 정리

Codex CLI 0.128.0에 추가된 /goal 기능을 사용법, /plan·/resume과의 차이, 실무 적용 시나리오, 비용·보안 리스크 관점에서 정리합니다.

2026-05-02 · 9분 읽기

AI Agent

Codex CLI /goal 내부 구조 분석

Codex CLI /goal 기능을 state DB, app server API, model tools, core runtime, continuation prompt 관점에서 코드 레벨로 분석합니다.

2026-05-02 · 8분 읽기

AI Agent

AI Agent에 온톨로지와 지식그래프가 정말 필요할까?

AI Agent에 온톨로지와 지식그래프가 언제 필요한지 정리합니다. 개인·팀 자동화와 조직 단위 자동화의 차이, RAG의 한계, 의미 불일치 문제를 실무 관점에서 설명합니다.

2026-05-01 · 12분 읽기

AI Agent

온톨로지, 지식그래프, RAG, GraphRAG 차이 정리

온톨로지, 지식그래프, RAG, GraphRAG, SHACL, SPARQL의 역할을 AI Agent 자동화 관점에서 정리합니다. 조직 지식 검색과 검증 아키텍처를 실무적으로 설명합니다.

2026-05-01 · 13분 읽기

AI Agent

팀 AI 워크플로우를 조직 AI 운영체계로 확장하는 방법

팀 단위 AI 워크플로우를 조직 단위 AI 운영체계로 확장하는 전략을 정리합니다. 최소 온톨로지, 업무 지식그래프, 검증 규칙, 운영 거버넌스 도입 순서를 설명합니다.

2026-05-01 · 12분 읽기

AI Agent

Claude Code를 뜯어보니 Agent의 핵심은 Runtime이었다

Claude Code CLI 스냅샷을 runtime 관점으로 분석해 AI agent가 모델 호출이 아니라 입력, 도구, 권한, 기록 루프의 조합임을 설명합니다.

2026-04-30 · 5분 읽기

AI Agent

Claude Code CLI는 시작하자마자 무엇을 정리할까

Claude Code CLI 분석을 바탕으로 agent runtime의 bootstrap 단계가 설정, 정책, 인증, 실행 모드를 어떻게 정리해야 하는지 설명합니다.

2026-04-30 · 5분 읽기

AI Agent

Claude Code의 터미널 화면은 UI가 아니라 Runtime Shell이었다

Claude Code CLI 분석을 통해 터미널 화면이 단순 출력 UI가 아니라 메시지, 입력, 승인, 실행 상태를 묶는 runtime shell임을 설명합니다.

2026-04-30 · 5분 읽기

AI Agent

한 줄 프롬프트가 Agent Turn이 되기까지

Claude Code CLI 분석을 바탕으로 사용자의 한 줄 입력이 즉시 명령, 큐 항목, 모델 질의 중 하나로 분기되는 submit boundary를 설명합니다.

2026-04-30 · 5분 읽기

AI Agent

Raw Input을 Model Message로 바꾸는 입력 정규화 계층

Claude Code CLI 분석에서 추출한 입력 정규화 패턴을 바탕으로 raw input, 첨부, command, hook을 model visible message로 바꾸는 방법을 설명합니다.

2026-04-30 · 4분 읽기

AI Agent

Slash Command는 단축키가 아니라 Runtime Dispatch다

Claude Code CLI 분석을 바탕으로 slash command를 prompt 생성, local 실행, interactive UI, forked execution으로 나누는 runtime dispatch 패턴을 설명합니다.

2026-04-30 · 6분 읽기

AI Agent

Agent Loop는 모델 호출이 아니라 상태 기계다

Claude Code CLI 분석을 기반으로 agent query loop를 streaming model call, tool request, result injection이 반복되는 상태 기계로 설명합니다.

2026-04-30 · 6분 읽기

AI Agent

Provider API를 제품 로직에서 분리하는 법

Claude Code CLI 분석을 바탕으로 model provider API 요청, streaming 응답, tool schema, usage/cost 처리를 runtime boundary로 분리하는 방법을 설명합니다.

2026-04-30 · 6분 읽기

AI Agent

Tool Runtime은 함수 호출 목록이 아니다

Claude Code CLI 분석을 바탕으로 AI agent tool runtime을 capability registry, schema validation, permission gate, 실행 오케스트레이션으로 설명합니다.

2026-04-30 · 5분 읽기

AI Agent

권한, Transcript, 비용이 Agent 제품성을 결정한다

Claude Code CLI 분석을 바탕으로 AI agent의 permission gate, transcript recording, usage/cost accounting을 제품 안정성의 핵심 계층으로 정리합니다.

2026-04-30 · 5분 읽기

Workflow

Moonshot Phase Runner 구조 깊게 보기

Moonshot Phase Runner의 계획 디렉터리, 상태 파일, 실행 산출물, 검토 게이트를 통해 긴 AI 작업을 안정적으로 운영하는 방법을 정리합니다.

2026-04-29 · 6분 읽기

Workflow

AI 작업을 끝내는 법

복잡한 작업을 AI와 함께 진행할 때 계획, 실행, 확인, 기록을 단계별로 관리하는 방법을 쉽게 정리합니다.

2026-04-29 · 5분 읽기