라벨이 프롬프트 캐싱인 게시물 표시

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

Claude Code의 Cache Write, AI 가성비의 열쇠

프롬프트 캐싱: Claude Code의 'Cache Write'부터 2026년 AI 가성비 엔지니어링까지 2026년 5월 12일 · 분석 리포트 · AI Engineering 💡 Claude Code 상태 화면의 'Cache Write' 한 줄은 단순한 통계가 아닙니다. 본 보고서는 이 항목의 기술적 실체에서 출발해, LLM 프롬프트 캐싱의 작동 원리, 사용자 제어 가능성, 활용 사례, 토큰 효율화 전략, 그리고 2026년 AI 엔지니어들이 추구하는 가성비·퍼포먼스 최적화 트렌드와 보안 리스크 까지를 통합적으로 분석합니다. 1. 질문의 출발점: 'Cache Write'는 무엇인가 Claude Code의 /status 또는 사용량 화면에서는 모델별로 Input · Output · Cache Read · Cache Write 토큰이 분리되어 표기됩니다. 여기서 말하는 '캐시'는 일반적인 웹 캐시(브라우저·CDN)나 RAG의 벡터 캐시와는 다른, 모델 추론 내부의 KV 캐시(Key-Value Cache)를 서버에 영속적으로 보관하는 메커니즘 을 지칭합니다. LLM은 입력 토큰들 사이의 의미적 연관성을 Attention 연산으로 계산하는데, 이 중간 계산 결과(Key/Value 행렬)를 매 요청마다 다시 계산하지 않고 디스크·메모리에 'Write'해 두었다가, 동일한 접두사(prefix)가 다시 들어오면 'Read'로 복원합니다. Claude Code의 'Cache Write' 카운트는 바로 이 서버 측 KV 캐시를 새로 만들 때 발생한 토큰 수 이며, 'Cache Read'는 이미 만들어진 캐시를 재사용한 토큰 수입니다. 🧠 즉, Cache Write는 '비용'이 아니라 미래 호출에 90% 할인을 적용하기 위한 선투자 입니다. 한 번 Write에 25% 할증을 내고, 반복 호출에서 회수하는 구조죠....