구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

- 6월 06, 2026

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

🦴 AI 토큰 75% 절감, 케이브맨 기법의 진실

📅 2026년 5월 12일 · Claude Code 토큰 최적화 종합 리포트

📌 핵심 요약

Claude Code용 외부 스킬 Caveman(개발자: Julius Brussee)은 AI 응답에서 사회적 윤활어를 제거해 출력 토큰을 평균 65~75% 절감한다고 보고된다. 본 리포트는 영상 주장과 1차 출처를 교차 검증하고, 75%/45% 절감 수치의 검증 한계까지 명시해 실무자가 도입 가부를 판단할 수 있도록 정리한다.

1. 영상 개요와 조사 범위

대상 영상(YouTube iEScgjg_eR4, 제목 "Cut Your AI Token Usage by 75% (with Caveman)")은 Anthropic의 Claude Code 환경에서 토큰 소비를 극적으로 줄이는 외부 스킬을 소개한다. 본 보고서는 해당 영상의 핵심 주장, 1차 출처(GitHub 저장소, 커뮤니티 리뷰), 그리고 라운드 간 모순까지 명시한다.

2. 핵심 개념: '케이브맨'이란 무엇인가

케이브맨은 슬로건 "Why use many token when few do trick?"이 보여주듯, AI 응답에서 사회적 윤활어(군더더기·정중한 수식·중복 설명)를 제거하고 핵심 명사·동사·코드만 남기는 출력 압축 기법이다.

▶ 제거 대상: "네, 알겠습니다", "수정을 완료했습니다", 관사/조사/연결어 등 의미 전달에 기여하지 않는 토큰

▶ 보존 대상: 코드 블록, 터미널 명령, 파일 경로, 에러 메시지 — 바이트 단위 무손실 유지

▶ 철학적 위치: 인간의 자연어는 사회적 맥락 유지를 위해 군더더기를 포함하지만, 코딩 에이전트로서의 AI에는 사실(fact)과 코드가 핵심이라는 실용주의적 관점

LLM은 텍스트를 '토큰'이라는 최소 의미 단위로 처리하며(영어 기준 1,000 토큰 ≈ 750 단어), API 과금과 응답 지연은 모두 토큰 수에 비례한다. 따라서 출력 토큰을 줄이는 것은 즉시 비용·속도·집중도 세 가지를 동시에 개선하는 레버리지 포인트가 된다.

📊 토큰 다이어트의 3대 효과

💰 비용

최대 75% ↓

출력 토큰당 과금 직접 절감

⚡ 속도

2~3배 ↑

생성량 감소에 따른 체감 응답속도

🎯 집중도

+26점

간결성 강제 벤치마크 효과 (2026.03)

3. 설치 및 사용 방법

3.1 설치 명령

라운드 1·2에서 안내된 명령은 다음과 같다.

# 스킬 설치
npx skills add JuliusBrussee/caveman
# 또는 Claude Marketplace 경유
claude plugin marketplace add JuliusBrussee/caveman

⚠️ 모순/검증 필요

위 npx skills add 형식은 영상과 일부 2차 자료가 안내한 형태다. 그러나 Claude Code의 공식 스킬 설치 절차(GitHub README, npm registry)와 정확히 일치하는지는 본 조사 시점(2026-05-12)에 1차 출처로 완전히 교차 검증되지 않았다. 실제 설치 전에는 GitHub README의 최신 안내(특히 claude plugin CLI 옵션 또는 ~/.claude/skills/ 수동 배치 여부)를 직접 확인할 것을 권장한다.

3.2 모드 및 명령

명령	효과
/caveman lite	완만한 압축, 자연스러운 문장 유지
/caveman (full)	관사·조사 제거, 핵심 단어 위주
/caveman ultra	화살표·파편화 단어 중심의 극한 압축
/caveman-stats	누적 토큰 절약량·예상 절감액(USD) 표시
/caveman-compress	CLAUDE.md, MEMORY.md 등 프로젝트 컨텍스트 파일을 케이브맨 문체로 재작성 → 입력 토큰 영구 절감
"talk like a caveman"	자연어 토글 트리거

/caveman-compress는 특히 매 세션의 시스템 프롬프트 비용을 영속적으로 낮추는 효과가 있어, 단발성 출력 압축을 넘어 컨텍스트 베이스라인을 줄이는 구조적 절감 도구로 평가된다.

4. 효용성: 보고된 수치와 검증 한계

📉 모드별 토큰 절감률 비교

🦴 /caveman ultra

-87%

🦴 /caveman full

-75%

🦴 /caveman lite

-65%

📂 /caveman-compress

-46%

출처: JuliusBrussee/caveman GitHub README 자체 보고치 (독립 검증 미흡)

4.1 라운드별 수치 요약

▶ 출력 토큰: 평균 65~75% 감소, 복잡한 설명 작업에서 최대 87%까지 감소(GitHub 저장소 README 기준)

▶ 입력 토큰: /caveman-compress 적용 시 컨텍스트 파일 ~46% 축소

▶ 응답 속도: 토큰 생성량 감소에 따라 체감 약 2~3배 빠른 응답

▶ 정확도: 2026년 3월 "Brevity Constraints Reverse Performance Hierarchies" 연구는 모델에게 간결함을 강제할 때 벤치마크 점수가 최대 26점 향상됨을 보고. 다만 해당 결과가 Caveman 사용에 그대로 전이되는지는 별개의 검증 필요

⚠️ 검증 한계 — 자체 측정 필수

출력 75% / 입력 45% 절감 수치는 영상 제목과 저장소 자체 보고에 의존하며, 독립적·재현 가능한 외부 벤치마크로는 본 조사 시점까지 완전 검증되지 않았다. 즉, 마케팅 수치와 실측 사이에 간극이 있을 수 있으므로 도입 시 자체 프로젝트에서 /caveman-stats 데이터를 최소 1~2주 추적해 ROI를 검증하는 절차가 필요하다.

5. 실 사용자 후기와 한계

5.1 긍정적 반응

🟢 Reddit · X(Twitter): "AI의 불필요한 친절에 지불하던 비용을 아끼는 혁명적 도구"라는 평이 다수, 대규모 코드베이스 헤비 유저 사이에서 필수 도구로 언급

🟢 Hacker News: 밈(Meme)처럼 보이지만 실제 API 청구서로 효과가 입증된다는 점에서 화제

🟢 Medium · Dev.to: "Claude API 청구서 70% 감소" 류의 케이스 스터디 다수 게재

5.2 한계 및 부적합 시나리오

🔴 학습자 비친화: "왜 이렇게 수정했는가"에 대한 친절한 설명이 필요한 초·중급 학습 단계에서는 불리

🔴 모호성 위험: Ultra 모드에서 복잡한 아키텍처 논의 시 정보 누락 가능. /caveman lite 또는 일반 모드 복귀가 해법

🔴 협업 상호작용 축소: '비서'가 아닌 '엔진'이 되므로 대화형 UX의 정서적 요소 상실

🔴 검증 불완전 수치: 위에서 명시한 모순 항목으로 인해, 절감률을 그대로 사업 계획에 반영하기 전 자체 측정이 필수

🧭 모드 선택 의사결정 흐름

6. 도입 전략 가이드 — 5단계 로드맵

STEP 1

사전 검증

STEP 2

샌드박스 도입

STEP 3

베이스라인 측정

STEP 4

컨텍스트 압축

STEP 5

팀 가이드라인

단계	실행 항목
1️⃣	사전 검증 — GitHub README에서 최신 설치 명령과 호환 버전을 직접 확인. `npx skills add` 명령은 그대로 신뢰하지 말 것
2️⃣	샌드박스 도입 — 개인 프로젝트 또는 비중요 리포지토리에서 `/caveman lite`부터 시작
3️⃣	베이스라인 측정 — 도입 전 1주, 도입 후 1주의 `/caveman-stats` 데이터를 비교해 실효 절감률 산출
4️⃣	컨텍스트 압축 확장 — 효과가 확인되면 `/caveman-compress`로 CLAUDE.md · MEMORY.md 등 영구 컨텍스트 파일까지 압축
5️⃣	팀 적용 가이드라인 — 학습자가 포함된 팀에서는 모드 토글 기준(예: 디버깅·실전 작업은 full, 코드 리뷰·페어 프로그래밍은 normal)을 사전에 합의

7. 결론 및 시사점

케이브맨은 단순한 농담형 출력 변형이 아니라 LLM의 토큰 경제학(token economics)을 정면으로 다루는 실용주의 도구다. 비용·속도·집중도라는 세 축을 동시에 개선할 잠재력을 가지며, 특히 Claude Code 같이 코드베이스를 반복적으로 컨텍스트에 싣는 환경에서 ROI가 극대화된다.

단, (a) 설치 명령의 1차 출처 일치 여부, (b) 자체 보고된 75%/45% 절감률의 외부 검증이라는 두 가지 모순 지점은 도입 결정 전 반드시 자체 확인이 필요하다. 본 보고서는 이 두 지점을 명시적으로 표시함으로써, 마케팅 메시지와 실측 결과 사이의 간극에서 의사결정자가 길을 잃지 않도록 한다.

🧠 핵심 인사이트

장기적으로 압축형 프롬프트 패턴은 B2B 영역의 토큰 비용 누적 압박과 맞물려 표준화될 가능성이 높다. AI 코딩 에이전트를 일상적으로 사용하는 실무자에게는 "토큰 다이어트의 필수 방법론"으로서 충분히 평가하고 도입을 검토할 가치가 있는 도구로 결론 내릴 수 있다. 단, 도입 절차는 반드시 자체 측정을 포함해야 한다.

📌 라운드 간 모순 (재확인)

🟡 모순 1: 설치 명령어가 npx skills add juliusbrussee/caveman로 제시되었으나 Claude Code의 실제 skill 설치 방식과 일치하는지 1차 출처(GitHub README, npm registry) 확인 필요

🟡 모순 2: 출력 토큰 75% 절감 및 입력 토큰 45% 절감 수치의 출처가 영상 제목 외 독립적 벤치마크로 검증되지 않음

🔗 References

• Cut Your AI Token Usage by 75% (with Caveman) — YouTube 원본 영상

• JuliusBrussee/caveman GitHub — 스킬 저장소 (설치 명령 1차 출처)

• Claude Code Official Documentation — Anthropic 공식 문서

⚖️ 면책 조항 — 본 콘텐츠는 정보 제공 목적으로 작성되었으며, 특정 도구·서비스의 사용 또는 투자 권유가 아니다. 외부 도구 도입은 자체 환경에서의 검증 절차를 거친 후 결정해야 하며, API 사용량·비용·정확도에 대한 책임은 사용자 본인에게 있다. 본 보고서에 인용된 수치는 1차 출처의 자체 보고치를 포함하므로 실제 결과는 사용 환경에 따라 달라질 수 있다.

📄 Raw Data

# 케이브맨(Caveman) 기법 종합 분석: AI 토큰 다이어트의 실효성과 한계

## 1. 영상 개요와 조사 범위

대상 영상(YouTube `iEScgjg_eR4`, 제목 "Cut Your AI Token Usage by 75% (with Caveman)")은 Anthropic의 **Claude Code** 환경에서 토큰 소비를 극적으로 줄이는 외부 스킬 **Caveman**(개발자: Julius Brussee)을 소개합니다. 본 보고서는 해당 영상의 핵심 주장과 함께, 1차 출처(GitHub 저장소, 커뮤니티 리뷰)에서 확인 가능한 정보, 그리고 라운드 간 모순까지 명시하여 실무자가 도입 가부를 판단할 수 있도록 정리했습니다.

## 2. 핵심 개념: '케이브맨'이란 무엇인가

케이브맨은 "Why use many token when few do trick?"이라는 슬로건이 보여주듯, **AI 응답에서 사회적 윤활어(군더더기·정중한 수식·중복 설명)를 제거하고 핵심 명사·동사·코드만 남기는 출력 압축 기법**입니다.

- **제거 대상**: "네, 알겠습니다", "수정을 완료했습니다", 관사/조사/연결어 등 의미 전달에 기여하지 않는 토큰.
- **보존 대상**: 코드 블록, 터미널 명령, 파일 경로, 에러 메시지 — 바이트 단위 무손실 유지.
- **철학적 위치**: 인간의 자연어는 사회적 맥락 유지를 위해 군더더기를 포함하지만, 코딩 에이전트로서의 AI에는 사실(fact)과 코드가 핵심이라는 실용주의적 관점.

LLM은 텍스트를 '토큰'이라는 최소 의미 단위로 처리하며(영어 기준 1,000 토큰 ≈ 750 단어), API 과금과 응답 지연은 모두 토큰 수에 비례하기 때문에 **출력 토큰을 줄이는 것은 즉시 비용·속도·집중도 세 가지를 동시에 개선**합니다.

## 3. 설치 및 사용 방법

### 3.1 설치 명령

라운드 1·2에서 안내된 명령은 다음과 같습니다.

```bash
# 스킬 설치
npx skills add JuliusBrussee/caveman

# 또는 Claude Marketplace 경유
claude plugin marketplace add JuliusBrussee/caveman
```

> ⚠️ **모순/검증 필요**: 위 `npx skills add` 형식은 영상과 일부 2차 자료가 안내한 형태입니다. 그러나 **Claude Code의 공식 스킬 설치 절차(GitHub README, npm registry)와 정확히 일치하는지는 본 조사 시점(2026-05-12)에 1차 출처로 완전히 교차 검증되지 않았습니다.** 실제 설치 전에는 [JuliusBrussee/caveman GitHub README](https://github.com/JuliusBrussee/caveman)의 최신 안내(특히 `claude plugin` CLI 옵션 또는 `~/.claude/skills/` 수동 배치 여부)를 직접 확인할 것을 권장합니다.

### 3.2 모드 및 명령

| 명령 | 효과 |
|------|------|
| `/caveman lite` | 완만한 압축, 자연스러운 문장 유지 |
| `/caveman` (full) | 관사·조사 제거, 핵심 단어 위주 |
| `/caveman ultra` | 화살표·파편화 단어 중심의 극한 압축 |
| `/caveman-stats` | 누적 토큰 절약량·예상 절감액(USD) 표시 |
| `/caveman-compress` | `CLAUDE.md`, `MEMORY.md` 등 프로젝트 컨텍스트 파일을 케이브맨 문체로 재작성 → **입력 토큰** 영구 절감 |
| "talk like a caveman" | 자연어 토글 트리거 |

`/caveman-compress`는 특히 매 세션의 시스템 프롬프트 비용을 영속적으로 낮추는 효과가 있어, **단발성 출력 압축을 넘어 컨텍스트 베이스라인을 줄이는 구조적 절감 도구**로 평가됩니다.

## 4. 효용성: 보고된 수치와 검증 한계

### 4.1 라운드별 수치 요약

- **출력 토큰**: 평균 65~75% 감소, 복잡한 설명 작업에서 최대 87%까지 감소(GitHub 저장소 README 기준).
- **입력 토큰**: `/caveman-compress` 적용 시 컨텍스트 파일 ~46% 축소.
- **응답 속도**: 토큰 생성량 감소에 따라 체감 약 2~3배 빠른 응답.
- **정확도**: 2026년 3월 *"Brevity Constraints Reverse Performance Hierarchies"* 연구(라운드 2 인용)는 모델에게 간결함을 강제할 때 벤치마크 점수가 최대 26점 향상됨을 보고. 다만 해당 결과가 곧 Caveman 사용에 그대로 전이되는지는 별개의 검증이 필요.

### 4.2 모순/검증 필요 항목

> ⚠️ **출력 75% / 입력 45% 절감 수치**는 영상 제목과 저장소 자체 보고에 의존하며, **독립적·재현 가능한 외부 벤치마크로는 본 조사 시점까지 완전 검증되지 않았습니다.** 즉, 마케팅 수치와 실측 사이에 간극이 있을 수 있으므로, 도입 시 자체 프로젝트에서 `/caveman-stats` 데이터를 일정 기간(최소 1~2주) 추적해 ROI를 검증하는 절차가 필요합니다.

## 5. 실 사용자 후기와 한계

### 5.1 긍정적 반응

- **Reddit·X(Twitter)**: "AI의 불필요한 친절에 지불하던 비용을 아끼는 혁명적 도구"라는 평이 다수, 대규모 코드베이스 헤비 유저 사이에서 필수 도구로 언급.
- **Hacker News**: 밈(Meme)처럼 보이지만 실제 API 청구서로 효과가 입증된다는 점에서 화제.
- **개인 후기 사례**: Medium/Dev.to 등에 "Claude API 청구서 70% 감소" 류의 케이스 스터디 게재(라운드 2 인용).

### 5.2 한계 및 부적합 시나리오

- **학습자 비친화**: "왜 이렇게 수정했는가"에 대한 친절한 설명이 필요한 초·중급 학습 단계에서는 불리.
- **모호성 위험**: Ultra 모드에서 복잡한 아키텍처 논의 시 정보 누락 가능. 이 경우 `/caveman lite` 또는 일반 모드 복귀가 해법.
- **협업 상호작용 축소**: '비서'가 아닌 '엔진'이 되므로 대화형 UX의 정서적 요소 상실.
- **검증 불완전 수치**: 위에서 명시한 모순 항목으로 인해, 절감률을 그대로 사업 계획에 반영하기 전 자체 측정이 필수.

## 6. 도입 전략 가이드

실무자라면 다음 순서로 도입할 것을 권합니다.

1. **사전 검증**: GitHub README([JuliusBrussee/caveman](https://github.com/JuliusBrussee/caveman))에서 최신 설치 명령과 호환 버전을 직접 확인. 라운드 자료의 `npx skills add` 명령은 그대로 신뢰하지 말 것.
2. **샌드박스 도입**: 개인 프로젝트 또는 비중요 리포지토리에서 `/caveman lite`부터 시작.
3. **베이스라인 측정**: 도입 전 1주, 도입 후 1주의 `/caveman-stats` 데이터를 비교해 실효 절감률 산출.
4. **컨텍스트 압축 확장**: 효과가 확인되면 `/caveman-compress`로 `CLAUDE.md`·`MEMORY.md` 등 영구 컨텍스트 파일까지 압축.
5. **팀 적용 시 가이드라인**: 학습자가 포함된 팀에서는 모드 토글 기준(예: "디버깅·실전 작업은 full, 코드 리뷰·페어 프로그래밍은 normal")을 사전에 합의.

## 7. 결론 및 시사점

케이브맨은 단순한 농담형 출력 변형이 아니라 **LLM의 토큰 경제학(token economics)을 정면으로 다루는 실용주의 도구**입니다. 비용·속도·집중도라는 세 축을 동시에 개선할 잠재력을 가지며, 특히 Claude Code 같이 코드베이스를 반복적으로 컨텍스트에 싣는 환경에서 ROI가 극대화됩니다.

단, **(a) 설치 명령의 1차 출처 일치 여부**, **(b) 자체 보고된 75%/45% 절감률의 외부 검증**이라는 두 가지 모순 지점은 도입 결정 전 반드시 자체 확인이 필요합니다. 본 보고서는 이 두 지점을 명시적으로 표시함으로써, 마케팅 메시지와 실측 결과 사이의 간극에서 의사결정자가 길을 잃지 않도록 합니다.

장기적으로 압축형 프롬프트 패턴은 B2B 영역의 토큰 비용 누적 압박과 맞물려 표준화될 가능성이 높습니다. AI 코딩 에이전트를 일상적으로 사용하는 실무자에게는 "토큰 다이어트의 필수 방법론"으로서 **충분히 평가하고 도입을 검토할 가치가 있는 도구**로 결론 내릴 수 있습니다.

## 라운드 간 모순
- 설치 명령어가 'npx skills add juliusbrussee/caveman'로 제시되었으나 Claude Code의 실제 skill 설치 방식과 일치하는지 1차 출처(GitHub README, npm registry) 확인 필요
- 출력 토큰 75% 절감 및 입력 토큰 45% 절감 수치의 출처가 영상 제목 외 독립적 벤치마크로 검증되지 않음
---

## References

- [Cut Your AI Token Usage by 75% (with Caveman)](https://www.youtube.com/watch?v=iEScgjg_eR4)
- [JuliusBrussee/caveman GitHub](https://github.com/JuliusBrussee/caveman)
- [Claude Code Official Documentation](https://docs.anthropic.com/en/docs/agents-and-tools/claude-code)

이 블로그 검색

Brave Ogu

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리