구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

깃허브 코파일럿 과금 대전환, 파워유저 요금 폭탄의 진실

깃허브 코파일럿 과금 대전환: PRU에서 AI Credits로

2026년 6월 1일 시행 · IT/AI 개발 도구 분석

2026년 6월 1일, 깃허브 코파일럿(GitHub Copilot)의 과금 체계가 기존 '프리미엄 요청 단위(PRU)'에서 '토큰 소비 기반 AI Credits'로 완전히 바뀌었습니다. 핵심은 폴백 모델이 사라지고 크레딧 소진 시 기능이 즉시 멈춘다는 것. 라이트 유저는 거의 영향이 없지만, 에이전트 코딩을 일상적으로 쓰던 파워 유저는 최대 60배의 요금 폭탄을 맞았습니다. 무엇이, 왜 바뀌었고, 우리는 어떻게 대응해야 할까요.

🔍 무엇이 바뀌었나 — 두 과금 모델의 작동 원리

이번 논란을 이해하려면 먼저 두 과금 체계가 '요금을 세는 방식'부터 다르다는 점을 알아야 합니다. 한쪽은 '요청 횟수'를, 다른 쪽은 '처리한 토큰량'을 셉니다. 이 차이가 곧 비용 예측 가능성을 완전히 갈라놓았습니다.

① 기존 방식 — 프리미엄 요청 단위(PRU)

2025년 6월 도입된 방식입니다. '요청 1건'을 단위로 세되, 어떤 모델을 쓰느냐에 따라 1건이 소비하는 PRU 수(멀티플라이어)가 달랐습니다. 결정적 안전장치는 폴백(fallback) — PRU를 다 써도 더 저렴한 모델로 자동 전환되어 서비스가 끊기지 않았죠. "느려질 뿐 멈추지는 않는" 구조라 비용 예측이 쉬웠습니다.

② 변경된 방식 — AI Credits(토큰 기반)

2026년 6월 1일, PRU가 폐기되고 토큰 단위 과금으로 전환됐습니다. 1 AI Credit = $0.01이며, 각 상호작용의 입력·출력·캐시 토큰을 모두 합산해 모델 공개 요금으로 환산합니다. '요청 1건'이 아니라 '실제 처리한 토큰량'을 과금하므로, 같은 작업이라도 세션 길이·컨텍스트 크기·모델에 따라 비용이 10배까지 벌어집니다.

가장 파급력 큰 변화는 폴백 모델 제거입니다. 한도를 소진했을 때의 동작이 정반대로 바뀌었습니다.


flowchart TD
  A([크레딧/한도 소진]) --> B{과금 방식?}
  B -->|기존 PRU| C[저렴한 모델로
자동 폴백
작업 지속] B -->|신규 Credits| D[기능 즉시 중단
그 달 사용 불가] style A fill:#fef9e7,stroke:#f39c12 style B fill:#fef9e7,stroke:#f39c12 style C fill:#eafaf1,stroke:#27ae60,color:#1e8449 style D fill:#fdedec,stroke:#e74c3c,color:#c0392b

🔁 다이어그램 요약: 한도 소진 시 기존 PRU는 저렴한 모델로 자동 폴백해 작업이 계속 이어졌지만, 신규 AI Credits는 크레딧이 떨어지는 순간 기능이 즉시 멈춰 그 달 동안 사실상 사용이 불가능합니다.

참고로 기존 PRU 방식의 모델별 멀티플라이어는 다음과 같았습니다. 같은 '요청 1건'이라도 모델에 따라 소비량이 최대 90배 차이 났던 셈입니다.

모델 PRU 멀티플라이어
GPT-4o, GPT-4.1 0× (무료)
GPT-5.4 mini 0.33×
Claude Sonnet 계열
Claude Opus 4.5/4.6
Claude Opus 4.6 Fast 모드 30×

📊 현황 데이터 — 플랜·소비량 정량 비교

변경 후 각 플랜에 포함되는 크레딧은 다음과 같습니다. 흥미롭게도 포함 크레딧의 '실질 달러 가치'는 월 요금보다 높게 책정되어, 표면적으로는 손해가 아닌 것처럼 보이게 설계됐습니다.

플랜 월 요금 포함 Credits 실질 가치
Copilot Pro $10 1,500 $15
Copilot Pro+ $39 7,000 $70
Business $19/인 1,900 $19
Enterprise $39/인 3,900 $39

문제는 '소비 속도'입니다. 같은 소형 작업(입력 3K / 출력 1K 토큰)을 해도 어떤 모델을 고르냐에 따라 크레딧 소비가 7배 가까이 벌어집니다.

MAI-Code-1-Flash
~0.68
Claude Sonnet 4.6
~2.4
GPT-5.5 (최상위)
~4.5
단위: 소형 작업 1건당 AI Credits 소비

✓ 단, 인라인 코드 자동완성과 Next Edit 제안만은 예외적으로 무제한 무료로 유지됩니다. 즉 "타이핑 보조"는 공짜로 남았지만, "채팅·에이전트·리팩토링" 같은 무거운 작업은 전부 크레딧을 태웁니다. 이것이 라이트 유저와 파워 유저의 운명을 가른 분기점입니다.

💡 원인 분석 — 깃허브가 직접 밝힌 구조적 적자

깃허브는 변경 사유를 공식 블로그에서 이례적으로 솔직하게 밝혔습니다. 핵심은 "한 번의 채팅 질문"과 "수 시간짜리 자율 코딩 세션"이 똑같은 비용으로 책정되는 구조가 더 이상 지속 불가능하다는 것이었습니다.

"빠른 채팅 질문 하나와 수 시간에 걸친 자율 코딩 세션이 사용자에게 동일한 비용으로 책정될 수 있었다. 깃허브는 증가하는 추론 비용의 상당 부분을 자체 부담해왔으나, 현재 모델은 더 이상 지속 불가능하다." — GitHub Blog, 2026-05

원인은 두 가지 압력이 동시에 작용한 구조적 문제로 정리됩니다.

1. 프론티어 모델의 추론 비용 급등 — Claude Opus, GPT-5 계열의 토큰당 비용은 GPT-4 시절과 비교 불가할 만큼 비싸졌습니다.

2. 에이전트 모드의 확산 — 2025년 말부터 멀티스텝 자율 코딩 세션이 일상화됐는데, 이 패턴은 일반 채팅의 수십 배 토큰을 소비합니다.

요컨대 "채팅 한 번"과 "3시간짜리 에이전트 세션"이 똑같은 PRU를 먹는 구조는 깃허브 입장에서 명백한 적자였습니다. 토큰 과금 전환은 이 비용을 사용자에게 전가하는 동시에, 헤비 유저와 라이트 유저를 비용상 분리하려는 조치로 읽힙니다.

🔥 영향 및 파급 — 분노의 실측치

발표 직후 깃허브 공식 커뮤니티 토론 스레드에는 댓글 435개와 함께 다운보트 904개 vs 업보트 22개가 달렸습니다. 비율로는 사실상 커뮤니티 전원 반대에 가깝습니다.

커뮤니티 반응 (다운보트 비중) 97.6% 반대
업보트 22 · 다운보트 904 · 댓글 435 (GitHub 공식 스레드)

레딧·X에서 공유된 실제 피해 사례는 충격적입니다. 헤비 유저 기준 월 요금이 수십 배로 뛰었습니다.

$29 → $750
약 25배
$50 → $3,000
약 60배
사용자 보고 기준 월 비용 증가 추산치

Pro+ 사용자가 2시간 세션에 월 크레딧의 8%를 소진했다는 보고도 있었습니다. 역산하면 월 약 25시간이 한계인 셈입니다. 게다가 6월 1일 0시 자동 전환 시점에 이미 크레딧 60%가 소진된 채 시작됐다는 의혹(전환 직전 사용분 소급 적용)까지 제기됐습니다. 이번 변화의 시간 축은 다음과 같습니다.

2025-06
PRU 도입
2026-06-01
Credits 전환·폴백 제거
2026-09
한시 프로모션 종료

불만은 세 갈래로 압축됩니다.

🔴 폴백 제거의 충격 — 과거엔 한도를 다 써도 저성능 모델로 작업이 이어졌으나, 이제는 크레딧이 떨어지는 순간 그 달 코파일럿이 사실상 멈춥니다.

🔴 예산 예측 불가 — 토큰 과금은 세션·모델·컨텍스트에 따라 비용이 출렁여, "채팅할 때마다 비용을 계산해야 한다"는 반응이 나옵니다.

🔴 정체성 상실 — "예측 가능한 월정액으로 여러 모델을 쓸 수 있다"는 코파일럿의 핵심 매력이 사라졌다는 평가가 주를 이룹니다.

🧠 핵심 비대칭: 단순 자동완성과 가끔의 채팅만 하는 라이트 유저는 기존과 차이가 거의 없습니다. 타격은 에이전트 코딩을 일상적으로 쓰는 파워 유저에게 집중됩니다. 깃허브가 가장 공들여 마케팅해온 사용자층이 가장 크게 손해 보는 역설적 구도입니다.

⚙️ 멀티모델 스위칭 — 왜 사랑받았고, 지금은 어떤 위치인가

이번 논란과 별개로, 코파일럿이 2024년 말부터 제공한 멀티모델 선택 기능은 독보적 경쟁 우위였습니다. 하나의 IDE 플러그인에서 작업 성격에 맞는 모델을 골라 쓸 수 있다는 것이죠. 2026년 기준 권장 모델 매핑은 다음과 같습니다.

목적 권장 모델
빠른 프로토타이핑 / 경량 GPT-5 mini, o4-mini, MAI-Code-1-Flash
범용 코딩 / 문서화 GPT-4.1, GPT-4o, Claude Sonnet 4.5/4.6
복잡한 리팩토링 / 아키텍처 Claude Sonnet 4.7, GPT-5.5, o3
고급 추론 / 시스템 설계 Claude Opus 4.6, GPT-5.5, o1

직접 API(OpenAI·Anthropic 직결) 대비 코파일럿이 가진 강점은 여전히 살아 있습니다.

제로 설정 IDE 통합 — 키 관리 없이 단일 플러그인으로 여러 모델 접근(VS Code, JetBrains, Visual Studio, Neovim).

코드 컨텍스트 자동 인식 — 열린 파일·관련 파일·디렉토리 구조를 자동으로 프롬프트에 포함. 직접 API는 수동 복붙이 필요합니다.

벤더 락인 없는 '최선의 모델' — 특정 모델이 회귀를 보이면 즉시 다른 모델로 전환.

통합 데이터 보호 — 단일 약관 아래 모든 모델에 '학습 데이터 미사용' 통일 적용. 기업에 특히 중요.

Auto 모드 — 작업 복잡도에 따라 최적 모델을 자동 배정해 크레딧을 절약.

단, 새 과금 이후 단점도 부각됐습니다.

비용 예측 불가 — 토큰 가격을 크레딧으로 한 단계 더 추상화해 직관성이 떨어집니다.

모델 선택 제한 — Mistral·Llama 등 미제공 모델은 못 씁니다.

소진 시 즉시 중단 — 직접 API는 지갑에 돈만 있으면 무한 사용. 코파일럿은 갑작스러운 정지가 발생합니다.

🟡 확인이 필요한 항목: 2026년 5월부터 웹 Copilot Chat에서 Gemini 모델이 제거됐습니다. VS Code·JetBrains 등 IDE 플러그인에서 여전히 선택 가능한지는 추가 확인이 필요합니다.

🎯 결론 및 시사점

이번 변경은 깃허브가 코파일럿을 'AI 구독 서비스'에서 'AI 인프라 플랫폼'으로 재포지셔닝하는 신호로 읽힙니다. 라이트 유저에게는 실질 변화가 거의 없으나, 파워 유저는 직격탄을 맞았습니다.

💼 단기 완충: Business·Enterprise 플랜에 6~8월 한시 프로모션 크레딧(Business $30, Enterprise $70 상당)이 제공됩니다. 다만 9월 종료 후 추가 반발이 예상됩니다.

💼 전략적 시사점: 멀티모델 스위칭이라는 핵심 강점은 여전히 살아 있습니다. 그러나 그 가치를 '저렴한 월정액'이 아니라 '올바른 모델을 올바른 작업에'라는 프레임으로 재해석하고, 비용 관리(경량 모델 위주 + 고성능은 필요할 때만)를 병행해야 하는 시대로 넘어갔습니다.

💼 이탈 가능성: 커뮤니티에서 가장 많이 공유된 의견은 "긴 작업을 비용 걱정 없이 맡길 수 있던 게 코파일럿의 강점이었는데, 이제는 OpenRouter나 직접 API가 나을 수 있다"는 것입니다. 즉 이번 변경은 헤비 유저의 대체재 탐색을 촉발하는 변곡점이 될 가능성이 높습니다.

🧠 결국 핵심 질문은 "코파일럿이 비싸졌는가"가 아니라 "내 작업 패턴이 라이트인가 헤비인가"입니다. 자동완성과 가벼운 채팅 중심이라면 지금처럼 써도 무방합니다. 그러나 에이전트 세션을 하루 몇 시간씩 돌린다면, 경량 모델을 기본값으로 두고 고성능은 정말 필요할 때만 꺼내 쓰는 '모델 다이어트'가 새 시대의 필수 습관이 됩니다.

📚 참고 자료

※ 본 글에 정리된 요금·플랜·모델 정보는 2026년 6월 기준이며, 서비스 정책은 사전 고지 없이 변경될 수 있습니다. 실제 과금 적용 전 공식 문서에서 최신 조건을 반드시 확인하시기 바랍니다.

📄 Raw Data
# GitHub Copilot 과금 대전환: PRU에서 AI Credits로

## 질문 파악

이번 사안의 핵심은 세 가지다. 첫째, 2026년 6월 1일부로 시행된 GitHub Copilot의 과금 체계가 **기존 방식 대비 구체적으로 무엇이 어떻게 바뀌었는가**. 둘째, 마이크로소프트(GitHub)가 **왜 이 변경을 단행했는가**. 셋째, 변경 이후 **커뮤니티의 평가와, Copilot이 가진 멀티모델 스위칭이라는 구조적 강점**이 이번 변화 속에서 어떤 위치에 놓이게 됐는가다.

질문자가 언급한 "레딧에서 상당히 많은 요금이 부과되어 불만"이라는 부분은 실제 데이터로 뒷받침되는 사실로 확인된다. 다만 그 충격은 **사용자 유형에 따라 극단적으로 갈린다**는 점이 이 사안의 핵심 구조다.

---

## 기초 정보 — 두 과금 모델의 작동 원리

이 논란을 이해하려면 먼저 두 과금 체계의 작동 방식 차이를 알아야 한다.

**(1) 기존 방식 — 프리미엄 요청 단위(PRU, Premium Request Unit)**

2025년 6월 GitHub이 처음 도입한 사용량 제한 방식이다. "요청 1건"을 단위로 셈하되, **어떤 모델을 쓰느냐에 따라 1건이 소비하는 PRU 수(멀티플라이어)가 달랐다**.

| 모델 | PRU 멀티플라이어 |
|------|----------------|
| GPT-4o, GPT-4.1 | 0× (무료) |
| GPT-5.4 mini | 0.33× |
| Claude Sonnet 계열 | 1× |
| Claude Opus 4.5/4.6 | 3× |
| Claude Opus 4.6 Fast 모드 | 30× |

이 방식의 결정적 안전장치는 **폴백(fallback)**이었다. PRU를 다 써도 더 저렴한 모델로 자동 전환되어 서비스가 끊기지 않았다. 비용 예측이 쉬웠고, 최악의 경우에도 "느려질 뿐 멈추지는 않는" 구조였다.

**(2) 변경된 방식 — AI Credits(토큰 소비 기반)**

2026년 6월 1일, PRU가 완전히 폐기되고 **토큰 단위 과금**으로 전환됐다. 공식 명칭은 GitHub AI Credits다 [GitHub Blog, 2026-05].

- **1 AI Credit = $0.01**
- 각 모델 상호작용의 **입력 + 출력 + 캐시 토큰**을 모두 합산
- 합산 토큰에 모델 API 공개 요금을 적용해 크레딧으로 환산

"요청 1건"이 아니라 "실제로 처리한 토큰량"을 과금하므로, 같은 작업이라도 **세션 길이·컨텍스트 크기·선택 모델에 따라 비용이 10배까지 벌어진다**.

---

## 현황 데이터 — 플랜·소비량의 정량 비교

**플랜별 포함 크레딧(변경 후):**

| 플랜 | 월 요금 | 포함 AI Credits | 실질 달러 가치 |
|------|--------|----------------|-------------|
| Copilot Pro | $10 | 1,500 | $15 |
| Copilot Pro+ | $39 | 7,000 | $70 |
| Business | $19/사용자 | 1,900 | $19 |
| Enterprise | $39/사용자 | 3,900 | $39 |

**모델별 실제 소비 예시**(소형 작업 — 입력 3K / 출력 1K 기준):

| 모델 | 크레딧 소비 |
|------|-----------|
| MAI-Code-1-Flash (경량) | ~0.68 |
| Claude Sonnet 4.6 | ~2.4 |
| GPT-5.5 (최상위) | ~4.5 |

가장 파급력 큰 변화는 **폴백 모델 제거**다. 크레딧을 소진하면 기능이 **즉시 중단**된다. 단, **인라인 코드 자동완성과 Next Edit 제안만은 예외적으로 무제한 무료**로 유지된다 [GitHub Blog, 2026-05]. 즉 "타이핑 보조"는 공짜로 남았지만, "채팅·에이전트·리팩토링" 같은 무거운 작업은 전부 크레딧을 태운다.

---

## 원인 분석 — GitHub이 직접 밝힌 구조적 적자

GitHub은 변경 사유를 공식 블로그에서 이례적으로 솔직하게 밝혔다.

> "빠른 채팅 질문 하나와 수 시간에 걸친 자율 코딩 세션이 사용자에게 동일한 비용으로 책정될 수 있었다. GitHub은 증가하는 추론 비용의 상당 부분을 자체 부담해왔으나, 현재 모델은 더 이상 지속 불가능하다." [GitHub Blog, 2026-05]

원인은 **두 가지 압력이 동시에 작용한 구조적 문제**로 정리된다.

1. **프론티어 모델의 추론 비용 급등**: Claude Opus, GPT-5 계열의 토큰당 비용은 GPT-4 시절과 비교 불가할 만큼 비싸졌다.
2. **에이전트 모드(Agent Mode)의 확산**: 2025년 말부터 멀티스텝 자율 코딩 세션이 일상화됐는데, 이 사용 패턴은 일반 채팅의 **수십 배** 토큰을 소비한다 [InfoWorld, 2026-05].

요컨대 "채팅 한 번"과 "3시간짜리 에이전트 세션"이 똑같은 PRU를 먹는 구조는 GitHub 입장에서 **명백한 적자 구조**였다. 토큰 과금 전환은 이 비용을 사용자에게 전가하는 동시에, 헤비 유저와 라이트 유저를 비용상 분리하려는 조치로 읽힌다.

---

## 영향 및 파급 효과 — 분노의 실측치

과금 변경 발표 직후 GitHub 공식 커뮤니티 토론 스레드에는 **댓글 435개, 다운보트 904개, 업보트 22개**가 달렸다. 업/다운 비율로는 사실상 커뮤니티 전원 반대에 가깝다 [gHacks, 2026-06].

**Reddit·X에서 공유된 실제 피해 사례:**

- 월 $29 → **$750**(약 25배) 증가 예상
- 월 $50 규모 → **$3,000**(약 60배) 급등 추산
- Pro+ 사용자가 **2시간 세션에 월 크레딧의 8% 소진** → 역산하면 월 약 25시간이 한계
- 6월 1일 0시 자동 전환 시점에 이미 크레딧 60%가 소진된 채 시작됐다는 보고(전환 직전 사용분 소급 적용 의혹) [TechTimes, 2026-06]

불만은 세 갈래로 압축된다.

1. **폴백 제거의 충격**: 과거엔 한도를 다 써도 저성능 모델로 작업이 이어졌으나, 이제는 크레딧이 떨어지는 순간 그 달 Copilot이 사실상 멈춘다.
2. **예산 예측 불가능성**: 토큰 과금은 세션·모델·컨텍스트에 따라 비용이 출렁여, "채팅할 때마다 비용을 계산해야 한다"는 반응이 나온다.
3. **정체성 상실**: 다수 사용자가 Copilot을 택한 이유는 "예측 가능한 월정액으로 여러 모델을 쓸 수 있다"는 점이었는데, 그 정체성이 사라졌다는 평가가 주를 이룬다 [Xebia, 2026-06].

**중요한 비대칭**: 단순 자동완성과 가끔의 채팅만 하는 라이트 유저는 기존과 차이가 거의 없다. 타격은 **에이전트 코딩을 일상적으로 쓰는 파워 유저**에게 집중된다. GitHub이 가장 공들여 마케팅해온 사용자층이 가장 크게 손해 보는 역설적 구도다.

---

## 멀티모델 스위칭 — 왜 사랑받았고, 지금은 어떤 위치인가

이번 논란과 별개로, Copilot이 2024년 말부터 제공한 **멀티모델 선택 기능**은 독보적 경쟁 우위였다 [TechCrunch, 2024-10].

**작업별 권장 모델(2026년 기준):**

| 목적 | 권장 모델 |
|------|---------|
| 빠른 프로토타이핑 / 경량 | GPT-5 mini, o4-mini, MAI-Code-1-Flash |
| 범용 코딩 / 문서화 | GPT-4.1, GPT-4o, Claude Sonnet 4.5/4.6 |
| 복잡한 리팩토링 / 아키텍처 | Claude Sonnet 4.7, GPT-5.5, o3 |
| 고급 추론 / 시스템 설계 | Claude Opus 4.6, GPT-5.5, o1 |

**직접 API(OpenAI·Anthropic 직결) 대비 Copilot의 장점:**

1. **제로 설정 IDE 통합** — 키 관리·연동 없이 단일 플러그인으로 여러 모델 접근(VS Code, JetBrains, Visual Studio, Neovim).
2. **코드 컨텍스트 자동 인식** — 열린 파일·관련 파일·디렉토리 구조를 자동으로 프롬프트에 포함. 직접 API는 수동 복붙이 필요하다.
3. **벤더 락인 없는 "최선의 모델" 사용** — 특정 모델이 회귀(regression)를 보이면 즉시 다른 모델로 전환. 실제로 GitHub은 내부 기반 모델을 여러 차례 교체해왔고(Codex → GPT-4 → GPT-5 계열), 그때마다 수동 전환이 우회책이 됐다.
4. **통합 데이터 보호** — GitHub 단일 약관 아래 모든 모델에 "학습 데이터 미사용"을 통일 적용. 기업에 특히 중요하다.
5. **Auto 모드** — 작업 복잡도에 따라 최적 모델을 자동 배정해 크레딧을 절약한다.

**단, 새 과금 이후 단점도 부각됐다:**

- **비용 예측 불가** — 토큰 가격은 같아도 크레딧으로 한 단계 더 추상화해 직관성이 떨어진다.
- **모델 선택 제한** — Mistral·Llama 등 미제공 모델은 못 쓴다.
- **소진 시 즉시 중단** — 직접 API는 지갑에 돈만 있으면 무한 사용. Copilot은 갑작스러운 정지 사태가 발생한다.

**확인이 필요한 항목**: 2026년 5월부터 웹 Copilot Chat에서 Gemini 모델이 제거됐다. VS Code·JetBrains 등 IDE 플러그인에서 여전히 선택 가능한지는 추가 확인이 필요하다.

---

## 결론 및 시사점

이번 변경은 GitHub이 Copilot을 **"AI 구독 서비스"에서 "AI 인프라 플랫폼"으로 재포지셔닝**하는 신호로 읽힌다. 라이트 유저에게는 실질 변화가 거의 없으나, 파워 유저는 직격탄을 맞았다.

- **단기 완충**: Business·Enterprise 플랜에 6~8월 한시 프로모션 크레딧(Business $30, Enterprise $70 상당)이 제공된다. 다만 9월 프로모션 종료 후 추가 반발이 예상된다 [GitHub Docs].
- **전략적 시사점**: 멀티모델 스위칭이라는 핵심 강점은 여전히 살아있다. 그러나 그 가치를 **'저렴한 월정액'이 아니라 '올바른 모델을 올바른 작업에'**라는 프레임으로 재해석하고, 비용 관리(경량 모델 위주 + 고성능은 필요할 때만)를 병행해야 하는 시대로 넘어갔다.
- **이탈 가능성**: 커뮤니티에서 가장 많이 공유된 의견은 "긴 작업을 비용 걱정 없이 맡길 수 있던 게 Copilot의 강점이었는데, 이제는 OpenRouter나 직접 API가 나을 수 있다"는 것이다 [Xebia, 2026-06]. 즉 이번 변경은 헤비 유저의 **대체재 탐색을 촉발**하는 변곡점이 될 가능성이 높다.

라운드 간 교차검증에서 상호 모순되는 자료는 발견되지 않았다. 다만 위에 명시한 'IDE 플러그인 내 Gemini 잔존 여부'는 미확인 영역으로 남는다.
---

## References

- [GitHub Blog - 사용량 기반 과금 전환 공식 발표](https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/)
- [TechTimes - 10x-50x 비용 급증 백래시](https://www.techtimes.com/articles/317536/20260601/github-copilot-pricing-change-drives-backlash-agentic-bills-jump-10x-50x-power-users.htm)
- [gHacks - 크레딧 급소진 개발자 반발 현황](https://www.ghacks.net/2026/06/02/github-copilot-usage-based-billing-takes-effect-drawing-developer-backlash-over-rapid-credit-depletion/)
- [Xebia - PRU→토큰 방식 기술적 비교](https://xebia.com/blog/github-copilot-going-from-premium-request-units-to-usage-based-billing/)
- [GitHub Blog - 어떤 모델을 써야 하나](https://github.blog/ai-and-ml/github-copilot/which-ai-model-should-i-use-with-github-copilot/)
- [GitHub Docs - 모델 및 가격](https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing)
- [TechCrunch - Copilot 멀티모델 지원 도입](https://techcrunch.com/2024/10/29/githubs-copilot-goes-multi-model-and-adds-support-for-anthropics-claude-and-googles-gemini/)

댓글

이 블로그의 인기 게시물

Vim 9.2 릴리즈 총정리: 더 빠르고 강력해진 텍스트 편집의 제왕

폐쇄망 SoC 설계자를 위한 가볍고 빠른 Vim 최적화 가이드

에이전트 시대를 위한 터미널 cmux 가이드: 설치부터 AI 활용까지