구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

딥시크 75% 영구 인하·오픈클로 무료 구축 완전 가이드

딥시크 75% 영구 인하·오픈클로 무료 구축 완전 가이드

📅 2026년 5월 27일 · 🏷️ AI · LLM · 자동화 · 에이전트

중국 항저우 기반 AI 스타트업 딥시크(DeepSeek)가 2026년 5월 V4-Pro API 요금을 75% 영구 인하한다고 공식 발표하면서 글로벌 LLM 시장이 다시 한 번 요동치고 있습니다. 이 글은 최신 모델 라인업, 벤치마크 성능, 영구 가격 정책의 진위, 에이전트 오케스트레이션 도구 오픈클로(OpenClaw)와의 통합 사례, 그리고 사실상 무료로 에이전트를 운영하는 로컬 LLM 구축법까지 모든 핵심 정보를 한 번에 정리한 종합 가이드입니다.

🚀 1. 딥시크 최신 모델과 벤치마크

딥시크는 최근 DeepSeek-V4-Pro / V4-Flash를 출시하며 라인업을 강화했으며, 직전 세대인 DeepSeek-V3.2도 여전히 현역으로 운영되고 있습니다. 설계 철학의 핵심은 MoE(Mixture-of-Experts) 아키텍처로, 총 파라미터 1.6T급이지만 실제 추론 시 활성화되는 파라미터는 49B 수준에 불과해 비용 효율 측면에서 압도적인 우위를 점하고 있습니다.

📊 핵심 벤치마크 비교 (점수, 높을수록 우수)

MMLU (일반지식)
88.5
Mathematics
92.1
Data Analysis
88%
History
84.2
Law
82.9
영역 DeepSeek V3.2 GPT-4o Claude 3.5 Sonnet
MMLU 88.5 87.2 88.3
Mathematics 92.1 89.7
Data Analysis 88% 85%
History 84.2 86.7
Law 82.9 85.3

특히 주목할 부분은 수학 영역의 압도적 성과입니다. DeepSeekMath-V2는 Putnam 2024에서 120점 만점에 118점(인간 최고 90점)을 기록했고, IMO 2025 및 CMO 2024 금메달 수준의 풀이력을 입증했습니다. 챗봇 아레나(Chatbot Arena)에서는 V4-Pro thinking 모드가 2026-05-17 기준 1461 ± 6점을 받으며 최상위권에 안착했습니다.

반면 약점도 분명합니다. 코딩 영역에서 DeepSeek-Coder-V2는 72.9%로 GPT-4o와 동등 수준이지만 Claude-3.5-Sonnet에는 살짝 밀리고, 실사용자 후기에서도 "파라미터 수에 비해 코딩 성능이 기대 이하"라는 평이 다수 확인됩니다. MoE 구조 특성상 활성 파라미터·데이터 큐레이션·후처리가 체감 품질을 좌우한다는 점이 그대로 드러나는 사례입니다.

💰 2. 75% 영구 가격 인하 — 사실로 확인

딥시크는 2026년 5월 22~23일경 V4-Pro API 가격을 출시가 대비 75% 영구 인하한다고 공식 발표했고, DeepSeek API 공식 문서에도 2026년 5월 31일 이후 V4-Pro 가격을 원래 가격의 1/4로 영구 조정한다고 명시되어 있습니다. Seeking Alpha, Caixin Global, TNW 등 복수 매체가 이를 교차 확인했으며, 일시 프로모션이 아닌 영구 정책입니다.

💡 요약: V4-Pro 입력가는 GPT-5.5의 약 1/11 수준, V3.2는 GPT-5.4 대비 10~35배 저렴합니다. "1달러당 지능량" 환산 시 GPT-5.5는 12배, Claude Opus 4.7은 19배 더 비쌉니다.

📉 100만 토큰 기준 입력가 비교 ($/1M)

DeepSeek V3.2
$0.28
DeepSeek V4-Pro
$0.44
GPT-5 Mini
$0.25
Gemini 3 Flash
$0.50
Claude Haiku 4.5
$1.00
Gemini 3.1 Pro
$2.00
GPT-5.4
$2.50
Claude Sonnet 4.6
$3.00
Claude Opus 4.6
$5.00
GPT-5.5
$5.00

출력 토큰 가격까지 더하면 격차는 더욱 벌어집니다. V4-Pro의 출력가는 $0.87/1M인데 비해 GPT-5.5는 $30/1M으로, 단순 환산 시 약 34.5배의 비용 차이가 발생합니다. V3.2의 캐시 히트 시에는 입력가가 $0.028/1M까지 떨어지므로 반복적인 RAG·요약 워크로드에는 가성비가 압도적입니다.

🤖 3. 딥시크 × 오픈클로(OpenClaw) 통합 사례

오픈클로는 사용자 인프라에서 실행되며 사용자 API 키를 사용하는 에이전트 오케스트레이션 도구입니다. 공식 문서에 따르면 DeepSeek V3는 OpenClaw Launch로 즉시 배포 가능하며, DeepSeek V4는 Claude Code 및 OpenClaw에 원활히 통합됩니다. OpenRouter 경유 시 별도 API 키 없이도 연동할 수 있어 진입 장벽이 매우 낮습니다.

🔁 실무 권장: 하이브리드 모델 라우팅 패턴


flowchart TD
  A([에이전트 작업 요청]) --> B{작업 유형?}
  B -->|연구·요약·데이터| C[DeepSeek V4-Pro
저비용 고처리량] B -->|코딩·복잡 추론| D[Claude Opus / GPT-5.5
품질 우선] B -->|반복 RAG| E[DeepSeek V3.2
캐시 히트 0.028$] C --> F([응답 통합]) D --> F E --> F style A fill:#3498db,stroke:#2980b9,color:#ffffff style B fill:#fef9e7,stroke:#f39c12 style C fill:#eafaf1,stroke:#27ae60,color:#1e8449 style D fill:#fdedec,stroke:#e74c3c,color:#c0392b style E fill:#eafaf1,stroke:#27ae60,color:#1e8449 style F fill:#3498db,stroke:#2980b9,color:#ffffff

🔁 다이어그램 요약: 작업 유형에 따라 (1) 연구·요약·데이터 분석은 저비용의 DeepSeek V4-Pro로, (2) 코딩·복잡 추론은 품질이 결정적인 Claude Opus/GPT-5.5로, (3) 반복 RAG는 캐시 효율이 뛰어난 V3.2로 라우팅하면 비용과 품질을 동시에 잡을 수 있다.

💬 실사용자 후기 요약

$150 절감 사례: 한 사용자는 동일 워크로드에서 GPT-5.4 대비 $150 이상 절감 보고

금융·수치 분석 강점: V4-Pro는 금융·수치 데이터 분석 에이전트에서 특히 강점

라우팅 정착: 연구/요약은 딥시크, 코딩은 Claude — 모델 라우팅 패턴이 사실상 표준화

반대 의견: 코딩 위주 워크플로에서는 가격만큼의 매력은 부족하다는 평가도 공존

💸 월간 사용량별 비용 시나리오 (입력 100만 + 출력 30만 토큰)

DeepSeek V4-Pro
$0.70
GPT-5 Mini
$0.85
Claude Haiku 4.5
$2.50
GPT-5.5
$14.00

🆓 4. 사실상 무료 — 로컬 LLM × 오픈클로 구축법

커뮤니티의 가장 큰 트렌드는 외부 API 토큰 비용 제로화 + 데이터 주권 확보를 목적으로 한 Ollama / LM Studio / vLLM 기반 로컬 LLM 자체 호스팅입니다. 본격적인 GPU 1장만 갖춰지면 전기료 외 추가 비용 없이 에이전트를 운용할 수 있어 장기적으로 가장 경제적인 옵션입니다.

🔗 권장 스택 (사실상의 베스트 프랙티스)


graph LR
  A[로컬 GPU
RTX 3090/4090
24GB+] --> B[추론 서버
Ollama / LM Studio] B --> C[OpenClaw
에이전트 오케스트] C --> D[VM/컨테이너 격리
Tailscale VPN] style A fill:#eaf2f8,stroke:#2980b9 style B fill:#fef9e7,stroke:#f39c12 style C fill:#eafaf1,stroke:#27ae60 style D fill:#f4ecf7,stroke:#8e44ad

🔗 다이어그램 요약: 24GB+ VRAM GPU 위에 Ollama/LM Studio로 추론 서버를 띄우고, 그 엔드포인트를 OpenClaw에 연결한 뒤, VM/컨테이너 격리와 Tailscale VPN으로 외부 노출을 최소화하면 토큰 비용 0달러의 안전한 자체 운영이 가능하다.

구성 요소 권장 선택
하드웨어 (최소) 24GB VRAM GPU 1장 (RTX 3090/4090) 또는 고급 Mac Studio
하드웨어 (권장) RTX 5070Ti 이상 또는 Mac Studio 듀얼 구성
추론 서버 (초보) LM Studio — GUI + 네이티브 Responses API 호환
추론 서버 (CLI) Ollama — 가볍고 자동화 친화적
추론 서버 (고성능) vLLM / SGLang / MLX
OS / 네트워크 Windows는 WSL2 사용, 외부 노출 시 Tailscale VPN + HTTPS
모델 선택 DeepSeek V3/V4 distilled, Qwen 3.5, Llama 계열 (VRAM 맞춤)
보안 VM/컨테이너 격리, 프롬프트 인젝션 방어, 내부망 한정

💡 BEP 분석: 중고 RTX 3090 기준 약 80만~120만 원의 초기 GPU 투자가 필요하지만, 월 100만 토큰 이상 사용 시 일반적으로 1~2개월 내 손익 분기점에 도달합니다. 양자화 모델은 컨텍스트 절단·보안 리스크가 있어 가급적 풀 모델 사용을 권장합니다.

🎯 5. 결론 및 시사점

🟢 핵심 결론 4가지

성능 동등: 딥시크 V4-Pro·V3.2는 MMLU·수학·데이터 분석에서 GPT-4o·Claude 3.5 Sonnet과 대등하거나 우위. 약점은 역사·법률·일부 코딩에 한정.

가격 영구 인하 사실 확정: 75% 영구 인하는 공식 문서로 확인된 사실. 딥시크는 사실상 상용 API 최저가 모델.

오픈클로 공식 지원: 통합은 공식 지원되며 비용 절감 효과 실증. 다만 코딩 한계로 하이브리드 라우팅이 합리적.

무료 운용 해법: Ollama/LM Studio + 로컬 풀모델 + WSL2/VPN 조합. 초기 GPU 투자가 전제.

💼 향후 전망

AI API 가격 전쟁 가속: OpenAI·Anthropic·Google의 가격 조정 압박 불가피.

하이브리드 AI 아키텍처 표준화: 저비용(딥시크) + 최상위 추론(Claude/GPT) 조합이 표준 패턴.

로컬 AI 하드웨어 수요 증가: 24GB+ VRAM GPU 및 NPU 내장 PC 시장 활성화 예상.

데이터 주권·보안 논의 확대: 로컬 LLM 확산은 거버넌스·감사 체계 정비 요구.

🟡 추가 검증이 필요한 영역

▶ DeepSeek V4-Pro의 장기 안정성·엔터프라이즈 환경 운영 데이터가 아직 충분치 않음.

▶ 딥시크의 데이터 처리 방침에 대한 독립 감사가 부재.

▶ 로컬 LLM 운영의 TCO(총소유비용) — 전력·유지보수·업데이트 비용 정량 분석 필요.

🧠 종합 정리: 딥시크는 단순한 "저가 모델"이 아니라 MoE·DSA·GRP 등 아키텍처 혁신을 통해 가격 경쟁력을 구조적으로 확보한 사례이며, 오픈클로 생태계에서는 상용 API 최저가 옵션로컬 LLM의 강력한 후보 양쪽에서 영향력을 키우고 있습니다. 단기적으로는 모델 라우팅 전략, 중장기적으로는 로컬 인프라 투자가 합리적 선택지로 보입니다.

📚 참고 자료

• Seeking Alpha — "DeepSeek to make a 75% permanent discount on new V4 Pro AI model"

• Caixin Global — "DeepSeek Cuts Flagship AI Model Prices by 75%"

• DeepSeek API 공식 문서 — Models & Pricing

• TNW — "DeepSeek made its 75% discount permanent"

• Medium — "DeepSeekMath-V2" / "Configuring DeepSeek in OpenClaw"

• OpenClaw Docs — Local models / DeepSeek V3 setup

• IntuitionLabs — "LLM API Pricing Comparison (2025)"

• YouTube — "OpenClaw Free Forever with Local LLM" / "Safely Running OpenClaw with Local LLM"

⚠️ 면책 조항: 본 글은 정보 제공 목적이며 투자·구매·법률 자문이 아닙니다. 모델 성능 수치, 가격 정책, 통합 사양은 작성 시점(2026-05-27) 기준이며 추후 변경될 수 있으니 실제 도입·구매 결정 전에는 반드시 공식 공급사 자료와 최신 발표를 직접 확인하시기 바랍니다.

📄 Raw Data
# 딥시크(DeepSeek) AI 모델 종합 분석 보고서: 최신 벤치마크·가격 정책·오픈클로(OpenClaw) 활용 전략

## 1. 개요

본 보고서는 중국 항저우 소재 AI 스타트업 **딥시크(DeepSeek)**의 최신 모델 라인업, 경쟁사 대비 성능 벤치마크, 2026년 5월 단행된 영구 가격 인하 정책의 진위, 그리고 에이전트 자동화 도구인 **오픈클로(OpenClaw)** 구축 사례 및 무료 운영 방법론을 종합 분석한다. 분석은 공개된 벤치마크 데이터, 공급사 공식 자료, 커뮤니티 후기에 근거하며, 향후 AI 시장과 자동화 에이전트 생태계에 미칠 파급 효과를 진단한다.

---

## 2. 딥시크 최신 모델과 벤치마크 성능

### 2.1 최신 라인업 현황

딥시크는 최근 **DeepSeek-V4-Pro / V4-Flash**를 출시하며 라인업을 강화했으며, 직전 세대인 **DeepSeek-V3.2**도 여전히 강력한 성능을 유지하고 있다. 핵심 설계 철학은 **MoE(Mixture-of-Experts) 아키텍처**로, 총 파라미터는 1.6T급이지만 실제 추론 시 활성화되는 파라미터는 49B 수준이라는 점에서 비용 효율성이 뛰어나다(*BentoML, "The Complete Guide to DeepSeek Models"*).

### 2.2 핵심 벤치마크 비교

| 영역 | DeepSeek-V3.2 | GPT-4o | Claude 3.5 Sonnet | 비고 |
|------|---------------|--------|-------------------|------|
| **MMLU (일반 지식)** | 88.5 | 87.2 | 88.3 | DeepSeek 동등/소폭 우위 (*LLM Stats MMLU Leaderboard*) |
| **Mathematics** | 92.1 | 89.7 | — | DeepSeek 우위 (*TianPan.co*) |
| **Data Analysis (100문항)** | 88% | 85% | — | DeepSeek 우위 |
| **History** | 84.2 | 86.7 | — | GPT-4o 우위 |
| **Law** | 82.9 | 85.3 | — | GPT-4o 우위 |

- **수학 분야의 압도적 성과**: DeepSeekMath-V2는 Putnam 2024에서 120점 만점에 118점(인간 최고 90점), IMO 2025·CMO 2024 금메달 수준을 달성했다(*Medium, "[DeepSeek-AI] DeepSeekMath-V2"*).
- **코딩**: DeepSeek-Coder-V2의 코드 편집 능력은 72.9%로 GPT-4o와 동등, Claude-3.5-Sonnet에 약간 뒤진다. DS-Arena-Code 리더보드에서는 DeepSeek-V2.5(0.631)가 선두를 차지하고 있다(*LLM Stats*).
- **챗봇 아레나**: DeepSeek-V4-Pro(thinking 모드)는 2026-05-17 기준 **1461±6점**을 기록했다.

### 2.3 약점과 유의점

커뮤니티에서는 DeepSeek V4 Pro가 **파라미터 수에 비해 코딩 성능이 기대 이하**라는 솔직한 후기가 다수 확인된다(*Reddit, "Deepseek v4 pro 코딩 후기"*). 이는 MoE 구조 특성상 활성 파라미터·데이터 큐레이션·후처리가 실제 체감 성능을 좌우한다는 점을 시사한다.

---

## 3. 영구 가격 인하의 진위 — 사실로 확인

### 3.1 발표의 실체

딥시크는 **2026년 5월 22~23일경 V4-Pro API 가격을 출시가 대비 75% 영구 인하**한다고 공식 발표했으며, DeepSeek API 공식 문서에도 **2026년 5월 31일 이후 V4-Pro의 가격을 원래 가격의 1/4로 영구 조정**한다고 명시되어 있다(*Seeking Alpha, Caixin Global, DeepSeek API Docs*). 이는 **일시 프로모션이 아닌 영구 정책**임이 다중 출처로 교차 확인된다.

### 3.2 경쟁사 대비 가격(100만 토큰 기준)

| 공급자 | 모델 | Input ($/1M) | Output ($/1M) |
|--------|------|--------------|---------------|
| **DeepSeek** | **V4-Pro** | **0.44** (캐시 미스) | **0.87** |
| **DeepSeek** | **V3.2** | **0.28** (캐시 미스, 캐시 히트 0.028) | **0.42** |
| OpenAI | GPT-5.5 | 5.00 | 30.00 |
| OpenAI | GPT-5.4 | 2.50 | 15.00 |
| OpenAI | GPT-5 Mini | 0.25 | 2.00 |
| Anthropic | Claude Opus 4.6 | 5.00 | 25.00 |
| Anthropic | Claude Sonnet 4.6 | 3.00 | 15.00 |
| Anthropic | Claude Haiku 4.5 | 1.00 | 5.00 |
| Google | Gemini 3.1 Pro | 2.00 | 12.00 |
| Google | Gemini 3 Flash | 0.50 | 3.00 |

- **체감 격차**: V4-Pro 입력가는 GPT-5.5의 약 **1/11 수준**, V3.2는 GPT-5.4 대비 **10~35배 저렴**하다(*Crazyrouter, IntuitionLabs*).
- "1달러당 지능량" 환산 시 V4 Pro $268 비용 대비 GPT-5.5는 12배, Claude Opus 4.7은 19배 더 비싸다(*TNW, "DeepSeek made its 75% discount permanent"*).

---

## 4. 딥시크 × 오픈클로(OpenClaw) 통합 사례와 후기

### 4.1 통합 방식

오픈클로는 **사용자 인프라에서 실행되며 사용자 API 키를 사용**하는 에이전트 오케스트레이션 도구로, 딥시크와 자연스럽게 연동된다. 공식적으로 **DeepSeek V3는 OpenClaw Launch로 즉시 배포 가능**하며, **DeepSeek V4는 Claude Code 및 OpenClaw에 원활히 통합**된다고 명시되어 있다(*Use DeepSeek V3 with OpenClaw 문서, OpenClaw DeepSeek Setup 가이드*). OpenRouter 경유 시 별도 API 키 없이도 연동 가능하다.

### 4.2 실사용 후기 요약

- **비용 절감 사례**: 한 사용자는 동일 작업에서 GPT-5.4 대비 **$150 이상 절감**했다고 보고했다(*Medium, "Configuring DeepSeek in OpenClaw"*).
- **에이전트 작업 적합도**: V4 Pro는 **금융·수치 데이터 분석 에이전트**에서 특히 강점을 보인다(*Reddit, "오픈클로를 위한 딥시크"*).
- **하이브리드 라우팅 전략**: 연구·요약 에이전트에는 딥시크, 추론 품질이 결정적인 코딩 에이전트에는 Claude Opus를 사용하는 **모델 라우팅 패턴**이 정착되고 있다.
- **반대 의견**: 코딩 위주 워크플로에서는 DeepSeek V4 Pro의 체감 성능이 가격만큼 매력적이지 않다는 의견도 공존한다.

### 4.3 오픈클로에 적용 가능한 상용 모델·비용

오픈클로는 OpenAI, Anthropic, Google, DeepSeek, MiniMax, Qwen 등 **OpenAI 호환 API를 제공하는 모든 모델**과 연동 가능하다. 동일 워크로드 기준 월간 100만 입력 토큰 + 30만 출력 토큰 소비 시:
- **DeepSeek V4-Pro 약 $0.70**
- **GPT-5 Mini 약 $0.85**
- **Claude Haiku 4.5 약 $2.50**
- **GPT-5.5 약 $14.00**
정도의 비용 차이가 발생하며, 딥시크가 사실상 **상용 API 최저가 구간**을 형성하고 있다.

---

## 5. 커뮤니티 동향과 "무료 오픈클로" 최적 구축법

### 5.1 핵심 트렌드 — 로컬 LLM 자체 호스팅

커뮤니티는 **외부 API 토큰 비용 제로화 + 데이터 주권 확보**를 목적으로 **Ollama / LM Studio / vLLM 기반 로컬 LLM**을 오픈클로에 연결하는 방식을 주류로 채택하고 있다(*YouTube "OpenClaw Free Forever with Local LLM"*, *OpenClaw Docs - Local models*).

### 5.2 권장 스택 (사실상의 베스트 프랙티스)

1. **하드웨어**
   - 최소: **24GB VRAM GPU 1장** (RTX 3090/4090 등) 또는 고급 Mac Studio.
   - 권장: RTX 5070Ti 이상 · Mac Studio 듀얼 구성.
   - 양자화 모델은 컨텍스트 절단·보안 리스크가 있으므로 **풀 모델 사용 권장**.
2. **추론 서버**
   - **초보자**: LM Studio (GUI + 네이티브 Responses API)
   - **CLI/자동화**: Ollama
   - **고성능 서버**: vLLM / SGLang / MLX
3. **OS/네트워크**
   - Windows는 **WSL2**로 리눅스 환경 구성.
   - 외부 노출 시 **Tailscale VPN 또는 리버스 프록시 + HTTPS** 권장.
4. **모델 선택**
   - **DeepSeek V3/V4 distilled, Qwen 3.5, Llama 계열** 중 VRAM에 맞춰 선택.
5. **보안**
   - **VM/컨테이너 격리 실행**, 프롬프트 인젝션 방어, 내부망 한정 운용(*YouTube "Safely Running OpenClaw with Local LLM"*).

### 5.3 비용 대비 효과

전기료 외 추가 비용 없이 **사실상 무료**로 에이전트를 운용 가능하나, 초기 GPU 투자(중고 RTX 3090 기준 약 80만~120만 원)는 필요하다. 월 100만 토큰 이상 사용 시 1~2개월 내 BEP 도달이 일반적이다.

---

## 6. 결론 및 시사점

### 6.1 핵심 결론
1. **딥시크 V4-Pro·V3.2는 MMLU·수학·데이터 분석에서 GPT-4o·Claude 3.5 Sonnet과 대등하거나 우위**이며, 약점은 역사·법률·일부 코딩 영역에 한정된다.
2. **75% 영구 가격 인하는 공식 문서로 확인된 사실**이며, 딥시크는 사실상 **상용 API 최저가 모델**이 되었다.
3. **오픈클로와의 통합은 공식 지원**되며, 비용 절감 효과가 실증되어 있다. 다만 코딩 품질 한계로 **하이브리드 라우팅**이 합리적이다.
4. **무료 운용의 최적해는 Ollama/LM Studio + 로컬 풀모델 + WSL2/VPN** 조합이며, 초기 GPU 투자가 전제된다.

### 6.2 향후 전망
- **AI API 가격 전쟁 가속**: OpenAI·Anthropic·Google도 가격 조정 압박이 불가피하다.
- **하이브리드 AI 아키텍처 표준화**: 비용 효율 모델(딥시크) + 최상위 추론 모델(Claude/GPT) 조합이 표준 패턴이 될 가능성이 크다.
- **로컬 AI 하드웨어 수요 증가**: 24GB+ VRAM GPU 및 NPU 내장 PC 시장이 활성화될 것이다.
- **데이터 주권·보안 논의 확대**: 로컬 LLM 확산은 거버넌스·감사 체계 정비를 요구하게 될 것이다.

### 6.3 추가 검증이 필요한 영역
- DeepSeek V4-Pro의 **장기 안정성·엔터프라이즈 환경 운영 데이터** 부족.
- 딥시크의 **데이터 처리 방침에 대한 독립 감사** 부재.
- 로컬 LLM 운영의 **TCO(총소유비용)** — 전력·유지보수·업데이트 비용 정량 분석 필요.

> 종합하면, 딥시크는 단순한 "저가 모델"이 아니라 **MoE·DSA·GRP 등 아키텍처 혁신을 통해 가격 경쟁력을 구조적으로 확보**한 사례이며, 오픈클로 생태계에서는 **상용 API 최저가 옵션**과 **로컬 LLM의 강력한 후보** 양쪽에서 영향력을 키우고 있다. 단기적으로는 모델 라우팅 전략, 중장기적으로는 로컬 인프라 투자가 합리적 선택지로 보인다.
---

## References

- [and Code](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQF6tV7aaE2FcBsQR-Dqk7TNwxib198g3xGAsWq2u-5roGMY31qfmAXogONmpbQu9VgeoZqUm2AuIzX_v77DoXFDpSfQzM095YNSOi-WA-JogLx7ikfCGiyEx2g0hgTblwVxXKaG5lwVnn2idxkbwZaHyA8G2c44bY8u8S2kBN1PMDX2y1j24xSDTU0Ln6khlY9Hqi9LqjI3k83SAVWacYcmF3gAqo55Ay7rSu8xm0FUluK6_Q==)
- [DeepSeek to make a 75% permanent discount on new V4 Pro AI model - Seeking Alpha](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQGS1yzMjVe3lHctzAhIL4aecv7xzXuI_lMjC7JY-AMo6ybWR9yv3jM_3pnRaw4EBXOOGpNljZvzfUAi1VivsPXMnp6vwsphrBrb4A2UMPaRQ9n1eMRuMMgt_rAJrt1x6oqg66S5Mj1-Q4-tsgGxz9nry8VZ_nMmqw9va-b6BVXXCiVUSxPQ5Ijw7pqAQj-zKxaAScM=)
- [DeepSeekMath-V2 - Medium](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQFrG_nTIvx4QUeiyth4k9GHD2Fqd6--_vl3pJ4h5op1Nn3RZXMmtbhoWSoyfwbtY54pYJSPH-ANUcTLG1aHxfrI0ftzlbSdqR1WXCmw2u2fl4gK_AjSitgSXfceNfaq1EiLo0n0WeGIZ2PyXKJsU1CLIHNOYTMyPTFuxqMaOU7D8Q3mWB2ds3q5OOoPsY8YNX5CGZMVvOrh8Wa5j52v7zjRKZOIkLF0USvnuY0ycWS9U9AcAYsyB2F5NUpqhK6HGPYbLFFZ9KuA19wB4Skic8Nej9PmrBgGA8akN6_2avsvL97XkqnrEAGhS74HoTtEylstGFmZ0vutkX67t6DxD6WiM5-whcvm873e-FUwcvPvoMqQwrKM-P87cl1UaxrS)
- [DeepSeek Cuts Flagship AI Model Prices by 75% - Caixin Global](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQE_RReFigOdHKMCWnA2D8TdiU-2U6O5IKYHsrYBjPqpPjrsQFAg0bxdSzTsccQc6MZgruhLV7W4qW0HchHnveuvuv3C4kysccFf9ZfE-kZIKDcBfWTPp3nomx4cXpfglV7GlZeGr8nazWJ3sXs7p0Xgeto-jUbwHkyjSrJ-l6befZN1S_sE-byiMh4WX_pA2Loo4xMWesMqjwgJFCuOC5yzOFuAUJLA3pNgJvrVENFD-Q5QIlc=)
- [Models & Pricing - DeepSeek API Docs](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQFthg1yDm8jBZ6Ah1dS5SUOjPCtRNOyyJxvo4xBlaoAWjITjEdBSmWjwjkwAzu6RbodaN6G2oCraWD7xQsUyYRaKTWacwup7DaHuNTZLc_l1hinmJ--rYMUQn-SQ6koRyr4mm0bkqoWaBuaFw==)
- [DeepSeek made its 75% discount permanent - TNW](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQFGlwQ2SWrA4dZnZtypPWmyMHswkMQ3nJq4hqDbqjR_QQsds-gqzFBOD_OiFRWNRTS0yiqQPPMTFSvkTDA1fdX4ifgFmC4CyjvyR6S4zP-udq3rKP1ed-BVNG4tDwsgCeyaHpQW3jhADdj0o_IM5I5f0ubrlEhg3TNl_jFYhoDz4QVmpK8=)
- [Use DeepSeek V3 with OpenClaw](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEtGKUW17DtR76PbE0RiOn-2kPEKtyrJ8qMRbjzAaKXO_2dWZbzJogLqZOx3tpLY-TfTs7HgcJ-TQh4Ejg11l3VG4mrma4G-PbNwSc09d0jAZyOHyNlo8yU_76pdCvUFDOYJSXtEff-SbFMf-fk)
- [Local models - OpenClaw Docs](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQF0iAEA0FAsqio84uul5uFzWfcQFw7O5FO8eAqEODn44YIauDKcWRa2pp91CKai0CSgdapYCKPNAiaX7X1vfDWWCXcSQapGjlW0WchVo4V0shKu0-GSOY3ZqbVbXpS_6i4EGNtaYM30)
- [Configuring DeepSeek in OpenClaw - Medium](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQF0E9-6DmXxVwNmtuZKXxq3uKsEYZR1FAzLStXzjP6_dAvlT7nONiPih7zKHYhhDSqpbnH1nzeRw2l6czMMHRyL9Lma6ZrQ_o5etTSLcZ5_AE9O9w2zko2PK7T5kTBBmSdjOn4GB7H-TXE7VT2xde4GU9b_w6GB7IBvv1WfBfooPNzkjeXqpda_h87EGcgcD7ILmCc-VvI=)
- [LLM API Pricing Comparison (2025) - IntuitionLabs](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQHmCuLRCcWbw9JrRjilc60FM4FX20cKT839OkDK_VGdtC6oKatyc_QdKpwCcBfzKn0RJFOMBt-TbjhqBtHyKG9mEjN3qvgztWzH16Ymv7utd5p71EdQ7oSX1evz8V8pPV9VRgJ1M906nvOwcA-wnFEw7LTOMuhB7Z1ziJM=)
- [Safely Running OpenClaw with Local LLM - YouTube](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQHKcFD799bcp7xgz2PC7hjc7ULutb42UNJ0mFOgyC9vL8FoLxtQy1K4lbwFFR9lV4vSHqZuqGBaTuETRVIFe4flKez2j4t1nnMTUivX6PeEZY0v6p2R2710E2A8wfMgQvPYPCVmUg==)
- [OpenClaw Free Forever with Local LLM - YouTube](https://vertexaisearch.cloud.google.com/grounding-api-redirect/AUZIYQEGrhutJ0r-09IIv5xfgQNomIxV7b0t-PFH18qN59AEdv4hgBegYYxT-SV1AJpXkbNEFnX_DgcOo18TsREIN46npoDmdV_2a4QejvWjk_x6Y34CAouB9eQ334caTFKp4CGQ_mKVWQ==)

댓글

이 블로그의 인기 게시물

Vim 9.2 릴리즈 총정리: 더 빠르고 강력해진 텍스트 편집의 제왕

폐쇄망 SoC 설계자를 위한 가볍고 빠른 Vim 최적화 가이드

에이전트 시대를 위한 터미널 cmux 가이드: 설치부터 AI 활용까지