라벨이 Gemma4인 게시물 표시

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

Gemma 4 정체 분석, 로컬 오픈 모델과 클라우드 API의 이중성

🤖 Google Gemma 4 종합 분석 로컬 오픈 모델인가, 클라우드 API인가 — 2026년 4월 공개 이후 한 달간의 데이터 총정리 🧠 Google AI Studio 비율 제한 화면에 Gemma 4 26B / 31B가 노출되어 "Gemma는 로컬 모델 아니었나?"라는 혼란이 커지고 있다. 결론부터 말하자면 Gemma의 본질은 여전히 로컬·오픈 가중치 모델 이며, 다만 Google이 자사 클라우드를 통해 테스트·프로토타이핑용 API 채널 을 추가로 열어둔 것이다. 모델 정체가 바뀐 것이 아니라 접근 채널이 다양해진 셈이다. 🗺️ 1. 질문의 맥락 — 왜 지금 Gemma 4가 화제인가 2026년 4월 2일, Google이 Gemma 4 시리즈를 Apache 2.0 라이선스로 공개하면서 오픈 LLM 진영에 다시 큰 파장이 일었다. 같은 시기 OpenAI GPT-5.5, Anthropic Claude Opus 4.7, Google 자사 Gemini 3.1 Pro까지 거의 동시 출시되며 LLM 시장의 4월은 사상 최대의 격전 분기로 기록됐다. 그 와중에 사용자들이 가장 헷갈려한 지점이 바로 "왜 오픈 모델인 Gemma에 API Rate Limit이 걸려 있나" 라는 의문이다. 정답은 단순하다. 가중치(weights)는 누구나 받아 로컬에서 무제한으로 돌릴 수 있지만, Google이 클라우드 GPU 자원으로 대행 호스팅해주는 채널은 자원 공유 의 영역이기 때문이다. 즉 모델은 "오픈"이고, 채널은 "공유"다. 이 두 개념의 분리를 이해하는 것이 본 보고서의 첫 단추다. 🧩 2. Gemma 4 시리즈 라인업 Gemma 4는 단일 모델이 아니라 기기·용도·성능 등급별 4종 모델 의 집합이다. 모바일 엣지부터 워크스테이션 플래그십까지 폭넓게 커버하며, 모두 동일 Apache 2.0 라이선스를 따라 상업적 사용·재배포·파인튜닝이 자유롭다. 모델 구조 ...

클로드 유료화 넘는 대안, 로컬 LLM 전환 가이드

🧠 로컬 LLM 전환 가속화와 AI 에이전트 동향 심층 리포트 작성일: 2026년 4월 22일 · 싱크탱크 수석 연구원 분석 앤트로픽(Anthropic)이 클로드(Claude) 구독 서비스의 에이전트 연결 제약을 강화 하면서, 개발자 커뮤니티의 중심축이 클라우드 API에서 로컬 LLM(Local Large Language Model)으로 빠르게 이동하고 있습니다. 구글의 Gemma 4, 문샷 AI의 Kimi K2.6 등 오픈 소스 진영의 성능이 폐쇄형 상용 모델에 근접하면서, 비용 효율과 데이터 주권을 동시에 잡으려는 실무 적용이 본격화되는 모습입니다. 📌 왜 지금 '로컬 LLM'인가 로컬 LLM은 클라우드 API를 거치지 않고 사용자의 PC나 자체 서버(On-premise)에서 모델을 직접 실행하는 방식입니다. 과거에는 단순 취미·실험 영역이었지만, 2026년 들어 오픈 모델의 품질이 폭발적으로 올라오면서 실무 에이전트 자동화의 현실적 대안 으로 자리 잡고 있습니다. ▶ 전환을 이끄는 3대 동인 • 비용 절감 : API 호출 비용이 0원. 전기료·감가상각만 부담. 수천 회 호출하는 에이전트 워크로드에서 월 수백 달러 절감. • 데이터 보안 : 민감한 소스 코드, 개인 정보, 내부 문서가 외부 서버로 전송되지 않음. • 오프라인 가용성 : 네트워크 단절·지연 환경에서도 동일한 응답 품질 보장. ▶ 필수 용어 정리 • 양자화(Quantization) : 모델 가중치의 정밀도(bit)를 낮춰 압축하는 기술. 32B 모델도 RTX 4090급 GPU(24GB VRAM)에서 돌릴 수 있게 만듬. • 추론기(Inference Engine) : 로컬에서 모델을 실제로 돌려주는 런타임 소프트웨어. Ollama, LM Studio, vLLM 등. • MoE(Mixture of Experts) : 전체 파라미터 중 일부 '전문가'만 활성화하는 구조. 1조 파라미터라도 실제 계산량은 훨씬 적음. ...