라벨이 AI Benchmarks인 게시물 표시

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

구글 Gemini 3.1 Pro 롤아웃: 3.0 대비 2배 이상의 추론 성능과 벤치마크 분석

🚀 Gemini 3.1 Pro 전격 공개 — ARC-AGI-2 77.1%, 추론 혁명의 시작 2026년 2월 20일 · AI · Google Gemini · 딥러닝 · 벤치마크 💡 구글이 2026년 2월 19일 최신 플래그십 모델 Gemini 3.1 Pro 를 공개했습니다. ARC-AGI-2에서 77.1%를 기록하며 기존 3.0 Pro(31.1%) 대비 2배 이상의 추론 능력 향상을 달성, AI 업계에 새로운 기준을 제시하고 있습니다. 🧠 1. Gemini 3.1 Pro — 무엇이 달라졌나? Gemini 3.1 Pro의 핵심 키워드는 '심층 추론(Deep Thinking)' 입니다. 기존 3.0 버전이 방대한 지식 요약과 멀티모달 처리에 강점을 보였다면, 이번 3.1 버전은 인간처럼 복잡한 문제를 단계별로 사고하고 해결하는 능력을 비약적으로 끌어올렸습니다. 🤖 에이전트 기능의 완성 단순 답변을 넘어 복잡한 워크플로우를 스스로 설계하고 실행합니다. 금융 데이터 분석, 대규모 스프레드시트 작업에서 Tool Use 정확도가 극대화 되었습니다. 💻 소프트웨어 엔지니어링(SWE) 최적화 실무 환경에서의 코드 수정, 버그 추적, 시스템 설계 능력이 대폭 개선되었습니다. 개발자의 진정한 페어 프로그래밍 파트너로 거듭났습니다. ✅ 토큰 효율성 및 신뢰성 답변 일관성이 크게 향상되었으며, 환각(Hallucination) 현상을 3.0 대비 약 40% 이상 감소 시켜 팩트 기반의 안정적인 결과를 제공합니다. 📊 2. 압도적인 벤치마크 성적표 수치로 확인하는 Gemini 3.1 Pro의 성능은 더욱 인상적입니다. 논리적 사고력의 극한을 테스트하는 ARC-AGI-2 에서 전작 대비 두 배 이상의 점수를 기록했습니다. 벤치마크 Gemini 3.1 Pro Claude Opus 4.6 GPT-5.2 ARC-AGI-2 77.1% 68.8% 52.9% Humanity...