라벨이 AI Agent인 게시물 표시

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리

🚀 구글 안티그래비티(Antigravity) 완전 분석 구글이 2025년 11월 Gemini 3와 함께 공개한 에이전트 퍼스트(agent-first) IDE 안티그래비티는 Claude·GPT·Gemini를 한 도구에서 골라 쓰는 멀티모델 코딩 환경이다. 이 글에서는 ① 지원 모델과 요금제별 사용량의 실체, ② 실사용자 평가, ③ 구글의 방향성, ④ Claude Code와의 비교·연계, ⑤ CLI( agy )로 직접 쓰는 법까지 다섯 갈래를 차례로 정리한다. 자료 간 충돌이 있는 지점은 한쪽으로 단정하지 않고 양쪽을 모두 살려 표기했다. 📅 기준 시점: 2026년 6월 · 프리뷰 단계 정보로 수치는 변동 가능 1. 안티그래비티란 무엇인가 — 기초 정리 안티그래비티는 2025년 7월 구글이 24억 달러 규모 라이선스 계약 으로 영입한 전 Windsurf 팀이 설계를 주도했다. VSCode를 포크한 위에 자율 에이전트 오케스트레이션 계층을 얹은 구조다. 2026년 5월 Google I/O에서 발표된 안티그래비티 2.0 은 데스크탑 앱과 함께 공식 CLI agy 를 처음 공개하며 기존 Gemini CLI의 공식 후계자 자리를 확정했다. 핵심 정체성은 단순 코드 자동완성이 아니라 병렬 에이전트 오케스트레이션 이다. 여러 에이전트가 동시에 — 하나는 API, 하나는 테스트, 또 하나는 프론트엔드 — 작업을 나눠 진행하고, 각 에이전트는 계획·테스트 결과·스크린샷·영상을 담은 Artifact 를 남긴다. "사람이 한 줄씩 승인"하는 방식이 아니라 "에이전트들이 일을 마치고 사람이 사후 검수"하는 모델이다. flowchart TD A([사용자 작업 지시]) --> B[에이전트 A API 구현] A --> C[에이전트 B 테스트 작성] A --> D[에이전트 C UI 생성] B --> E[Artifact 계획·결과·영상] C --> E D --> E...

AI가 마우스를 잡다, Claude Computer Use의 모든 것

🖱️ AI가 마우스를 잡다 — Claude 'Computer Use' 완전 해부 2026.03.24 ・ IT/AI 기술 심층 분석 Anthropic의 Claude가 텍스트 생성을 넘어 마우스 클릭, 키보드 타이핑, 화면 탐색 까지 수행하는 'Computer Use' 기능을 공개했습니다. 인공지능이 운영체제와 직접 상호작용하는 이 기술은 단순 챗봇의 한계를 완전히 뛰어넘는 변곡점으로 평가받고 있습니다. 공식 문서와 최신 업데이트, 커뮤니티 반응까지 종합해 핵심을 정리합니다. 🔍 Computer Use란 무엇인가 📌 핵심 정의 Computer Use는 Claude 모델이 컴퓨터 화면을 실시간으로 보고, 마우스를 움직이며, 키보드를 입력 할 수 있도록 설계된 기능입니다. 기존 AI가 텍스트로만 소통했다면, 이제는 인간처럼 GUI 환경을 직접 조작합니다. 2024년 10월 Claude 3.5 Sonnet과 함께 베타로 첫 공개된 이후, 2026년 3월 현재 Claude Pro 및 Max 구독자 를 대상으로 리서치 프리뷰가 제공되고 있습니다. ⚙️ 작동 원리 — 'Tool Use'의 진화 기존 AI의 '함수 호출(Function Calling)'이 특정 API를 실행하는 수준이었다면, Computer Use는 '컴퓨터 조작 도구' 라는 특수 함수를 모델에 부여한 개념입니다. ▶ 시각적 이해 — 화면 스크린샷을 이미지로 받아 UI 요소(버튼, 입력창, 메뉴)를 식별 ▶ 좌표 계산 — 클릭해야 할 위치의 정확한 픽셀 좌표(x, y)를 산출 ▶ 동적 피드백 루프 — 명령 수행 → 변화된 화면 재확인 → 다음 단계 결정 ▶ 폴백 메커니즘 — Google Calendar, Slack 등 통합 커넥터가 있으면 우선 사용하고, 없으면 화면 제어로 전환 🛠️ 설치 및 기술 사양 — 2026년 최신 기준 💻 접근 방법 — 두 가지 경로 ① 소...

Anthropic Claude Code Channels: 원격 AI 에이전트 제어의 시작

🚀 앤트로픽 '클로드 채널(Claude Code Channels)' 완전 분석 — 터미널을 주머니에 넣다 2026년 3월 20일 · IT/AI 심층 리서치 앤트로픽(Anthropic)이 2026년 3월 20일 전격 발표한 '클로드 코드 채널(Claude Code Channels)' 은 터미널 기반 AI 코딩 에이전트 '클로드 코드(Claude Code)'를 텔레그램, 디스코드, iMessage, 웹훅 등 외부 메시징 플랫폼과 연결하여 원격으로 제어하고 모니터링 할 수 있게 해주는 혁신적 기능입니다. 더 이상 모니터 앞에 앉아 있을 필요 없이, 스마트폰 하나로 AI 에이전트에게 코딩을 지시하고 결과를 받아보는 시대가 열렸습니다. 📌 핵심 요약 — 클로드 채널이란? 한 줄 정의: 로컬 터미널에서 돌아가는 AI 에이전트를 모바일 메신저로 확장하는 '리모컨'이자 '알림 센터' 기술적으로 채널은 MCP(Model Context Protocol) 서버 로, 외부 이벤트를 실행 중인 클로드 코드 세션에 푸시합니다. 클로드는 이벤트를 읽고 동일한 채널을 통해 응답을 되돌려 보내는 양방향 채팅 브릿지 처럼 작동합니다. 🔧 지원 플랫폼 (리서치 프리뷰) ✅ 텔레그램(Telegram) — 공식 플러그인 제공 ✅ 디스코드(Discord) — 공식 플러그인 제공 ✅ iMessage — 실험적 지원 (보안 이슈 주의) ✅ 웹훅(Webhook) — CI/CD, 모니터링 시스템 연동용 ⚡ 왜 만들었나? — 탄생 배경 기존 클로드 코드는 터미널에서만 작동했습니다. 수백 개의 테스트를 돌리거나 대규모 인덱싱 작업을 시킬 때, 개발자는 모니터 앞에서 결과를 멍하니 기다려야 했죠. ▶ 물리적 제약 해소 — 빌드·배포·테스트 중 자리를 비워도 진행 상황을 실시간 수신 ▶ 바이브 코딩(Vibe Coding) 완성 — 이동 중에도 아이디어가 떠오르면 즉시 ...

에이전트 시대를 위한 터미널 cmux 가이드: 설치부터 AI 활용까지

🖥️ 에이전트 시대의 새로운 터미널, cmux 완벽 가이드 AI 에이전트 전용 터미널 멀티플렉서 cmux의 개념, 설치 방법, 사용법, 그리고 iTerm2와의 핵심 차이점까지 한눈에 정리합니다. 최근 AI 에이전트(AI Agents) 기술이 급격히 발전하면서, 개발자들이 터미널을 사용하는 방식도 근본적으로 변화하고 있습니다. 단순한 명령어 입력 도구를 넘어, AI가 코드를 분석하고 실행하며 스스로 문제를 해결하는 환경 이 필요해진 것이죠. 이러한 흐름 속에서 '에이전트 전용 터미널' 이라는 별칭과 함께 등장한 cmux 가 큰 주목을 받고 있습니다. 기존 터미널이 사람이 직접 타이핑하고 결과를 눈으로 확인하는 구조였다면, cmux는 AI가 터미널의 상태를 읽고, 명령을 내리고, 결과를 해석하는 전 과정을 매끄럽게 지원하도록 설계되었습니다. 2026년 현재, Claude Code·Cursor·Codex 같은 코딩 에이전트가 일상 도구가 된 만큼, 이를 뒷받침할 인프라로서 cmux의 가치는 더욱 높아지고 있습니다. 📌 1. cmux란 무엇인가? cmux 는 기본적으로 Terminal Multiplexer의 기능을 수행하지만, 그 중심에는 AI 에이전트와의 협업 이 자리 잡고 있습니다. 기존의 tmux나 screen이 세션 관리와 화면 분할에 집중했다면, cmux는 터미널 내에서 발생하는 모든 텍스트 흐름을 AI가 이해하기 쉬운 구조로 관리합니다. 💡 핵심 철학: Context-Awareness(문맥 인식) cmux는 터미널에서 실행되는 프로세스의 상태, 로그, 출력 결과 등을 지능적으로 캡처하여 AI 모델에 전달하는 브릿지 역할 을 합니다. "이 오류 좀 해결해줘"라고 말했을 때, 현재 터미널에 떠 있는 에러 메시지를 일일이 복사·붙여넣기 할 필요 없이 cmux 환경 자체가 AI의 눈과 귀가 되어줍니다. 전통적인 터미널 워크플로우에서는 에러가 발생하면 개발자가 로그를 읽고, 관련 코드를 찾아...

검색을 넘어 실행으로, 퍼플렉시티 컴퓨터(Perplexity Computer)가 바꾸는 리서치의 미래

🖥️ 퍼플렉시티 컴퓨터(Perplexity Computer) 완벽 정리: 검색을 넘어 실행으로 2026년 AI 에이전트 시대를 여는 혁신 서비스 총정리 AI 커뮤니티와 X(구 트위터)를 뜨겁게 달구고 있는 혁신적인 도구, 퍼플렉시티 컴퓨터(Perplexity Computer) 가 등장했습니다. 단순히 질문에 답하는 챗봇 시대를 지나, 이제 AI가 사용자를 대신해 직접 웹을 탐색하고 정보를 조합하며 복잡한 결과물을 만들어내는 '에이전트 시대' 가 본격적으로 열렸습니다. 이 글에서는 퍼플렉시티 컴퓨터의 핵심 개념부터 실무 활용법까지 빠짐없이 다뤄보겠습니다. 🔍 1. 퍼플렉시티 컴퓨터란 무엇인가? 퍼플렉시티 컴퓨터는 기존 AI 검색 엔진에 브라우징 에이전트 기술 을 결합한 차세대 서비스입니다. 사용자가 복잡한 과업을 던지면, AI가 스스로 여러 탭을 띄워 검색하고, 데이터를 비교하며, 최종적인 보고서나 대시보드 형태의 결과물을 생성합니다. 🎯 핵심 목적 — 단순 정보 전달이 아닌 '작업의 완결' 입니다. 정보를 찾고, 정리하고, 시각화하는 일련의 과정을 자동화하여 사용자의 생산성을 극대화합니다. ⚙️ 작동 방식 — 사용자의 명령을 받으면 AI가 가상 컴퓨터 환경에서 브라우저를 직접 조작하여 실시간 정보를 수집하고 가공합니다. 마치 숙련된 리서처가 여러 창을 오가며 작업하는 모습과 유사합니다. 🚀 2. 왜 열광하는가? 놀라운 효용성 가장 큰 장점은 '다단계 추론과 실행' 입니다. 기존 AI는 한 번의 검색으로 답이 나오지 않는 질문에 취약했지만, 퍼플렉시티 컴퓨터는 여러 단계를 자율적으로 수행합니다. 📊 심층 리서치 자동화 "최근 5년간 삼성전자와 애플의 분기별 영업이익을 표로 정리하고 분석해줘"라고 입력하면, AI가 각 기업의 IR 자료를 직접 찾아 수치를 추출하고 비교 분석표를 만들어냅니다. 📈 실시간 대시보드 생성 웹상에 흩어진 데이터(주...