AI 하네스란? 모델보다 중요한 능동형 에이전트의 골격

- 5월 09, 2026

🤖 AI 하네스(Harness)란? 모델보다 중요한 능동형 에이전트의 골격

정의 · 아키텍처 논쟁 · Claude 기반 구축 전략 종합 가이드

📌 핵심 요약 — 'AI 하네스'는 단순 멀티 에이전트 병렬 처리가 아닌, "구조화된 자율성을 갖춘 유기적 협업 시스템"으로 수렴하고 있습니다. 모델(두뇌)을 실세계 행동으로 변환하는 소프트웨어 외골격이며, SWE-bench 33.4% → 80.9% 도약의 상당 부분이 모델 체급이 아닌 하네스 설계 진보에서 비롯됐습니다.

1️⃣ 질문의 재구성: 두 개의 하네스, 두 개의 아키텍처

사용자가 던진 질문은 두 층위로 나뉩니다. 첫째, 'AI 하네스'라는 용어의 실체. 둘째, 그것이 단순 멀티 에이전트 병렬 처리인지, 아니면 사람처럼 의견을 주고받는 능동적 협업체인지의 구분입니다.

결론부터 말씀드리면 두 방식은 모두 하네스의 한 형태이지만, 2025년 현재 업계 담론은 후자, 즉 "구조화된 자율성(Structured Autonomy)을 갖춘 유기적 협업 시스템"으로 빠르게 수렴하고 있습니다. Anthropic의 엔지니어링 블로그가 이를 명시적으로 다루며, 단순 파이프라인을 넘어선 동적 협업 패턴이 표준 레퍼런스가 되고 있습니다.

⚠️ 용어 혼선 주의 — '평가 하네스(lm-evaluation-harness 류)'와 '운영 하네스(Agent Harness)'는 별개입니다. 본 보고서는 LLM의 추론을 실세계 행동으로 변환하는 운영/실행 하네스에 집중합니다.

2️⃣ 하네스의 본질: "Agent = Model + Harness"

Anthropic을 비롯한 프런티어 랩에서 통용되는 공식은 명료합니다.

🧠 에이전트 = 모델(두뇌) + 하네스(신경계와 신체)

▶ 모델(Brain): Claude Opus/Sonnet 같은 LLM 자체. 추론과 언어 생성을 담당.
▶ 하네스(Body & Nervous System): 모델이 외부 세계와 접촉하기 위한 모든 제어층.

🔧 하네스의 4대 구성 요소 — 시스템 도식

특히 주목할 것은 샌드박싱(Docker 격리), 도구 추상화, Artifact 기반 상태 인계가 2025년 표준 컴포넌트로 자리 잡았다는 점입니다. 이 4개 구성요소는 독립적으로 진화하면서도 모델 코어를 중심으로 통합 동작합니다.

3️⃣ 단순 병렬화 vs 유기적 능동 협업 — 무엇이 맞는가?

이 두 방식은 분산 시스템 설계의 고전 패턴인 오케스트레이션(Orchestration) vs 코레오그래피(Choreography)의 AI 버전입니다.

구분	⚙️ 단순 병렬화 (Orchestration)	🌐 유기적 협업 (Choreography)
제어 방식	중앙 컨트롤러가 작업 분배	공용 Blackboard로 자율 협업
예측 가능성	사전 정의 경로, 높음	동적 의사결정, 낮음
피드백 루프	없거나 약함	분석가 → 비평가 → 재분석
강점 영역	반복 작업, 정형 처리	복잡 · 창의 · 비정형 과제
약점	예외 · 창의에 취약	디버깅 어려움, 비용 폭주

📈 SWE-bench Verified — 하네스 진보가 만든 도약

Anthropic은 동일 벤치마크에서 모델 세대 교체와 하네스 설계 개선을 병행하며 점수를 극적으로 끌어올렸습니다. 핵심은 모델 자체가 아니라 str_replace_editor 부분 수정 도구, Extended Thinking, 멀티 에이전트 오케스트레이션 같은 하네스 컴포넌트에 있었습니다.

Claude 3.5 Sonnet (Original)

33.4%

Claude 3.5 Sonnet (Upgraded)

49.0%

Claude 3.7 Sonnet

70.3%

Claude 4.5 Opus

80.9%

Source: Anthropic Blog & SWE-bench Leaderboard, 2024.10–2025.02

✅ 결론: 직관하신 "여러 에이전트가 유기적으로 의견을 주고받는 형태"가 현재의 정통 노선이며, 단순 병렬화는 그 하위 케이스로 포함됩니다. 정답은 유기적 협업을 골격으로 하되, 필요할 때 병렬화를 동원하는 하이브리드입니다.

4️⃣ 왜 하네스가 결정적인가 — 영향과 효용

🟢 1. 모델의 한계 극복

200k 컨텍스트도 장시간 작업에는 부족. 하네스가 작업을 쪼개 각 단계에서 추론 품질을 보존합니다.

🟢 2. 신뢰성의 비약

'작성 에이전트 + 비평 에이전트' 구조가 환각을 자가 치유(Self-healing)합니다. 동일 입력에 대한 응답 안정성이 통계적으로 향상됩니다.

🟢 3. 도구 사용의 정밀도

부분 수정 도구 도입만으로 성능 20%+ 향상이 보고됨 (Anthropic). 파일 전체 재작성 대비 토큰 효율도 큰 폭으로 개선됩니다.

🟢 4. 장시간 자율 작업 가능

Artifact + Session Reset 기법으로 1~2시간 이상 작업이 표준화됨. SWE 에이전트는 밤새 PR 검토와 패치 작성을 수행하는 단계까지 진입했습니다.

5️⃣ Claude 사용자를 위한 하네스 구축 6단계

실무 적용 순서를 단계별로 정리하면 다음과 같습니다. 각 단계는 누적 적용을 권장하며, 1~3단계만으로도 의미 있는 자동화가 가능합니다.

1단계

MCP 연결

2단계

아키텍처

3단계

2단계 Agent

4단계

정밀 편집

5단계

세션 리셋

6단계

HITL

🔌 1단계 — MCP(Model Context Protocol)로 시작

Anthropic이 표준화한 하네스 통로입니다. Google Drive, Slack, GitHub, 로컬 파일시스템 등을 표준 인터페이스로 연결할 수 있습니다. 자체 connector 코드를 짜기 전에 MCP 서버 생태계부터 활용하는 것이 권장 경로입니다(modelcontextprotocol.io).

🏗️ 2단계 — 아키텍처 선택

도구	강점	추천 케이스
LangGraph	순환 · 조건부 분기 그래프	비평 루프, 자가 치유
CrewAI	역할 기반 협업	분석가/비평가/실행가 페르소나
자체 구현	완전 통제, 도메인 최적화	SWE-bench 스타일 코딩 에이전트

🎭 3단계 — "Initializer-Coder" 2단계 오케스트레이션

▶ Initializer Agent: 코드베이스를 훑고 todo.md 같은 설계 Artifact 생성.
▶ Coder Agent: Artifact만 보고 한 번에 한 항목씩 구현 · 테스트.
효과: 전체 맥락 압도로 인한 추론 오류 차단.

🔬 4단계 — Surgical Edit 도구 설계

파일 전체 재작성 금지. view(라인 범위 조회) + str_replace(정밀 치환) 조합을 채택해야 합니다. Anthropic 내부 SWE-bench 스캐폴딩의 핵심 비결로 알려져 있습니다.

♻️ 5단계 — 컨텍스트 리셋과 Handoff

1~2시간 작업 후 컨텍스트 오염이 발생합니다. Handoff Artifact로 성공한 테스트, 수정 파일 목록, 미해결 이슈를 요약본으로 박제하고, Session Reset으로 하네스가 대화 기록을 비우고 요약본만 재주입해 새 세션을 시작합니다 — 2025년 표준 패턴입니다.

👤 6단계 — Human-in-the-Loop(HITL)

비용 발생, 외부 영향, 최종 승인 시점에 사람 개입 지점을 삽입합니다. Claude의 XML 태깅 <approval_required> 으로 승인 구간을 명시할 수 있습니다.

6️⃣ 반드시 알아야 할 한계와 리스크 (2025 기준)

⚠️ 리스크	설명	🛡️ 대응
Context Anxiety	컨텍스트 한계에 가까울수록 모델이 조기 종료하거나 방어적으로 변함	사전 리셋, 진전도 체크
Circular Chatting	멀티 에이전트가 서로 책임 전가하며 토큰만 소모	최대 회차 캡, 진전 없음 감지 시 강제 종료
Handoff Amnesia	세션 리셋 시 요약본 부실로 결정이 뒤집힘	Artifact 스키마 정형화, 핵심 결정 별도 보존
비용 폭주	능동형 루프는 토큰 소모가 기하급수	Guardrail에 달러 · 토큰 한도 하드 캡

7️⃣ 종합 시사점

🧠 한 줄 요약

하네스는 AI를 챗봇에서 동료(직원)로 격상시키는 인프라입니다. 모델 체급보다 하네스 설계 역량이 결과를 결정한다는 사실이 SWE-bench의 30%대 → 80%대 도약으로 증명됐습니다.

💼 Claude 유저 실행 로드맵

▶ MCP로 도구를 표준 연결
▶ LangGraph 또는 CrewAI로 다중 역할 · 피드백 루프 설계
▶ Surgical Edit + Initializer-Coder 패턴 이식
▶ Artifact 기반 Session Reset으로 장기 작업 안정화
▶ HITL과 Guardrail로 비용 · 안전 통제

향후에는 하네스 자체를 AI가 동적으로 생성 · 최적화하는 'Self-optimizing Harness'가 등장할 것으로 전망되며, 이 분야의 시스템 아키텍처 역량이 곧 AI 활용 격차를 만들 것입니다. 단순히 더 큰 모델을 기다리기보다, 지금 손에 있는 모델을 더 잘 부리는 외골격을 짜는 것이 ROI 측면에서 압도적으로 유리한 시점입니다.

📚 References

▶ Anthropic MCP Documentation — Model Context Protocol 공식 문서

▶ Anthropic Engineering Blog — Building Effective Agents

▶ SWE-bench Leaderboard — 코딩 에이전트 표준 벤치마크

▶ LangChain Agentic Workflows — LangGraph 기반 워크플로우 가이드

▶ CrewAI Framework Guide — 역할 기반 멀티 에이전트 프레임워크

⚠️ 면책 조항: 본 콘텐츠는 기술 동향 및 시스템 설계에 관한 정보 제공 목적으로 작성되었으며, 투자 권유나 재무 자문이 아닙니다. AI 도구를 활용한 자동화 시스템 구축 시 발생하는 비용 · 보안 · 규제 리스크는 사용자 책임이며, 프로덕션 도입 전 충분한 검증과 거버넌스 절차를 거치시기 바랍니다.

📄 Raw Data

# AI 하네스(Harness)란 무엇인가 — 정의, 아키텍처 논쟁, 그리고 Claude 기반 구축 전략

## 1. 질문의 재구성: 두 개의 하네스, 두 개의 아키텍처
사용자께서 던진 질문은 두 층위로 나뉩니다. 첫째, 'AI 하네스'라는 용어의 실체. 둘째, 그것이 **단순 멀티 에이전트 병렬 처리**인지, 아니면 **사람처럼 의견을 주고받는 능동적 협업체**인지의 구분. 결론부터 말씀드리면 두 방식은 모두 하네스의 한 형태이지만, 2025년 현재 업계 담론은 후자, 즉 **"구조화된 자율성(Structured Autonomy)을 갖춘 유기적 협업 시스템"**으로 빠르게 수렴하고 있습니다 (Anthropic Engineering Blog).

업계 용어 혼선도 정리해야 합니다. '평가 하네스(lm-evaluation-harness 류)'와 '운영 하네스(Agent Harness)'는 별개입니다. 본 보고서는 사용자 의도에 부합하는 **운영/실행 하네스**, 즉 LLM의 추론을 실세계의 행동으로 변환하는 **소프트웨어 외골격(Scaffolding)**에 집중합니다.

---

## 2. 하네스의 본질: "Agent = Model + Harness"
Anthropic을 비롯한 프런티어 랩에서 통용되는 공식은 명료합니다.

> **에이전트 = 모델(두뇌) + 하네스(신경계와 신체)**

- **모델(Brain):** Claude Opus/Sonnet 같은 LLM 자체. 추론과 언어 생성을 담당.
- **하네스(Body & Nervous System):** 모델이 외부 세계와 접촉하기 위한 모든 제어층.

### 2.1 하네스의 4대 구성 요소
| 구성 요소 | 역할 |
|---|---|
| **Orchestrator** | 작업 흐름 제어, 다음 행동 결정 |
| **Tooling Interface** | bash, Python, 파일 편집기, 브라우저, API 등 도구 노출 |
| **State Management** | 단기/장기 메모리, 중간 산출물(Artifact) 저장 |
| **Guardrails** | 비용·안전·시간 한도 감시, 무한루프 차단 |

특히 주목할 것은 **샌드박싱(Docker 격리), 도구 추상화, Artifact 기반 상태 인계**가 2025년 표준 컴포넌트로 자리 잡았다는 점입니다 (Anthropic Technical Paper).

---

## 3. 단순 병렬화 vs 유기적 능동 협업 — 무엇이 맞는가?

이 두 방식은 분산 시스템 설계의 고전 패턴인 **오케스트레이션(Orchestration) vs 코레오그래피(Choreography)**의 AI 버전입니다.

### 3.1 단순 병렬화 (Static Pipeline / Orchestration)
- 중앙 컨트롤러가 작업을 잘게 쪼개 워커 에이전트에게 분배.
- 경로가 사전 정의되어 있고 예측 가능성이 높음.
- 단점: 예외 상황과 창의적 문제에 취약.

### 3.2 유기적 능동 협업 (Choreography / Autonomous Collaboration)
- 에이전트들이 공통 목표 아래 **공용 게시판(Blackboard)**과 **통신 규약**을 통해 자율적으로 의견 교환.
- "분석가가 결론을 내면 비평가가 검토 → 수정 요청 → 재분석"의 **피드백 루프**가 살아 있음.
- 사람의 협업과 가장 유사하며, 복잡·창의적 과제에 강함.

### 3.3 그래서 정답은?
하네스는 **두 패턴 모두를 포괄하는 메타 구조**입니다. 다만 최근 2년간의 흐름은 명확합니다.

- Anthropic은 SWE-bench Verified에서 Claude 3.5 Sonnet(Original) 33.4% → Claude 3.5 Sonnet(Upgraded) 49.0% → Claude 3.7 Sonnet 70.3% → Claude 4.5 Opus 80.9%로 점수를 끌어올렸으며, 이 도약의 상당 부분이 **모델 체급이 아니라 하네스 설계의 진보**에서 나왔습니다 (Anthropic Blog & SWE-bench Leaderboard, 2024.10–2025.02).
- 핵심은 `str_replace_editor` 같은 **부분 수정 도구**, **Extended Thinking 블록 강제**, **멀티 에이전트 오케스트레이션 기본 탑재**처럼 "행동 전 사고하고, 사고 결과를 도구로 정확히 변환"하는 능동적 구조.

따라서 사용자께서 직관하신 **"여러 에이전트가 유기적으로 의견을 주고받는 형태"**가 현재의 정통 노선이며, 단순 병렬화는 그 하위 케이스로 포함됩니다.

---

## 4. 왜 하네스가 결정적인가 — 영향과 효용

1. **모델의 한계 극복:** 200k 컨텍스트도 장시간 작업에는 부족. 하네스가 작업을 쪼개 각 단계에서 추론 품질을 보존.
2. **신뢰성의 비약:** '작성 에이전트 + 비평 에이전트' 구조가 환각을 자가 치유(Self-healing).
3. **도구 사용의 정밀도:** 부분 수정 도구 도입만으로 성능 20%+ 향상이 보고됨 (Anthropic).
4. **장시간 자율 작업 가능:** Artifact + Session Reset 기법으로 1~2시간 이상 작업이 표준화됨.

---

## 5. Claude 사용자를 위한 하네스 구축 전략

### 5.1 1단계 — MCP(Model Context Protocol)로 시작
- Anthropic이 표준화한 **하네스 통로**. Google Drive, Slack, GitHub, 로컬 파일시스템 등을 표준 인터페이스로 연결.
- 자체 connector 코드를 짜기 전에 **MCP 서버 생태계부터 활용**할 것 (modelcontextprotocol.io).

### 5.2 2단계 — 아키텍처 선택
| 도구 | 강점 | 추천 케이스 |
|---|---|---|
| **LangGraph** | 순환·조건부 분기 그래프 | 비평 루프, 자가 치유 |
| **CrewAI** | 역할 기반 협업 | 분석가/비평가/실행가 페르소나 |
| **자체 구현** | 완전 통제 | SWE-bench 스타일 코딩 에이전트 |

### 5.3 3단계 — "Initializer-Coder" 2단계 오케스트레이션
- **Initializer Agent**: 코드베이스를 훑고 `todo.md` 같은 설계 Artifact 생성.
- **Coder Agent**: Artifact만 보고 한 번에 한 항목씩 구현·테스트.
- 효과: 전체 맥락 압도로 인한 추론 오류 차단.

### 5.4 4단계 — Surgical Edit 도구 설계
- 파일 전체 재작성 금지. `view`(라인 범위 조회) + `str_replace`(정밀 치환) 조합 채택.
- Anthropic 내부 SWE-bench 스캐폴딩의 핵심 비결.

### 5.5 5단계 — 컨텍스트 리셋과 Handoff
- 1~2시간 작업 후 **컨텍스트 오염** 발생.
- **Handoff Artifact**: 성공한 테스트, 수정 파일 목록, 미해결 이슈를 요약본으로 박제.
- **Session Reset**: 하네스가 대화 기록을 비우고 요약본만 재주입해 새 세션 시작 — 2025년 표준.

### 5.6 6단계 — Human-in-the-Loop(HITL)
- 비용 발생, 외부 영향, 최종 승인 시점에 사람 개입 지점 삽입.
- Claude의 XML 태깅(`<approval_required>...</approval_required>`)으로 승인 구간을 명시.

---

## 6. 반드시 알아야 할 한계와 리스크 (2025 기준)

| 리스크 | 설명 | 대응 |
|---|---|---|
| **Context Anxiety** | 컨텍스트 한계에 가까울수록 모델이 조기 종료하거나 방어적으로 변함 (Anthropic Technical Paper) | 사전 리셋, 진전도 체크 |
| **Circular Chatting** | 멀티 에이전트가 서로 책임 전가하며 토큰만 소모 | 최대 회차 캡, '진전 없음' 감지 시 강제 종료 |
| **Handoff Amnesia** | 세션 리셋 시 요약본 부실로 결정이 뒤집힘 | Artifact 스키마 정형화, 핵심 결정 별도 보존 |
| **비용 폭주** | 능동형 루프는 토큰 소모가 기하급수 | Guardrail에 달러·토큰 한도 하드 캡 |

---

## 7. 종합 시사점

하네스는 **AI를 챗봇에서 동료(직원)로 격상시키는 인프라**입니다. 사용자께서 직관하신 두 가지 구도 — 병렬화 vs 유기적 협업 — 중 정답은 **"유기적 협업을 골격으로 하되, 필요할 때 병렬화를 동원하는 하이브리드"**입니다. 핵심 진리는 "모델 체급보다 **하네스 설계 역량**이 결과를 결정한다"는 것이며, SWE-bench의 30%대 → 80%대 도약이 이를 증명합니다.

Claude 유저로서 가장 빠른 길은 다음과 같습니다.

1. **MCP**로 도구를 표준 연결.
2. **LangGraph 또는 CrewAI**로 다중 역할·피드백 루프 설계.
3. **Surgical Edit + Initializer-Coder** 패턴 이식.
4. **Artifact-기반 Session Reset**으로 장기 작업 안정화.
5. **HITL과 Guardrail**로 비용·안전 통제.

향후에는 하네스 자체를 AI가 동적으로 생성·최적화하는 **'Self-optimizing Harness'**가 등장할 것으로 전망되며, 이 분야의 시스템 아키텍처 역량이 곧 AI 활용 격차를 만들 것입니다.
---

## References

- [Anthropic MCP Documentation](https://modelcontextprotocol.io)
- [Anthropic Engineering Blog (Building Effective Agents)](https://www.anthropic.com/research/building-effective-agents)
- [SWE-bench Leaderboard](https://www.swebench.com)
- [LangChain Agentic Workflows](https://blog.langchain.dev/agentic-workflows)
- [CrewAI Framework Guide](https://docs.crewai.com)

이 블로그 검색

Brave Ogu

구글 안티그래비티 완전 분석 — 모델·요금제·CLI 총정리