AI 에이전트 팀: 코딩 AI가 팀을 짜서 협업하는 시대

AI2026년 2월 15일

AI가 혼자 코딩하던 시대는 끝났다. Claude Code의 Agent Teams 기능은 여러 AI 에이전트가 팀 리더 아래 역할을 분담하고 서로 대화하며 병렬로 작업하는 새로운 패러다임을 제시한다. 16개 에이전트로 C 컴파일러를 만든 실제 사례까지, AI 협업의 현주소를 분석한다.

AI가 코드를 작성하는 건 이제 새삼스러운 일이 아니다. 하지만 AI 여러 대가 팀을 이뤄 서로 대화하면서 하나의 프로젝트를 완성한다면 어떨까. Anthropic이 Claude Code v2.1.32에서 공개한 Agent Teams는 바로 그 가능성을 현실로 보여준다. 여러 Claude Code 인스턴스가 팀 리더 아래 역할을 분담하고, 공유 태스크 리스트로 작업을 조율하며, 팀원끼리 직접 메시지를 주고받는 구조다.

이번 기사에서는 Agent Teams의 구조와 작동 원리를 살펴보고, 실제로 16개 에이전트가 C 컴파일러를 만들어낸 사례, 그리고 경쟁 도구들과의 차이점까지 분석해본다.

1. Agent Teams 아키텍처: AI끼리 팀을 짜는 구조

Claude Code Agent Teams 아키텍처 다이어그램 - 서브에이전트와 에이전트 팀 비교 — 서브에이전트와 Agent Teams의 아키텍처 비교 (Anthropic 공식 문서)

Agent Teams의 핵심은 네 가지 구성 요소에 있다. 먼저 팀 리더(Team Lead)는 메인 Claude Code 세션으로, 팀을 생성하고 팀원을 스폰(spawn)하며 작업을 분배한다. 팀원(Teammates)은 각각 독립적인 Claude Code 인스턴스로 할당된 태스크를 수행한다. 공유 태스크 리스트(Task List)는 pending, in_progress, completed 세 가지 상태로 작업 진행을 추적하며, 메일박스(Mailbox)는 에이전트 간 메시징을 담당한다.

기존 서브에이전트(Subagent)와 결정적으로 다른 점은 통신 구조다. 서브에이전트는 메인 에이전트에게만 결과를 보고할 수 있었다. Agent Teams에서는 팀원끼리 직접 대화(P2P 메시징)가 가능하다. 프론트엔드 담당 에이전트가 백엔드 담당 에이전트에게 "이 API 응답 형식이 맞아?"라고 직접 물어볼 수 있다는 뜻이다.

2. 서브에이전트 vs Agent Teams: 언제 어떤 것을 쓸까

Agent Teams가 서브에이전트의 완전한 상위 호환은 아니다. 두 방식은 용도가 다르다.

서브에이전트는 단일 세션 안에서 동작하며 결과만 메인에게 돌려보내면 되는 집중적 작업에 적합하다. 토큰 비용도 낮다. 반면 Agent Teams는 팀원 간 토론과 협업이 필요한 복잡한 작업에 빛을 발한다. 코드 리뷰에서 보안, 성능, 테스트 커버리지를 각각 다른 에이전트가 동시에 점검하거나, 디버깅 시 여러 가설을 에이전트끼리 논쟁하며 검증하는 식이다.

서브에이전트 vs Agent Teams 비교

항목	서브에이전트	Agent Teams
통신	메인에게만 보고	팀원 간 직접 대화
조율	메인이 전체 관리	공유 태스크 리스트
컨텍스트	결과 요약 반환	독립 컨텍스트 윈도우
적합 용도	단순 위임, 집중 작업	토론/협업 필요한 복잡한 작업
토큰 비용	낮음	높음 (인스턴스 수만큼)

3. 실전 사례: 16개 AI가 C 컴파일러를 만들었다

Nicholas Carlini의 Claude Code Agent Teams C 컴파일러 프로젝트 Anthropic 블로그 — Anthropic 엔지니어링 블로그 - Agent Teams로 C 컴파일러 구축 사례

Agent Teams의 가능성을 가장 극적으로 보여준 건 Anthropic Safeguards 팀 연구원 Nicholas Carlini의 프로젝트다. 그는 16개 에이전트를 동시에 투입해 Rust 기반 C 컴파일러를 처음부터(from scratch) 만들어냈다.

약 2주간 진행된 이 프로젝트에서 약 2,000개의 Claude Code 세션이 실행됐고, API 비용은 약 2만 달러(약 2,900만 원)가 들었다. 결과물은 10만 줄의 코드로, Linux 6.9 커널을 x86, ARM, RISC-V 세 아키텍처에서 컴파일하는 데 성공했다. GCC torture test 통과율은 99%에 달한다.

이 사례가 주목받는 이유는 단순히 "AI가 코드를 많이 썼다"가 아니다. 여러 AI가 역할을 나눠 병렬로 작업하고, 서로의 결과물을 통합하며, 충돌 없이 하나의 완성된 소프트웨어를 만들어냈다는 점이 핵심이다.

4. 커스텀 에이전트: 나만의 AI 팀 설계

Agent Teams의 진정한 힘은 커스텀 에이전트에서 나온다. 개발자는 .claude/agents/ 디렉토리에 마크다운 파일로 각 에이전트의 역할, 도구 접근 권한, 사용 모델 등을 정의할 수 있다. 예를 들어 "보안 리뷰어"는 코드를 읽기만 하고 수정은 금지, "프론트엔드 개발자"는 특정 디렉토리만 수정 가능, "유틸리티"는 빌드와 배포만 담당하는 식으로 역할을 분리할 수 있다.

Delegate 모드를 활성화하면 팀 리더가 직접 코딩하지 않고 조율에만 집중하도록 강제할 수도 있다. Plan Approval 기능은 팀원이 작업 전 계획을 세우고 리더의 승인을 받아야만 실행에 들어가도록 제한한다. 이런 가드레일 덕분에 복잡한 프로젝트에서도 통제된 병렬 작업이 가능해진다.

5. 경쟁 도구와의 차별점: AI 코딩 에이전트 비교

AI 코딩 에이전트 시장이 빠르게 달아오르고 있다. Claude Code Agent Teams는 이 경쟁 속에서 어떤 위치를 차지하고 있을까.

Devin은 완전 자율 에이전트를 지향하지만, 사용자가 실시간으로 개입하기 어렵다. OpenAI Codex는 여러 에이전트를 병렬로 실행할 수 있지만, 에이전트 간 직접 통신은 지원하지 않는다. Cursor의 Background Agents 역시 여러 작업을 병렬로 돌릴 수 있지만 에이전트 간 통신 기능이 빠져 있다.

Agent Teams의 핵심 차별점은 두 가지다. 첫째, 에이전트 간 P2P 직접 통신으로 실시간 협업이 가능하다. 둘째, 공유 태스크 리스트와 의존성 관리로 복잡한 워크플로우를 구조적으로 조율할 수 있다. 하지만 토큰 소비가 높아 비용 부담이 크다는 점은 현실적인 진입 장벽이다.

AI 코딩 에이전트 비교

도구	멀티 에이전트	에이전트 간 통신	특징
Claude Code Agent Teams	O	P2P 직접 대화	공유 태스크 리스트, 커스텀 역할
Devin	X (단일)	해당 없음	완전 자율, 사용자 개입 어려움
OpenAI Codex	O (병렬)	X	병렬 실행, worktree 격리, 에이전트 간 통신 없음
Cursor Background Agents	O (병렬)	X	병렬 실행 가능, 상호 통신 없음

6. 커뮤니티 반응: AI 개발팀의 CEO가 된 기분

개발자 커뮤니티의 반응은 흥미와 경계가 공존한다. Reddit에서 185개 이상의 upvote를 받은 관련 게시글에는 "AI 개발팀의 CEO가 된 기분"이라는 비유가 등장했다. 실제로 팀 리더에게 자연어로 지시하고, 각 팀원의 진행 상황을 모니터링하며, 필요할 때 개입하는 워크플로우는 팀 매니저의 업무와 흡사하다.

한편 비용에 대한 우려도 크다. 각 팀원이 독립적인 Claude 인스턴스이므로 토큰 소비가 팀원 수에 비례해 증가한다. 커뮤니티에서는 리뷰, 리서치 같은 읽기 중심 작업에서 가장 효과적이라는 공감대가 형성되고 있다.

7. 현재 한계와 발전 방향

Agent Teams는 현재 리서치 프리뷰 상태이며 알려진 제한 사항이 있다. 세션을 재개(resume)하면 기존 팀원이 복원되지 않는다. 세션당 하나의 팀만 운영할 수 있고, 중첩 팀은 불가능하다. 팀원이 자신의 팀을 만드는 것도 허용되지 않는다.

v2.1.32에서 처음 등장한 이후 빠르게 업데이트되고 있다. v2.1.33에서 TeammateIdle과 TaskCompleted 훅이 추가됐고, v2.1.36에서는 Opus 4.6 Fast 모드가 도입돼 응답 속도가 개선됐다. Anthropic이 이 기능을 얼마나 빠르게 정식 출시할지가 향후 관건이 될 것이다.

마치며: AI 협업의 새로운 규칙

Agent Teams는 AI 코딩 도구의 패러다임이 "더 똑똑한 하나"에서 "협업하는 여럿"으로 전환되고 있음을 보여준다. 16개 AI가 컴파일러를 만들고, 5개 AI가 디버깅을 두고 토론하며, 3개 AI가 코드 리뷰를 동시에 진행하는 세계. 이건 SF가 아니라 지금 터미널에서 일어나고 있는 일이다.

물론 높은 토큰 비용과 실험적 상태라는 제약이 있지만, 방향성만큼은 명확하다. 개발자의 역할은 코드를 직접 작성하는 것에서 AI 팀을 설계하고 조율하는 것으로 이동하고 있다. Agent Teams는 그 미래의 가장 구체적인 프로토타입이다.

참고 자료

‹ 이전 목록 다음 ›