클로드 소넷 4.6 출시, 오퍼스급 성능을 소넷 가격에
앤트로픽이 클로드 소넷 4.6을 출시했다. SWE-bench 79.6%로 오퍼스 4.6에 근접한 성능을 보이면서도 출력 가격은 40% 저렴하다. 코딩, 에이전트, 장문맥 추론까지 전방위 업그레이드된 이번 모델이 AI 시장의 가격 대비 성능 기준을 다시 쓰고 있다.
앤트로픽이 2월 18일 클로드 소넷 4.6을 공식 출시했다. 이번 모델은 코딩, 에이전트 작업, 장문맥 추론 등 거의 모든 영역에서 전작 소넷 4.5를 크게 앞서며, 최상위 모델인 오퍼스 4.6에 근접한 성능을 소넷 가격으로 제공한다. claude.ai와 클로드 코워크에서 무료 및 프로 사용자의 기본 모델로 즉시 설정됐다.
VentureBeat는 이를 'AI 업계의 지각변동적 재가격 사건'이라고 평했다. 오퍼스급 성능을 훨씬 저렴한 가격에 쓸 수 있게 된 것이 시장에 미치는 영향이 그만큼 크다는 의미다.
1. 소넷 4.6 벤치마크, 오퍼스 4.6과 거의 동급
소넷 4.6은 소프트웨어 엔지니어링 벤치마크 SWE-bench Verified에서 79.6%를 기록했다. 오퍼스 4.6의 80.8%와 불과 1.2%p 차이다. 컴퓨터 사용 능력을 측정하는 OSWorld-Verified에서도 72.5%로, 오퍼스 4.6(72.7%)과 사실상 동등한 수치를 보였다.
더 주목할 점은 일부 벤치마크에서 오퍼스를 앞선다는 것이다. 디자인 품질 평가(GDPval-AA)에서 소넷 4.6은 Elo 1633으로 오퍼스 4.6(1606)을 넘었고, 에이전트 금융 분석에서도 63.3% 대 60.1%로 앞섰다. 단순히 '저렴한 대안'이 아니라, 특정 영역에서는 최상위 모델을 능가하는 실력이다.
2. 코딩 AI 성능, 클로드 코드 사용자 70%가 선호
코딩 분야에서의 개선이 특히 두드러진다. 앤트로픽에 따르면 클로드 코드 사용자의 70%가 기존 소넷 4.5보다 소넷 4.6을 선호했고, 59%는 최상위 모델인 오퍼스 4.5보다도 소넷 4.6을 택했다. 코드 생성뿐 아니라 과도한 엔지니어링 감소, 허위 성공 주장 감소, 환각 감소 등 실무에서 체감할 수 있는 개선이 이뤄졌다.
Replit은 '성능 대비 비용 비율이 놀라운 수준'이라고 평했고, Cursor는 '전반적으로 눈에 띄는 개선'을, GitHub는 '복잡한 코드 수정에서 뛰어난 성능'을 확인했다고 밝혔다.
3. 가격과 학습 데이터, 압도적 가성비
소넷 4.6의 기본 가격은 입력 $3/MTok, 출력 $15/MTok으로 소넷 4.5와 동일하다. 200K 토큰을 초과하는 롱 컨텍스트 사용 시에는 입력 $6, 출력 $22.50으로 올라가지만, 배치 API를 활용하면 입력 $1.50, 출력 $7.50까지 낮출 수 있다. 프롬프트 캐싱 읽기는 $0.30/MTok에 불과하다. 오퍼스 4.6(입력 $5, 출력 $25)과 비교하면 기본 출력 기준 40% 저렴하고, 배치 API 기준으로는 70% 저렴하다.
학습 데이터 컷오프도 눈에 띈다. 소넷 4.6의 학습 데이터 컷오프는 2026년 1월로, 오퍼스 4.6보다 더 최신 데이터로 학습됐다. 1M 토큰 컨텍스트 윈도우(베타)도 지원해 대규모 코드베이스나 긴 문서 처리가 가능하다.
마치며: 합리적 가격에 넓어진 선택지
클로드 소넷 4.6은 오퍼스에 근접한 성능을 합리적인 가격과 빠른 속도로 제공한다. 특히 클로드 코드의 차기 기능인 에이전트 팀에 투입하거나, 대규모 코드베이스 분석, 복잡한 에이전트 워크플로우 등 다양한 작업에 활용할 수 있어 실질적인 선택지가 넓어졌다. 비용 부담 없이 높은 성능이 필요한 작업에 소넷 4.6을 우선 투입하고, 필요할 때만 오퍼스를 쓰는 식의 유연한 운용이 가능해진 셈이기에, 유저들에게는 환영받는 업데이트가 될 것으로 보인다.