추론, 시각, 코드를 한 몸에 담다: 미스트랄 Small 4의 119B 통합 실험
미스트랄 AI가 질문 답변, 이미지 분석, 코드 작성을 한 모델로 해결하는 미스트랄 Small 4를 무료 공개했다. 거대한 모델이지만 필요한 부분만 골라 쓰는 구조라 가볍고 빠르다. 함께 공개된 코딩 전문 모델은 기존 유료 서비스를 7분의 1 비용으로 대체할 수 있다.
AI 모델 시장에서 효율 중심 전략을 밀어온 미스트랄 AI가 이번에는 판 자체를 바꿨다. 2026년 3월 16일 공개된 미스트랄 Small 4는 논리적 사고를 담당하던 마지스트랄, 이미지를 분석하던 픽스트랄, 코드를 짜던 Devstral을 하나로 합친 모델이다. 총 1,190억 개의 학습된 지식 조각을 품고 있지만, 한 번에 전부 쓰지 않는다. 128명의 전문가 중 질문에 가장 적합한 4명만 골라서 답하는 구조다. 덕분에 실제로 작동하는 부분은 60억 개 수준으로, 거대한 몸집에 비해 놀라울 정도로 가볍고 빠르다.
하나의 모델로 추론하고, 보고, 코드를 짠다. 세 개를 따로 돌릴 이유가 사라졌다.
기존에는 용도별로 모델을 골라 써야 했다. 어려운 논리 문제에는 마지스트랄, 이미지 분석에는 픽스트랄, 코드 생성에는 Devstral. 미스트랄 Small 4는 이 세 가지를 하나로 합쳤다. 추론 강도 설정을 조절하면 생각의 깊이가 달라진다. 간단한 질문에는 가볍게 답하고, 복잡한 수학 문제에는 깊이 생각한다. 하나의 모델로 모든 작업을 처리하겠다는 설계 철학이다.
128개 전문가 중 4개만 깨운다
미스트랄 Small 4의 핵심은 '필요한 전문가만 골라 쓰는 구조'다. 1,190억 개의 지식을 128개 전문가 그룹으로 나눠 놓고, 질문이 들어오면 가장 잘 아는 전문가 4명만 불러서 답하게 한다. 실제로 한 번에 작동하는 부분은 약 60억 개에 불과하다. 모든 지식을 매번 다 꺼내 쓰는 일반 모델보다 연산량이 훨씬 적다.
한 번에 처리할 수 있는 텍스트 양도 파격적이다. 약 25만 토큰, 일반 소설 한 권 분량을 한 세션에서 읽고 분석할 수 있다. 미스트랄 AI에 따르면 전작 미스트랄 Small 3보다 응답 속도는 40% 빨라졌고, 같은 시간에 처리하는 양은 3배 늘었다. 같은 컴퓨터에서 더 빠르게, 더 많이 처리하는 구조다.
벤치마크가 말하는 것, 그리고 말하지 않는 것
미스트랄 AI가 공개한 성능 평가 결과는 인상적이다. 수학 추론 시험에서 비슷한 크기의 경쟁 모델보다 높은 점수를 받으면서도, 답변에 쓰는 글자 수는 20% 적었다. 코딩 능력 평가에서도 비슷한 결과가 나왔다. 같은 답을 더 적은 자원으로 내놓는다는 뜻이다. 빠르고 정확하면서 비용도 적게 드는 모델을 만들겠다는 것이 미스트랄 AI의 목표다.
| 항목 | 수치 |
|---|---|
| 전체 지식 규모 | 1,190억 개 |
| 전문가 수 | 128개 |
| 한 번에 쓰는 전문가 | 4개 (약 60억 개) |
| 한 번에 읽는 텍스트 | 약 25만 토큰 (소설 1권 분량) |
| 라이선스 | 아파치 2.0 (무료, 상업용 가능) |
| 응답 속도 | 전작 대비 40% 빨라짐 |
| 처리량 | 전작 대비 3배 증가 |
다만 회사가 직접 발표한 성적표는 늘 걸러 들어야 한다. 외부 전문가들의 독립 검증이 나오기 전까지는 숫자보다 설계 방향에 주목할 필요가 있다. 기술 블로거 사이먼 윌리슨은 직접 써본 후기에서, 여러 모델을 왔다 갔다 할 필요 없이 하나로 모든 작업을 처리할 수 있다는 편의성에 높은 점수를 줬다.
누구나 가져다 쓸 수 있는 아파치 2.0 라이선스
미스트랄 Small 4는 아파치 2.0 라이선스, 즉 누구나 무료로 쓸 수 있는 완전한 오픈소스로 공개됐다. 회사든 개인이든 자유롭게 내려받아 수정하고 자기 서비스에 넣을 수 있다. AI 모델 공유 플랫폼 허깅 페이스에서 바로 다운로드할 수 있고, 개인 컴퓨터나 자체 서버에서 직접 돌리는 것도 가능하다. 엔비디아와 협력해 모델을 압축한 경량 버전도 동시에 출시했다. 압축 버전은 더 빠르게 작동하면서 메모리를 적게 쓴다.
미스트랄 AI는 처음부터 아파치 2.0 라이선스를 고수해왔다. 메타의 라마 시리즈는 사용에 일부 제한이 있고, 구글 젬마는 연구 목적에 가깝다. 미스트랄은 상업적 사용을 포함한 모든 용도에 제한을 두지 않는다. 클로드, GPT 같은 유료 API 서비스와 달리, 기업이 자기 서버에 올려서 쓸 수 있다는 점이 차별점이다.
Devstral 2, 성능보다 가격으로 승부한다
미스트랄 Small 4와 동시에 발표된 Devstral 2는 코드 작성에 특화된 모델이다. 1,230억 개의 지식을 담고 있으며, 실제 소프트웨어 버그를 고치는 시험에서 72.2%의 성공률을 기록했다. 최상위 유료 모델들이 80% 이상을 기록하는 것에 비하면 성능 자체가 압도적이지는 않다. 하지만 미스트랄 AI가 강조하는 건 가격이다. 앤트로픽의 클로드 소넷 대비 7분의 1 비용으로 비슷한 수준의 결과를 낸다는 것이 핵심 셀링 포인트다.
Devstral Small 2도 함께 나왔다. 240억 개 규모의 경량 버전으로, 개인 컴퓨터의 그래픽카드만으로도 돌릴 수 있다. 비싼 클라우드 서버 없이도 AI 코딩 도우미를 쓸 수 있다는 점에서 개인 개발자와 소규모 팀을 겨냥한다.
성능은 최상위권에 미치지 못하지만, 7분의 1 가격이라면 이야기가 달라진다. Devstral 2의 승부수는 가성비다.
같이 공개된 바이브 CLI는 터미널(명령창)에서 바로 쓸 수 있는 AI 코딩 도우미다. 별도의 개발 도구 설치 없이 명령어 한 줄로 코드를 생성하고 수정한다. 앤트로픽의 클로드 코드, 오픈AI의 코덱스 CLI와 직접 경쟁하는 도구인데, 무료 오픈소스 모델을 기반으로 한다는 점이 다르다.
엔비디아 Nemotron 연합과 오픈 프론티어의 선언
미스트랄 AI는 엔비디아가 이끄는 네모트론 연합의 창립 멤버이기도 하다. 8개 AI 연구소가 힘을 합쳐 최고 수준의 무료 공개 모델을 함께 만드는 프로젝트다. 엔비디아의 초고성능 AI 컴퓨터를 공유하며, 유료 모델만 차지하던 최전선 성능을 무료 모델로 끌어올리겠다는 목표를 내걸었다.
이 연합의 의미는 단순한 협력을 넘어선다. 오픈AI, 앤트로픽, 구글이 유료 모델로 시장을 지배하는 상황에서, 세계 최대 AI 칩 제조사 엔비디아가 무료 공개 진영의 결집을 이끄는 셈이다. 미스트랄 Small 4는 그 첫 번째 성과물 중 하나로 읽힌다.
미스트랄 Small 4가 실전에서 어떤 성능을 보여줄지는 아직 미지수다. 시험 점수와 실전은 다르고, 개발자 커뮤니티의 검증이 쌓여야 진짜 실력이 드러난다. 분명한 건, 사고력과 시각과 코드 작성을 한 몸에 담은 무료 모델이 등장했다는 것이다.