AI 증류 논란: 중국은 정말 미국 AI를 '훔쳤'나
앤트로픽과 OpenAI가 잇따라 중국 AI 기업들의 대규모 '증류 공격'을 폭로했다. 2만 개 이상의 사기 계정, 1,600만 건의 데이터 교환, 수출 금지 위반 칩 사용까지. AI 패권 경쟁이 기술 분쟁을 넘어 안보 문제로 번지고 있다.
2026년 2월, AI 업계를 뒤흔드는 폭로가 연쇄적으로 터졌다. OpenAI는 미 하원 중국특별위원회에 딥시크의 '조직적 무임승차'를 공식 고발했고, 앤트로픽은 딥시크, 문샷AI, 미니맥스 등 중국 AI 기업 3곳이 자사 모델 클로드를 대규모로 증류했다는 증거를 공개했다. '지식 증류'라는 기술적 용어 뒤에는 2만 개가 넘는 사기 계정, 1,600만 건이 넘는 데이터 교환, 그리고 수출 금지 칩의 불법 사용이라는 충격적 실태가 숨어 있었다.
1. 지식 증류란: AI가 AI를 '베끼는' 방법
지식 증류(Knowledge Distillation)는 대형 AI 모델의 출력을 활용해 소형 모델을 훈련시키는 기법이다. 원래는 합법적인 기계학습 기술이지만, 문제는 타사의 상용 모델을 무단으로 대규모 증류할 때 발생한다. 경쟁사의 API에 수만 개의 프롬프트를 보내고, 돌아오는 응답을 수집해 자체 모델의 훈련 데이터로 사용하는 방식이다.
이번에 드러난 사건의 규모는 개인적인 스크래핑 수준을 훨씬 넘어선다. 앤트로픽에 따르면 약 24,000개의 사기 계정이 동원됐고, 총 1,600만 건 이상의 질의-응답 교환이 이루어졌다. 딥시크는 약 15만 건, 문샷AI는 340만 건, 미니맥스는 무려 1,300만 건에 달하는 증류를 수행한 것으로 파악됐다.
2. 히드라 클러스터: 조직적 증류 공격의 실체
앤트로픽이 밝힌 증류 공격의 수법은 놀라울 정도로 정교했다. '히드라 클러스터'로 명명된 프록시 네트워크는 2만 개 이상의 사기 계정을 동시에 관리하며 탐지를 회피했다. 계정 하나가 차단되면 즉시 새 계정이 가동되는 구조로, 마치 히드라의 머리처럼 잘라도 다시 자라나는 형태였다.
OpenAI 역시 유사한 수법을 확인했다. 딥시크 직원들이 '난독화된 서드파티 라우터'를 통해 접근 제한을 우회하고 있었다는 것이다. 특히 주목할 만한 건 딥시크가 클로드에게 보낸 프롬프트의 내용이다. '완성된 응답 뒤에 숨겨진 내부 추론 과정을 상상하고, 단계별로 작성하라'는 요청이었다. 이를 통해 연쇄적 사고(Chain-of-Thought) 훈련 데이터를 대규모로 생성한 것으로 분석됐다.
미니맥스의 행태도 눈길을 끈다. 앤트로픽이 새로운 모델을 출시하면 24시간 이내에 전체 트래픽의 절반을 해당 모델로 전환해 집중 증류를 시작했다고 한다. 최신 모델의 성능을 최대한 빠르게 흡수하겠다는 의도가 노골적으로 드러난 셈이다.
3. 수출 금지 위반: 엔비디아 블랙웰 칩 논란
증류 논란에 이어 더욱 심각한 문제가 수면 위로 올라왔다. 로이터 통신은 2월 24일 딥시크가 엔비디아의 최신 블랙웰 칩으로 AI 모델을 훈련했다고 보도했다. 블랙웰은 미국 정부가 중국 수출을 금지한 고성능 AI 칩이다. 딥시크가 어떤 경로로 이 칩을 확보했는지는 아직 밝혀지지 않았지만, 수출 통제의 실효성에 근본적인 의문이 제기되고 있다.
사실 칩 수출 정책 자체도 논란이었다. 2025년 12월 트럼프 행정부는 중국에 엔비디아 H200 칩의 판매를 허용하는 결정을 내렸고, 이에 대해 의회 매파들은 강하게 비판한 바 있다. 기술 봉쇄와 시장 이익 사이에서 줄타기하는 미국의 딜레마가 여실히 드러난 대목이다.
4. 미국 정부와 업계의 대응: 법안과 공식 고발
미국 측의 대응은 빠르게 확대되고 있다. NASA는 딥시크를 차단했고, 뉴욕주는 정부 기기에서의 사용을 금지했다. 미 하원에서는 '정부 기기 딥시크 금지법(No DeepSeek on Government Devices Act)'이 발의됐다.
OpenAI는 2026년 2월 미 하원 중국특별위원회에 메모를 제출하며 딥시크의 '조직적 무임승차'를 공식 고발했다. 백악관 AI 고문 데이비드 색스는 "딥시크가 OpenAI에서 지식 증류를 했다는 상당한 증거가 있다"고 밝혔고, 물레나르 중국특별위 위원장은 이를 "CCP의 플레이북: 훔치고, 복사하고, 죽여라"라고 규정했다.
앤트로픽은 안보 차원의 우려까지 제기했다. 불법으로 증류된 모델은 원본 모델의 안전장치를 유지할 가능성이 낮다는 것이다. 즉 유해 콘텐츠 차단, 편향 방지 등의 안전 기능이 증류 과정에서 제거되거나 약화될 수 있다는 경고다.
5. 중국의 입장과 아이러니한 법적 지형
딥시크는 이번 논란에 대해 공식 논평을 거부했다. 중국 대사관은 '이데올로기적 선 긋기'에 반대한다는 성명만 발표했을 뿐, 구체적인 반박은 내놓지 않았다.
흥미로운 것은 이 분쟁의 법적 아이러니다. OpenAI 자체가 뉴욕타임스로부터 저작권 침해 소송을 당하면서 '공정 사용(Fair Use)'을 항변으로 내세우고 있다. 웹에서 수집한 데이터로 모델을 훈련시키는 것이 공정 사용이라면, 다른 AI의 출력을 훈련 데이터로 사용하는 것은 왜 다른가? CrowdStrike 공동창업자 드미트리 알페로비치는 "이제 (증류가) 사실로 확인되었다"고 말했지만, 법적 경계선은 여전히 모호하다.
마치며: 기술 패권과 윤리 사이의 줄타기
AI 증류 논란은 단순한 기술 분쟁을 넘어 미중 기술 패권 경쟁의 최전선이 되었다. 한편에서는 수천억 달러를 투자해 기반 모델을 개발하고, 다른 편에서는 그 성과를 사실상 무임승차로 활용한다는 구도다. 그러나 '공정 사용'의 경계가 모호한 AI 산업에서, 누가 진정한 혁신자이고 누가 모방자인지를 가르는 일은 간단하지 않다.
확실한 것은, 이 논란이 AI 업계의 게임 규칙을 바꾸고 있다는 점이다. 탐지 시스템 강화, 수출 통제 재정비, 새로운 지적재산권 프레임워크 논의 등이 동시다발로 진행되고 있다. 기술 패권과 윤리 사이에서 업계가 어떤 균형점을 찾을지, 그 결과가 향후 AI 발전의 방향을 결정할 것이다.
- Reuters - OpenAI says China's DeepSeek trained its AI by distilling US models
- TechCrunch - Anthropic accuses Chinese AI labs of mining Claude
- Anthropic Blog - Detecting and preventing distillation attacks
- Reuters - DeepSeek trained AI model on Nvidia's Blackwell despite US ban
- BBC - OpenAI says Chinese rivals using its work for their AI apps