Cursor의 자체 모델은 중국산이었다: Composer 2와 Kimi K2.5 논란의 전말

Cursor가 "자체 개발"로 발표한 Composer 2가 출시 3시간 만에 중국 Moonshot AI의 Kimi K2.5 기반임이 밝혀졌습니다. AI 코딩 도구 시장의 투명성과 미중 AI 지정학 이슈를 분석합니다.

3월 19일, AI 코딩 에디터 Cursor가 자사 첫 번째 자체 개발 모델 Composer 2를 공개했습니다. "프론티어급 코딩 지능(frontier-level coding intelligence)"이라는 수식어와 함께, Anthropic의 Claude Opus 4.6을 벤치마크에서 능가했다는 차트가 공개됐습니다. 가격은 Opus 4.6의 10분의 1. AI 코딩 업계의 판도를 바꿀 만한 발표였습니다.

그런데 3시간 만에 모든 것이 뒤집혔습니다. 한 개발자가 Composer 2의 내부 모델 식별자 kimi-k2p5-rl-0317-s515-fast를 발견한 것입니다. 이 식별자가 가리키는 곳은 Cursor의 자체 연구실이 아니라, 중국 스타트업 Moonshot AI의 오픈소스 모델 Kimi K2.5였습니다.

"자체 개발 모델"이 사실은 중국산 오픈소스 위에 미세조정(fine-tuning)을 얹은 것이었다는 사실은, AI 코딩 도구 시장의 투명성, 오픈소스의 의미, 그리고 미중 AI 경쟁의 복잡한 현실을 동시에 드러냈습니다.

3시간 만의 폭로 — 무슨 일이 있었나

Cursor는 3월 19일 Composer 2를 발표하면서 "최첨단 프로그래밍 지능" 을 강조했습니다. 동시에 공개된 벤치마크에서는 Terminal-Bench 2.0 기준 61.7% 를 기록하며, Claude Opus 4.6(58.0%)를 넘어섰다고 주장했습니다. 가격은 입력 토큰 $0.5/M, 출력 토큰 $2.5/M으로 Opus 4.6($5/$25)의 10분의 1 수준이었습니다.

그러나 출시 당일, X(구 Twitter)의 개발자 @fynnso(Fynn) 가 Composer 2의 API 응답을 분석했습니다. 모델 ID 필드에 kimi-k2p5-rl-0317-s515-fast라는 문자열이 그대로 노출되어 있었습니다. "k2p5"는 Kimi K2.5, "rl"은 강화학습(Reinforcement Learning), "0317"은 3월 17일 학습 완료 날짜로 해석됩니다. Fynn은 이를 근거로 "Composer 2는 결국 Kimi 2.5에 RL을 얹은 것" 이라고 주장했습니다.

🚀

3/19 AMComposer 2 발표

"자체 개발 프론티어급 코딩 모델"로 마케팅

🔍

3/19 PM3시간 만에 폭로

@fynnso가 모델 ID kimi-k2p5-rl-0317-s515-fast 발견

🔥

3/19-20HN·X 논쟁 폭발

Elon Musk "Yeah, it's Kimi 2.5" 확인 사격

💬

3/20Cursor VP 첫 인정

Lee Robinson: "오픈소스 기반에서 시작, 컴퓨팅 3/4은 자체 학습"

✋

3/22공동창업자 공식 인정

Aman Sanger: "Kimi 기반 미언급은 실수"

🤝

3/22Moonshot AI 확인

"Fireworks AI를 통한 공인된 상업적 파트너십"

논란이 확산되자 Cursor의 개발자 교육 VP Lee Robinson이 먼저 입을 열었습니다.

"맞습니다, Composer 2는 오픈소스 기반에서 시작했습니다. 하지만 최종 모델에 투입된 컴퓨팅의 약 1/4만이 기반 모델에서 왔고, 나머지는 우리의 학습에서 나왔습니다."

3월 22일에는 공동창업자 Aman Sanger도 직접 인정했습니다.

"블로그에서 처음부터 Kimi 기반을 언급하지 않은 것은 실수였습니다."

같은 날 Moonshot AI의 공식 X 계정은 Cursor를 축하하며, "Fireworks AI를 통한 공인된 상업적 파트너십의 일환" 으로 Kimi를 사용했다고 확인했습니다. 다만 Moonshot AI 직원들이 초기에 라이선스 위반을 주장하는 트윗을 올렸다가 삭제한 정황도 포착됐습니다.

Kimi K2.5는 어떤 모델인가

이 논란의 중심에 있는 Kimi K2.5는 Moonshot AI가 개발한 오픈소스 코딩 모델입니다. Moonshot AI는 베이징에 본사를 둔 AI 스타트업으로, Alibaba, Tencent, HongShan(구 Sequoia China) 의 투자를 받았습니다.

Kimi K2.5는 수정된 MIT 라이선스로 공개되어 있으며, 핵심 조건은 MAU 1억 명 이상이거나 월 매출 $2,000만 이상인 경우 출처 귀속(attribution)이 필요하다는 것입니다. Cursor의 모회사 Anysphere는 $900M 이상의 ARR과 $10B 이상의 기업가치를 보유한 것으로 알려져 있어, 이 임계값을 넘길 가능성이 높습니다.

Cursor는 Kimi K2.5를 기반으로 자사 사용자 인터랙션 데이터를 활용한 강화학습(RL) 미세조정을 적용했습니다. Lee Robinson이 말한 "컴퓨팅의 3/4이 우리 학습"이라는 주장은, 기반 모델의 가중치를 추가 학습 데이터로 업데이트하는 과정에서의 컴퓨팅을 의미합니다. 하지만 비판자들은 기반 모델 없이는 그 학습 자체가 불가능하다는 점을 지적합니다. 빈 캔버스에 그림을 그린 것이 아니라, 이미 완성된 그림 위에 덧칠한 것이라는 비유입니다.

벤치마크의 함정 — "자체 측정, 자체 발표"

Cursor가 Composer 2의 우수성을 증명하기 위해 제시한 벤치마크도 논란의 대상이 됐습니다.

Terminal-Bench 2.0 성능

⚠️ Cursor 자체 측정 — 독립 검증 없음

GPT-5.4

$2.5 / $15/M75.1%

Composer 2

$0.5 / $2.5/M61.7%

Claude Opus 4.6

$5 / $25/M58%

Composer 2 vs Opus 4.6

1/10

동등 성능 대비

Composer 2 vs GPT-5.4

-13.4%p

Terminal-Bench 2.0

핵심 질문

Kimi K2.5

중국 오픈소스

Terminal-Bench 2.0 기준 Composer 2는 61.7%로 Opus 4.6(58.0%)을 소폭 앞섰지만, OpenAI의 GPT-5.4(75.1%)에는 크게 뒤처졌습니다. 문제는 이 벤치마크가 Cursor 자체 측정이라는 점입니다. 독립적인 제3자 검증 없이, 자사 모델의 우수성을 자사 벤치마크로 증명하는 구조는 본질적으로 이해충돌이 있습니다.

Hacker News의 한 개발자는 이를 이렇게 꼬집었습니다.

"자체 개발 벤치마크로 자체 개발 모델의 우수성을 증명하는 건, 자기가 출제한 시험에서 자기가 1등 했다고 자랑하는 것과 같습니다."

가격 경쟁력은 인상적이었습니다. Opus 4.6 대비 입출력 모두 10분의 1 수준으로, "같은 성능을 10배 저렴하게" 라는 메시지는 강력했습니다. 하지만 이것은 Kimi K2.5가 오픈소스 모델이기 때문에 가능한 구조입니다. Anthropic이 수십억 달러를 투자해 학습한 Opus 4.6의 가격과, 오픈소스 모델 위에 미세조정을 얹은 모델의 가격을 단순 비교하는 것 자체에 대한 비판도 있었습니다.

커뮤니티 반응 — 투명성, 지정학, 그리고 이중잣대

이 사건에 대한 개발자 커뮤니티의 반응은 크게 세 갈래로 나뉘었습니다.

투명성 비판

가장 강력한 비판은 출처 미공개에 대한 것이었습니다. 오픈소스 모델을 사용하는 것 자체는 합법적이고 정당합니다. 문제는 Cursor가 출시 블로그에서 Kimi K2.5를 전혀 언급하지 않았다는 점입니다. "frontier-level coding intelligence"라는 표현은 자체 개발 모델로 오해하기 충분했습니다.

HN의 한 댓글은 이를 이렇게 정리했습니다.

"라이선스를 준수했느냐의 문제가 아닙니다. 당신의 '자체 개발 모델'이 실제로는 다른 회사의 오픈소스 위에 미세조정한 것인데, 그걸 고객에게 알리지 않은 건 신뢰의 문제입니다."

Elon Musk도 이 논란에 뛰어들어 "맞아, 그건 Kimi 2.5야" 라고 확인 사격을 했습니다.

미중 AI 지정학의 아이러니

더 넓은 맥락에서, 이 사건은 미중 AI 경쟁의 이중잣대를 드러냈습니다. 미국 기업과 정치인들은 중국의 AI 기술 복제를 끊임없이 비판해왔습니다. 그런데 실리콘밸리에서 가장 빠르게 성장하는 AI 코딩 도구가 중국 오픈소스 모델 위에 구축되었다는 사실은, "AI 주권"이라는 내러티브의 허점을 그대로 보여줍니다.

Hacker News의 한 관찰자는 이를 이렇게 지적했습니다.

"중국 회사가 미국 모델을 기반으로 제품을 만들면 '기술 절도'라고 하고, 미국 회사가 중국 오픈소스를 기반으로 제품을 만들면 '혁신'이라고 합니다. 오픈소스는 국적이 없어야 하는 것 아닌가요?"

이 논란은 AI 모델의 공급망이 이미 깊이 얽혀 있다는 현실을 보여줍니다. Kimi K2.5는 중국에서 학습됐지만, Fireworks AI(미국)를 통해 상업적으로 배포되고, Cursor(미국)가 미세조정하여 전 세계 개발자에게 제공합니다. AI 모델의 국적을 따지는 것 자체가 점점 무의미해지고 있습니다.

옹호론 — "가치는 통합에 있다"

Cursor를 옹호하는 의견도 상당했습니다. 핵심 논거는 Cursor의 가치는 기반 모델이 아니라 IDE 통합에 있다는 것입니다.

자동완성 모델, 코드베이스 인덱싱, 사용자 인터랙션 데이터 기반 RL 미세조정, 그리고 에디터와의 원활한 통합 — 이 모든 것이 결합되어 Cursor의 제품 경험을 만듭니다. 기반 모델이 Kimi든 LLaMA든, 최종 사용자 경험은 Cursor 팀의 엔지니어링에 달려 있다는 주장입니다.

이 논리는 타당한 면이 있습니다. 스마트폰 제조사가 Qualcomm 칩을 쓴다고 해서 "자체 개발 스마트폰이 아니다"라고 비판하지는 않습니다. 문제는 Cursor가 칩 제조사를 밝히지 않았다는 점이지, 칩을 외부에서 가져왔다는 점 자체는 아닐 수 있습니다.

AI 코딩 도구 시장에 던지는 질문

이 논란은 Cursor 하나의 문제를 넘어, AI 코딩 도구 시장 전체에 구조적 질문을 던집니다.

첫째, 모델 출처 공개의 의무. AI 코딩 도구가 어떤 기반 모델을 사용하는지 사용자에게 알릴 의무가 있을까요? 현재 대부분의 AI 코딩 도구는 모델 스위칭을 자주 합니다. Cursor도 Claude, GPT 등 다양한 모델을 사용해왔습니다. 그런데 자사 모델이라고 마케팅한 것이 사실은 외부 오픈소스 기반이었다면, 이는 소비자 신뢰의 문제입니다.

둘째, 오픈소스 AI의 상업적 활용 경계. Kimi K2.5의 수정 MIT 라이선스는 특정 규모 이상에서 귀속을 요구합니다. 이번 사건에서 Moonshot AI는 "공인된 파트너십"을 확인했지만, 초기에 직원들이 라이선스 위반을 주장했다가 트윗을 삭제한 정황은 내부적으로도 혼선이 있었음을 시사합니다. 오픈소스 AI 모델의 상업적 활용 규칙은 아직 성숙하지 않았습니다.

셋째, "자체 개발"의 정의. 오픈소스 모델에 RL 미세조정을 적용하면 "자체 개발"이라고 할 수 있을까요? Cursor는 컴퓨팅의 3/4이 자체 학습이라고 주장하지만, 기반 모델의 아키텍처와 사전 학습 가중치 없이는 그 학습 자체가 불가능합니다. 이 회색 지대를 업계가 어떻게 정의할 것인지는 아직 합의가 없습니다.

전망 — 모델 출처 투명성의 시대

이 사건이 Cursor의 사업에 미칠 장기적 영향은 제한적일 수 있습니다. 대부분의 개발자에게 중요한 것은 모델이 어디서 왔는가가 아니라 코드를 잘 짜주는가이기 때문입니다. Cursor는 이미 $900M 이상의 ARR과 $10B+ 기업가치를 보유한 시장 리더입니다.

하지만 이 사건은 AI 업계 전체에 하나의 선례를 남겼습니다. AI 제품을 만들 때 기반 모델의 출처를 투명하게 공개하는 것이 단순한 에티켓이 아니라 비즈니스 리스크 관리의 영역이 되었다는 것입니다.

앞으로 예상되는 변화는 다음과 같습니다.

모델 카드(Model Card)의 의무화. 이미 EU AI Act는 고위험 AI 시스템에 대한 투명성 요구사항을 강화하고 있습니다. AI 코딩 도구가 어떤 기반 모델을 사용하고, 어떤 데이터로 미세조정했는지를 공개하는 모델 카드가 업계 표준이 될 수 있습니다.

오픈소스 AI 라이선스의 정교화. Kimi K2.5의 "매출 임계값 기반 귀속 요구"는 앞으로 더 많은 오픈소스 AI 모델이 채택할 가능성이 높은 모델입니다. 순수한 MIT 라이선스보다는 상업적 활용에 대한 가드레일을 두는 방향으로 진화할 것입니다.

미중 AI 공급망의 불가분성. 정치인들이 아무리 "AI 디커플링"을 외쳐도, 기술적 현실에서 AI 모델의 공급망은 이미 깊이 얽혀 있습니다. 중국의 오픈소스 모델은 글로벌 AI 생태계의 핵심 인프라가 되어가고 있으며, 이를 무시하는 정책은 실효성을 잃을 수밖에 없습니다.

Cursor의 Composer 2 논란은 "누가 AI를 만들었는가"라는 질문이 점점 복잡해지고 있음을 보여줍니다. 오픈소스 모델 위에 미세조정을 얹고, 그 위에 제품 경험을 쌓는 시대에, 투명성은 선택이 아니라 필수입니다. 적어도 3시간 만에 들통날 일이라면, 처음부터 솔직한 편이 나았을 것입니다.