Devlery
Blog/AI

Sora가 떠난 자리, AI 비디오 시장의 4강 전쟁이 시작됐다

Sora 셧다운 이후 AI 비디오 생성 시장이 품질, 비용, 생태계, 오픈소스 4개 계층으로 재편되고 있습니다. Runway, Kling, Veo, LTX의 포지셔닝과 크리에이터 이동 패턴을 분석합니다.

OpenAI가 Sora 서비스 종료를 발표한 지 일주일이 지났습니다. 일당 최대 $15M 의 인프라 비용을 태우며 전체 수명 기간 수익 $2.1M 을 기록한 "AI 비디오의 대명사"가 사라진 자리에서, 시장은 빠르게 새로운 질서를 만들어가고 있습니다.

흥미로운 건 이 질서가 하나의 승자를 향해 수렴하지 않는다는 점입니다. 대신 4개의 뚜렷한 계층 이 형성되고 있습니다. 프로페셔널 품질 의 Runway Gen-4.5, 비용 효율 의 Kling 3.0, Google 생태계 의 Veo 3.1, 그리고 오픈소스 진영의 LTX-2.3과 Seedance 2.0. 2026년 $946.4M 규모로 추산되는 AI 비디오 생성 시장의 판도가, Sora의 퇴장을 계기로 완전히 재편되는 중입니다.

배경과 맥락: Sora는 왜 무너졌나

Sora의 몰락은 갑작스러운 사건이 아닙니다. 셧다운 발표 훨씬 이전부터 시장은 이미 움직이고 있었습니다.

2025년 9월 출시 직후 App Store 1위를 차지하며 1.5주 만에 100만 다운로드를 달성한 Sora는, 11월 월 330만 다운로드로 정점을 찍었습니다. 하지만 12월부터 딥페이크 논란이 터지며 다운로드가 32% 급감 했고, 2026년 2월에는 시장 점유율이 약 15% 까지 추락했습니다. SimilarWeb 트래픽 기준으로 Grok(약 40%), RunwayML(약 14%)에 이은 2위였지만, 정점 대비 월간 다운로드가 75% 하락한 상태였습니다.

WSJ 조사에 따르면, Sora는 "아무도 쓰지 않는 돈 먹는 하마"였습니다. 일일 운영 비용이 소스에 따라 $1M에서 $15M까지 추산되는 반면, 전체 수명 기간 매출은 $2.1M에 불과했습니다. OpenAI는 결국 로보틱스와 자율 시스템 방향으로 자원을 재배치하기로 결정했습니다.

Disney $1B 딜의 붕괴

Sora 셧다운에서 가장 극적인 장면은 Disney와의 $1B 딜 붕괴입니다. 이 계약은 3년간의 라이선싱 합의로, 사용자가 Disney, Marvel, Pixar, Star Wars 캐릭터 200개 이상 을 활용해 영상을 생성할 수 있도록 하는 것이었습니다. 2025년 12월 체결되었지만, 자금이 교환되기도 전에 무산되었습니다.

더 충격적인 것은 통보 방식이었습니다. Disney는 셧다운 공개 발표 1시간 전 에 통보를 받았습니다. Deadline과 Variety의 보도에 따르면, 이는 양사 관계에 심각한 균열을 남겼습니다. Disney는 이후 CES 2026에서 OpenAI가 아닌 자체 에이전틱 워크플로우를 기반으로 한 광고주 대상 AI 비디오 생성 도구를 발표하며, 독자적인 B2B 방향으로 전환했습니다.

4강 구도 분석: 각자의 전장을 선택하다

Sora가 떠난 자리는 하나의 후계자가 차지하지 않았습니다. 대신 4개의 뚜렷한 계층 이 각자의 강점으로 시장을 나눠 가지는 구조가 형성됐습니다. 이 분화가 단순한 경쟁이 아니라 용도별 분업 이라는 점이 핵심입니다.

품질
Runway Gen-4.5
Elo 1247 · 광고/내러티브
오픈소스
LTX-2.3 / Seedance
Apache 2.0 · 파인튜닝 자유
시장 허브
AI 비디오
시장
비용
Kling 3.0
40% 저렴 · 소셜미디어 대량생산
생태계
Veo 3.1
4K + 네이티브 오디오 · Google 통합

Sora 퇴장 이후 AI 비디오 시장의 4계층 분화

품질의 왕좌: Runway Gen-4.5

프로페셔널 영상 제작 시장에서 Runway Gen-4.5는 명확한 1위 입니다. 현존하는 AI 비디오 모델 중 가장 높은 Elo 레이팅 1247 을 기록하고 있으며, 특히 시간적 일관성(Temporal Consistency)에서 경쟁사를 압도합니다. 다중 샷과 씬 사이에서 캐릭터, 스타일, 물리 법칙의 일관성을 유지하는 능력은 광고와 내러티브 제작에서 결정적인 차이를 만듭니다.

10점 만점 벤치마크에서 제품 광고 9.1점, 내러티브 8.8점, 종합 8.8점 을 기록한 Runway는 "AI로 만든 것 같지 않은 영상"이 필요한 곳에서 독보적입니다. 구독 가격은 Standard $12/월에서 Team $76/월까지이며, API도 공식 제공됩니다.

하지만 약점도 분명합니다. 네이티브 오디오를 지원하지 않아 포스트 프로덕션이 필수이고, 최대 해상도가 1080p 에 머물러 있습니다. 최저 플랜($12/월)으로는 625 크레딧, 즉 25초 분량의 영상 만 생성할 수 있어 진입 장벽이 높습니다. 여기에 2026년 2월 YouTuber Ross Scott이 제기한 YouTube 동영상 무단 스크래핑 저작권 집단소송까지 진행 중입니다.

그럼에도 YouTube 영화 크리에이터와 광고 에이전시들은 Runway로 이동하고 있습니다. 시간적 일관성 이라는 한 가지 강점이 그만큼 압도적이기 때문입니다.

비용의 파괴자: Kling 3.0

Kling 3.0은 완전히 다른 전장을 선택했습니다. "모든 것을 적당히 잘하되, 가격은 확실히 싸게"라는 전략입니다. Kuaishou(쾌수)가 개발한 이 모델은 Sora 대비 40% 저렴한 비용으로 200개 클립(10초 기준) 월 $56~$64 수준의 운영이 가능합니다.

기술적으로도 인상적입니다. 최대 4K 네이티브 해상도, 단일 클립 내 최대 6개 개별 샷 정의가 가능한 멀티샷 생성, 현존 가장 설득력 있는 포토리얼리스틱 인물 생성이 Kling의 핵심 강점입니다. 중국어, 영어, 일본어, 한국어, 스페인어를 지원하는 다국어 오디오도 갖추고 있습니다.

종합 벤치마크 8.4점 은 Runway(8.8점)에는 미치지 못하지만, 어떤 단일 차원에서도 "최악"이 아닌 만능형 포지션을 차지하고 있습니다. 특히 추상/아트 영역에서는 8.5점 으로 Runway(8.4점)를 오히려 앞섭니다.

약점은 15초 이상의 네이티브 생성에서 품질이 저하될 수 있다는 점과, 중국 기업 개발이라는 점에서 오는 데이터 프라이버시 우려입니다. 그러나 소셜 미디어 크리에이터, YouTube Shorts/TikTok/Reels 제작자들에게는 가격 대비 성능이 압도적이어서, Sora 이탈 크리에이터들의 주요 수용처 가 되고 있습니다.

생태계의 거인: Google Veo 3.1

Veo 3.1의 전략은 "기술 스펙으로 승부"가 아닌 "생태계로 잠금" 입니다. Elo 레이팅 1226 으로 Runway에 이은 2위를 기록하고 있지만, Veo의 진짜 무기는 다른 곳에 있습니다.

업계 최초로 대화, 사운드 이펙트, 앰비언트 사운드를 비디오와 단일 패스로 동시 생성 하는 네이티브 오디오 기능은 포스트 프로덕션 워크플로우를 근본적으로 바꿉니다. 4K(3840x2160) 60fps 출력은 방송과 시네마 수준의 해상도를 제공합니다. 여기에 Google Drive, YouTube Studio, Google Ads와의 단일 인증 세션 내 연동 은 이미 Google 워크스페이스를 사용하는 기업에게 강력한 흡인력을 발휘합니다.

그러나 이 생태계 전략에는 비용이 따릅니다. API 가격 Standard $0.40/초 는 경쟁사 대비 월등히 비쌉니다. 200개 클립(10초) 기준 API 비용이 $800 에 달하며, 이는 Kling($56~$64)의 10배가 넘습니다. 전체 기능 접근에는 Gemini Advanced $19.99/월 이상이 필요합니다.

종합 벤치마크 8.0점 은 4강 중 가장 낮지만, 네이티브 오디오가 필요한 YouTube 콘텐츠 제작자와 Google Ads 캠페인을 운영하는 광고주에게는 사실상 유일한 선택지입니다. "기능으로 이기지 못하면 생태계로 잡는다"는 Google의 전통적 전략이 AI 비디오 시장에서도 작동하고 있는 것입니다.

오픈소스의 도전자들: LTX-2.3과 Seedance 2.0

4번째 계층은 전통적인 의미의 "경쟁자"가 아닙니다. 대신 상용 도구의 대안이자, 파인튜닝과 데이터 주권을 원하는 이들의 선택지 로 자리 잡고 있습니다.

Lightricks의 LTX-2.3 은 2026년 3월 5일 출시된 22B 파라미터 DiT 기반 모델로, Apache 2.0 라이선스 아래 연매출 $10M 미만 기업에 상업적 무료 사용을 허용합니다. 최대 4K 50fps, 20초 클립, 네이티브 오디오-비디오 동시 생성이 가능합니다. 재구축된 VAE, 4배 확대된 텍스트 커넥터, LoRA 어댑터 지원 등 기술적 완성도도 높습니다.

ByteDance의 Seedance 2.0 은 2026년 2월 출시되어 업계 최초의 통합 오디오-비디오 동시 생성 아키텍처를 선보였습니다. 텍스트, 최대 9개 이미지, 3개 비디오, 3개 오디오 파일을 멀티모달 입력으로 받을 수 있으며, 8개 이상 언어의 음소 수준 립싱크를 지원합니다. 추상/아트 벤치마크에서 8.2점 을 기록해 이 영역만큼은 Runway(8.4점)에 근접합니다.

오픈소스의 핵심 매력은 경제성 입니다. 셀프 호스팅 GPU 비용 기준 200개 클립(10초) 월 $20~$30 으로, Runway($100)의 1/3, Veo API($800)의 1/27 수준입니다. 월 3,5004,000초(350400개 10초 클립) 이상 생산하는 경우 상용 API 대비 손익분기점을 넘깁니다.

다만 LTX-2.3 풀 모델은 fp16 기준 ~44GB VRAM 이 필요해 48GB 이상 GPU가 필수이며, 양자화 버전을 써야 소비자 GPU로 구동이 가능합니다. Seedance 2.0은 ByteDance 개발이라는 점에서 상용 라이선스 조건의 불명확성이 남아 있습니다.

기술 비교: 숫자로 보는 4강

모델해상도최대 길이오디오핵심 강점가격(초당)
Runway Gen-4.51080p60초Elo 1247 · 시간적 일관성$0.05
Kling 3.04K120초6샷 멀티샷 · 다국어 오디오$0.028–0.10
Veo 3.14K@60fps120초네이티브 오디오 · Google 생태계$0.40
LTX-2.3720p30초Apache 2.0 · LoRA 파인튜닝셀프호스팅
Seedance 2.01080p60초멀티모달 입력 · 8개 언어 립싱크오픈소스

△ 제한적 오디오 지원 · 가격은 API 기준, 셀프호스팅 시 월 $20–30(200클립 기준)

가격 구조의 차이가 특히 극적입니다. 같은 200개 10초 클립을 만드는 데 드는 월 비용이 오픈소스($20~$30)에서 Veo API($800)까지 최대 40배 차이가 납니다. 이는 단순한 가격 경쟁이 아니라, 각 계층이 서로 다른 고객을 타겟으로 한다는 구조적 분화를 보여줍니다.

해상도에서는 Kling과 Veo가 4K 를 제공하는 반면 Runway는 1080p에 머물러 있습니다. 클립 길이에서는 Veo가 60초 로 압도적이고, Kling은 확장 모드로 최대 5분까지 가능합니다. 네이티브 오디오는 Runway를 제외한 나머지 4개 모델이 모두 지원합니다. Elo 레이팅은 Runway(1247)가 Veo(1226)를 21점 차로 앞서고 있습니다.

결국 "최고의 AI 비디오 도구"라는 질문 자체가 무의미해졌습니다. 무엇을 만들고, 얼마를 쓸 수 있고, 어떤 워크플로우에 통합해야 하느냐에 따라 답이 완전히 달라지기 때문입니다.

실무 영향: 크리에이터, 개발자, 광고업계

크리에이터의 대이동

Sora 셧다운 이후 크리에이터들의 이동 패턴이 뚜렷하게 나타나고 있습니다. ScopeWeekly의 보도에 따르면, YouTube 영화 크리에이터 들은 시간적 일관성 때문에 Runway Gen-4.5로, 소셜 미디어 크리에이터 들은 가격과 속도 때문에 Kling 3.0이나 Grok으로, 사운드가 필요한 YouTube 콘텐츠 제작자 들은 Veo 3.1로, 기술 파워유저와 개발자 들은 LTX-2.3이나 Seedance 2.0으로 이동하고 있습니다.

이 분산은 Sora 시대에는 없던 현상입니다. Sora가 "AI 비디오 = 하나의 도구"라는 환상을 만들었다면, 셧다운 이후의 시장은 "용도에 맞는 최적의 도구"를 찾는 방향으로 성숙하고 있습니다.

개발자에게의 의미

개발자 관점에서 가장 중요한 변화는 API 경쟁의 격화 입니다. Runway, Kling, Veo 모두 공식 API를 제공하고 있으며, 개발자가 비디오 생성을 앱에 직접 통합할 수 있습니다. Runway의 Gen-4.5 API는 초당 25 크레딧으로 과금되고, Veo 3.1은 Standard $0.40/초, Fast $0.15/초의 이중 가격 구조를 제공합니다.

오픈소스 진영도 주목할 만합니다. LTX-2.3의 Apache 2.0 라이선스는 커스텀 모델 학습을 합법적이고 실용적으로 만듭니다. ltx-2.3-22b-dev(풀 BF16, 파인튜닝용)와 ltx-2.3-22b-distilled(8스텝 추론, 빠른 생성) 두 가지 변형이 제공되며, LoRA 어댑터를 통한 브랜드 특화 파인튜닝이 가능합니다. 특히 LTX Studio처럼 여러 모델(LTX-2.3, Veo 3.1, Kling, FLUX.2 Pro)을 단일 워크스페이스에서 선택할 수 있는 멀티모델 플랫폼 의 등장은 개발자에게 벤더 종속 없는 유연한 선택지를 제공합니다.

광고업계의 구조적 전환

IAB 조사에 따르면, 2026년까지 비디오 광고의 약 40% 가 생성형 AI를 활용할 것으로 예상됩니다. 광고 바이어의 86% 가 AI를 사용 중이거나 계획 중이라는 수치는 이미 실험 단계를 넘어섰음을 보여줍니다.

할리우드에서는 VFX 비용 20~35% 절감, 현지화 비용 50~70% 절감, 포스트 프로덕션 25~40일 단축이 보고되고 있습니다. McKinsey 분석에 따르면 이는 AI 비디오 도구가 "대체재"가 아니라 "가속기" 로 기능하고 있음을 의미합니다.

86%
광고 바이어
AI 사용 중이거나 도입 계획
40%
2026 비디오 광고
생성형 AI 활용 예상 (IAB)
20–35%
VFX 비용 절감
할리우드 AI 도입 효과
50–70%
현지화 비용 절감
다국어 오디오 자동화 효과
25–40일
포스트프로덕션 단축
McKinsey 분석 기준 · AI 가속기 효과

출처: IAB, McKinsey 분석

커뮤니티 반응: 분노, 체념, 그리고 이동

Reddit: 구독 피로감

r/OpenAI에서 Sora 셧다운 발표 후 분노와 패닉 게시물이 쏟아졌습니다. 가장 많이 반복된 불만은 다음과 같습니다.

"수백 시간을 투자해 Sora와 대화하는 법을 배웠는데, 그걸 다 버리라는 건가."

이 반응의 이면에는 구독 피로감(Subscription Fatigue) 이라는 더 큰 문제가 있습니다. 단일 플랫폼의 종료가 여러 도구로의 분산을 강제하고, 이는 곧 비용 증가로 이어진다는 우려입니다. Sora 하나로 해결하던 것을 이제 Runway + Veo + Kling으로 나눠 써야 한다면, 총비용은 오히려 올라갈 수 있습니다.

X: 극과 극의 반응

X에서의 반응은 극적으로 갈렸습니다. 크리에이터 Kiri(@Kyrannio)는 이렇게 반응했습니다.

"이게 말이 돼요? 여러분이 뭘 버리는 건지 알기나 해요?!?!?! 최소한 오픈소스로 공개라도 해줄 건가요??????"

반면 다른 사용자들은 냉소적이었습니다.

"잘 됐어. AI 영상은 어차피 쓰레기였음." - @videoqueen88

"Grok이 왕이다. Sora는 일주일 재밌었고, 이제 안녕." - @funnymeme_guy

주목할 만한 것은 한 Sora 관련 게시물이 약 50,000 리포스트 를 기록했다는 점입니다. AI 비디오 도구에 대한 수요 자체는 여전히 강력하며, 문제는 Sora라는 특정 제품에 있었지 시장 자체에 있지 않았다는 것을 보여줍니다.

공통 과제: 저작권과 일관성의 벽

4강 체제가 형성되었다고 해서 AI 비디오 시장의 구조적 문제가 해결된 것은 아닙니다.

저작권 리스크 는 업계 전체를 관통합니다. Runway의 YouTube 스크래핑 집단소송은 빙산의 일각입니다. OpenAI, Nvidia, Meta, ByteDance 모두 유사한 소송에 직면해 있으며, 학습 데이터의 법적 정당성이 업계 전체의 구조적 리스크로 남아 있습니다.

장편 일관성 도 풀리지 않은 과제입니다. 30초 이상의 영상에서 캐릭터와 스타일의 일관성을 유지하는 것은 4강 모두에게 여전히 어렵습니다. Runway가 시간적 일관성에서 가장 앞서 있지만, 이마저도 10초 클립 단위의 이야기입니다.

엔터프라이즈 통합 역시 초기 단계입니다. 대부분의 AI 비디오 도구가 아직 독립형이며, Premiere나 DaVinci Resolve 같은 기존 NLE와의 플러그인 통합은 걸음마 수준입니다. Veo의 Google 생태계 통합이 현재까지 가장 진전된 사례이지만, Google 외부 환경에서는 활용이 제한적입니다.

전망: AI 비디오 시장의 다음 단계

Sora의 퇴장이 남긴 가장 큰 교훈은 무엇일까요? "최초"보다 "지속 가능한 비즈니스 모델"이 승리한다 는 것입니다. 가장 유명한 이름, 가장 큰 파트너십, 가장 많은 초기 사용자를 가지고 있어도, 비용 구조가 지속 불가능하면 살아남을 수 없습니다.

향후 AI 비디오 시장은 세 가지 방향으로 진화할 것으로 보입니다.

첫째, 장편 생성 의 도래입니다. 현재 1060초 수준의 클립 생성이 2026년 하반기에는 510분 네이티브 생성으로 확장될 전망입니다. Kling의 확장 모드(최대 5분)가 이 방향의 선두에 있습니다.

둘째, 실시간 생성 입니다. 게임과 라이브 스트리밍에 결합된 실시간 AI 비디오 생성이 차세대 전장이 될 것입니다.

셋째, 인터랙티브 비디오 입니다. 시청자 선택에 따라 분기되는 AI 생성 인터랙티브 콘텐츠는 게임과 영화의 경계를 허물 수 있습니다.

4강 체제는 당분간 유지될 가능성이 높습니다. 각 계층이 서로 다른 고객군을 타겟으로 하고 있어, 직접적인 정면 충돌보다는 자기 영역의 심화 가 경쟁의 주된 형태가 될 것입니다. 품질 계층의 Runway는 4K와 네이티브 오디오를 추가해야 하고, 비용 계층의 Kling은 단일 차원의 "최고"를 만들어야 하며, 생태계 계층의 Veo는 가격을 낮춰야 합니다. 오픈소스 계층은 하드웨어 진입 장벽을 낮추는 것이 과제입니다.

TechCrunch는 Sora의 셧다운을 "AI 비디오의 현실 점검 순간(reality check moment)"이라고 불렀습니다. 이 표현이 정확합니다. 하이프가 걷히고 나서야 진짜 경쟁이 시작된 것입니다. 그리고 그 경쟁은 "누가 가장 화려한 데모를 보여주느냐"가 아니라, "누가 지속 가능한 가치를 가장 효율적으로 전달하느냐" 로 판가름 날 것입니다.

AI 비디오 생성 시장 규모
$946.4M
2024년 시장 규모
CAGR 19.9%
연평균 성장률
2024 — $946.4M
2026 — ~$1.36B (예상)
2028 — ~$1.95B (예상)
2030 — ~$2.8B (예상)

출처: Grand View Research

AI 비디오 시장의 $946.4M 규모는 Sora의 퇴장으로 줄어들지 않습니다. 오히려 더 명확한 구조 위에서 성장할 것입니다. 문제는 그 성장의 과실을 누가 가져가느냐입니다. 지금까지의 흐름을 보면, 답은 "하나의 승자"가 아니라 "각자의 전장에서 이긴 4명"이 될 가능성이 높습니다.