Devlery
Blog/AI

50억 달러 TPU 클라우드, Google이 빌린 Blackstone의 지갑

Google과 Blackstone의 TPU 클라우드 합작은 AI 컴퓨트가 클라우드 기능에서 자본 조달 상품으로 분리되는 신호입니다.

50억 달러 TPU 클라우드, Google이 빌린 Blackstone의 지갑
AI 요약
  • 무슨 일: Google과 Blackstone이 TPU 전용 클라우드 합작사를 세웁니다.
    • Blackstone은 초기 50억 달러를 넣고, 첫 목표는 2027년 500MW 용량입니다.
  • 의미: TPU가 Google Cloud 내부 기능을 넘어 별도 compute-as-a-service 상품으로 분리됩니다.
  • 개발자 영향: 모델·에이전트 팀의 조달 기준이 토큰 가격에서 전력, 위치, 칩, 계약 구조까지 넓어집니다.
  • 주의점: 500MW는 계획이고, 실제 가격·지역·가용성·Google Cloud와의 경계는 아직 공개되지 않았습니다.

Google이 TPU를 더 많이 팔기 위해 새로운 클라우드 회사를 만듭니다. 다만 이번에는 Google Cloud의 새 리전이나 새 인스턴스 타입 발표가 아닙니다. Blackstone이 초기 50억 달러를 넣고, Google이 TPU와 소프트웨어, 서비스를 공급하며, 미국 기반 합작사가 2027년 첫 500MW 용량을 온라인화한다는 구조입니다. 공식 발표의 표현은 "고객에게 Cloud TPU 접근 경로를 하나 더 제공한다"에 가깝지만, 실제로 흥미로운 지점은 다른 데 있습니다. AI 인프라가 점점 클라우드 제품이 아니라 자본, 전력, 데이터센터 운영, 칩 공급을 묶은 금융화된 용량 상품으로 분리되고 있습니다.

이 뉴스가 개발자에게 멀어 보일 수 있습니다. 50억 달러, 500MW, 대체투자 운용사, 데이터센터 합작사 같은 단어는 모델 API를 붙이는 팀의 일상과 거리가 있어 보입니다. 하지만 에이전트와 대형 추론 워크로드를 운영하는 팀이라면 이야기가 달라집니다. 앞으로 AI 제품의 병목은 "어떤 모델이 제일 똑똑한가"만이 아니라 "그 모델을 충분히 빠르고 예측 가능한 가격에, 필요한 지역에서, 필요한 기간 동안 쓸 수 있는가"로 이동합니다. 이번 합작은 그 병목을 누가 어떻게 자본화하려는지 보여주는 신호입니다.

Google이 공개한 TPU 8t와 TPU 8i 공식 이미지

발표의 뼈대는 단순하지만 구조는 낯섭니다

Google의 공식 글은 짧습니다. Blackstone이 Google과 조인트벤처를 만들어 새로운 TPU 클라우드를 세우고, 고객에게 Cloud TPU 접근 방식의 선택지를 늘린다는 내용입니다. Blackstone은 2027년에 예상 500MW 용량을 온라인화하기 위해 초기 50억 달러 지분 투자를 하며, Google은 TPU, 소프트웨어, 서비스를 공급합니다. Blackstone 발표문은 이를 조금 더 선명하게 설명합니다. 새 회사는 데이터센터 용량, 운영, 네트워킹, Google Cloud의 Tensor Processing Units를 compute-as-a-service로 제공합니다.

숫자가 먼저 눈에 들어옵니다. 50억 달러는 실험비가 아니라 인프라 회사의 첫 자본금에 가깝습니다. 500MW도 단순한 서버 증설이 아닙니다. AI 데이터센터에서 전력은 곧 공급 한도입니다. GPU나 TPU를 살 수 있어도 전력 계약, 변전, 냉각, 랙 설계, 네트워크, 운영 인력이 맞물리지 않으면 용량은 실제 서비스가 되지 않습니다. Google은 칩과 소프트웨어 스택을 제공하고, Blackstone은 자본과 디지털 인프라 운영 경험을 제공합니다. 그래서 이번 발표는 칩 공급 계약과 데이터센터 투자, 클라우드 상품 출시가 한 문장 안에 들어간 모양입니다.

리더십도 메시지가 있습니다. 새 회사의 CEO로 지명된 Benjamin Treynor Sloss는 Google 인프라와 운영을 20년 이상 맡아온 인물입니다. Google SRE 문화와 대규모 운영을 상징하는 이름에 가깝습니다. 이는 합작사가 단순한 임대 데이터센터가 아니라 Google식 TPU 운영을 외부화한 별도 공급 채널로 설계될 가능성을 시사합니다. Google Cloud의 기존 고객이 TPU를 쓰는 방식은 그대로 남고, 여기에 대규모 AI 워크로드용 별도 조달 경로가 추가되는 셈입니다.

구분기존 Google Cloud TPUGoogle-Blackstone TPU 클라우드
접근 경로Google Cloud 안의 TPU 서비스별도 미국 기반 compute-as-a-service 회사
자본 구조Google의 클라우드 투자와 운영Blackstone 초기 50억 달러 지분 투자
공개 목표리전·제품별 확장2027년 첫 500MW 용량 온라인
핵심 질문어떤 인스턴스를 어떤 가격에 쓸 것인가누가 장기 용량과 전력 리스크를 떠안을 것인가

왜 Google은 직접 하지 않을까요

커뮤니티에서 가장 먼저 나온 질문도 이것입니다. Google은 이미 세계 최고 수준의 데이터센터 운영자이고, TPU를 직접 설계하며, Google Cloud라는 판매 채널도 갖고 있습니다. 그런데 왜 Blackstone과 새 회사를 만들까요. Reddit r/Bard와 r/ValueInvesting의 반응은 대체로 이 질문에 집중됐습니다. 한 사용자는 "왜 Google이 직접 하지 않고 Blackstone을 끌어들이는가"라고 물었고, 다른 사용자는 Blackstone이 데이터센터 건설 비용을 대고 Google이 칩을 제공하는 구조로 보인다고 해석했습니다.

가장 현실적인 답은 자본 지출의 형태입니다. AI 인프라는 너무 빨리 커지고 있습니다. 자체 클라우드 리전에 모든 수요를 흡수하려면 Google은 칩뿐 아니라 토지, 전력, 냉각, 건설, 네트워크, 운영비를 더 크게 떠안아야 합니다. 반대로 합작사는 외부 자본을 끌어와 TPU 수요를 확장하고, Google은 칩과 소프트웨어 공급자로서 시장을 키울 수 있습니다. Google 입장에서는 TPU 생태계가 넓어질수록 NVIDIA 중심 GPU 클라우드와 다른 선택지를 만들 수 있습니다. Blackstone 입장에서는 AI 데이터센터라는 장기 인프라 자산에 Google TPU라는 차별화된 수요 기반을 붙일 수 있습니다.

물론 이것이 Google의 비용을 완전히 없앤다는 뜻은 아닙니다. Google은 하드웨어와 소프트웨어, 기술 전문성을 공급해야 하고, TPU 생태계의 안정성도 책임져야 합니다. 새 회사가 Google Cloud의 고객 경험과 얼마나 가까운지, 가격 체계가 어떻게 다른지, Google이 어느 정도의 장기 구매 또는 공급 의무를 갖는지는 발표문만으로 알 수 없습니다. 바로 그 불확실성 때문에 이번 구조가 더 중요합니다. AI 컴퓨트의 경쟁은 이제 모델 회사의 성능표만으로 설명되지 않고, 대차대조표와 전력 계약의 문제로 들어가고 있습니다.

TPU 8t와 8i 발표의 후속편입니다

이번 합작을 이해하려면 한 달 전 Google Cloud Next의 TPU 발표를 함께 봐야 합니다. Google은 2026년 4월 TPU 8t와 TPU 8i를 소개했습니다. TPU 8t는 학습용, TPU 8i는 추론용으로 나뉩니다. Google은 자율 에이전트가 추론, 계획, 여러 단계의 실행을 빠르게 처리해야 하며, TPU 8i가 그런 사용자 경험을 겨냥한다고 설명했습니다. TPU 8t는 거대한 메모리 풀 위에서 복잡한 모델 학습을 돌리는 쪽에 초점을 둡니다.

이 분리는 단순한 제품 라인업 정리가 아닙니다. 에이전트 시대의 비용 구조를 반영합니다. 이전의 AI 인프라 논의는 대체로 대형 모델을 학습하는 데 필요한 GPU 클러스터에 집중됐습니다. 하지만 실제 제품에서는 추론이 장기 비용을 지배할 수 있습니다. 특히 에이전트는 한 번의 질문에 답하는 대신 검색하고, 코드를 실행하고, 도구를 호출하고, 실패하면 다시 계획합니다. 사용자가 보기에는 하나의 요청이지만 내부에서는 많은 단계의 추론과 상태 관리가 이어집니다. 따라서 학습용 칩과 추론용 칩을 분리하고, 이를 대규모 클라우드 용량으로 파는 전략은 에이전트 워크로드의 현실과 맞닿아 있습니다.

Google이 TPU를 Gemini와 자체 제품에만 쓰지 않고 외부 시장의 독립 용량으로 밀어내려는 이유도 여기에 있습니다. 모델 회사, AI 네이티브 스타트업, 금융권, 고성능 컴퓨팅 팀은 모두 같은 질문을 합니다. "NVIDIA GPU만으로 충분한가", "가격 대비 성능과 전력 효율은 어떤가", "장기 용량을 확보할 수 있는가", "특정 클라우드에 너무 깊게 묶이지 않을 수 있는가"입니다. TPU 클라우드 합작사는 이 질문에 Google식 답을 제시하려는 시도입니다.

$5B
Blackstone 초기 지분 투자
500MW
2027년 첫 온라인 목표 용량
2
TPU 접근 경로: Google Cloud와 합작사

GPU 클라우드 전쟁의 TPU 버전

CIO Dive는 이번 합작을 네오클라우드 흐름과 연결해 봤습니다. CoreWeave, Nebius, Akamai 같은 AI 전용 클라우드 사업자들이 GPU 공급 부족과 생성형 AI 수요를 배경으로 커졌고, 이제 Google과 Blackstone이 TPU 버전의 compute-as-a-service 회사를 만드는 셈입니다. Synergy Research Group 자료를 인용한 보도에 따르면 네오클라우드는 전체 클라우드 시장에서는 아직 작은 비중이지만 AI 집중 영역에서는 더 큰 존재감을 보이고 있습니다.

이 비교는 유용하지만 완전히 같지는 않습니다. CoreWeave류 사업자는 NVIDIA GPU 공급과 클라우드 운영 역량을 결합해 시장을 만들었습니다. Google-Blackstone 합작사는 칩 설계자가 직접 참여합니다. TPU는 범용 GPU가 아니라 Google 소프트웨어 스택과 밀접하게 맞물린 가속기입니다. 따라서 고객에게는 더 나은 효율과 통합을 줄 수 있지만, 동시에 생태계 선택의 폭을 좁힐 수 있습니다. CUDA 중심 생태계에 익숙한 팀이 TPU로 옮기려면 프레임워크, 모델 포팅, 커널, 관측성, 디버깅, 운영 인력의 숙련도까지 다시 계산해야 합니다.

그렇다고 TPU가 낯선 실험이라는 뜻은 아닙니다. Google은 TPU가 10년 이상 생산 환경에서 쓰였고, Gemini와 Google의 AI 제품을 구동한다고 강조합니다. 문제는 내부 대규모 운영 경험을 외부 고객이 얼마나 매끄럽게 소비할 수 있느냐입니다. Google Cloud 안에서는 Vertex AI, GKE, Cloud TPU 같은 기존 제품 경계가 있습니다. 별도 합작사에서는 계약, 지원, 네트워크 연결, 데이터 위치, 보안 통제, 장애 대응 경계가 새로 정의돼야 합니다. 개발자와 플랫폼 팀에게 중요한 것은 칩 이름보다 이 운영 경계입니다.

개발자 팀이 봐야 할 세 가지 변화

첫째, 장기 용량 계약이 제품 설계의 일부가 됩니다. AI 앱을 만드는 팀은 지금도 모델별 가격과 rate limit을 봅니다. 그러나 에이전트형 제품은 사용량이 훨씬 덜 예측 가능합니다. 고객 한 명의 요청이 수십 번의 도구 호출과 긴 추론 루프로 커질 수 있습니다. 대기업이나 AI 네이티브 스타트업은 단순 종량제가 아니라 장기 용량, 전용 클러스터, 지역별 전력 안정성, 특정 칩 세대 보장을 묻기 시작합니다. TPU 클라우드는 이런 조달 대화를 API 가격표 바깥으로 끌어냅니다.

둘째, 칩 선택이 모델 선택과 더 가까워집니다. 특정 모델이 특정 가속기에서 더 싸고 빠르게 돌면, 모델 라우팅은 "품질 점수"만으로 결정되지 않습니다. Gemini 계열이나 JAX, XLA, TPU 최적화가 잘 된 워크로드는 TPU 쪽에서 이점을 가질 수 있습니다. 반대로 NVIDIA 생태계의 라이브러리와 운영 경험에 깊게 묶인 팀은 전환 비용을 크게 볼 것입니다. 앞으로 플랫폼 엔지니어는 OpenAI, Anthropic, Google, 오픈소스 모델을 비교할 때 모델 품질뿐 아니라 가속기 생태계와 공급 계약까지 함께 봐야 합니다.

셋째, 클라우드 중립성의 의미가 바뀝니다. 멀티클라우드는 예전에는 AWS, Azure, Google Cloud를 함께 쓰는 문제였습니다. 이제는 GPU 클라우드, TPU 클라우드, 자체 온프레미스 클러스터, 특정 모델 제공자의 전용 용량을 섞는 문제가 됩니다. 데이터 이동 비용, 프라이버시, 지연 시간, 네트워크 egress, 장애 격리, 감사 로그가 더 복잡해집니다. AI 제품이 커질수록 "어느 모델 API를 호출할까"보다 "어느 컴퓨트 섬에서 어떤 데이터와 실행을 돌릴까"가 더 큰 설계 문제가 됩니다.

아직 빈칸이 많습니다

이번 발표에는 공개되지 않은 부분도 많습니다. 첫째, 가격입니다. TPU 클라우드가 기존 Google Cloud TPU보다 싸거나 예측 가능한지, 장기 계약 고객에게 어떤 형태로 제공되는지는 알 수 없습니다. 둘째, 고객 대상입니다. 대형 모델 회사와 금융권, 고성능 컴퓨팅 고객을 우선할지, 일반 Google Cloud 고객에게도 쉽게 열릴지는 공개되지 않았습니다. 셋째, 지역과 규제입니다. 미국 기반 회사라는 표현은 있지만 구체적 리전, 데이터 주권, 산업별 컴플라이언스 범위는 아직 없습니다.

넷째, Google Cloud와의 경계입니다. 합작사가 Google Cloud의 보완 채널인지, 사실상 대형 고객용 별도 조달 법인인지, 혹은 장기적으로 TPU 생태계의 독립 유통망이 될지는 시간이 지나야 보입니다. 커뮤니티가 "Google Cloud와 무엇이 다르냐"고 묻는 이유가 여기에 있습니다. 공식 문장만 보면 고객 선택지를 늘린다는 답이지만, 실제 고객 입장에서는 계약 주체, SLA, 지원 채널, 네트워크 연결, 데이터 처리 조건이 다르면 완전히 다른 제품입니다.

다섯째, 경쟁사의 대응입니다. AWS는 Trainium과 Inferentia를, Microsoft는 자체 AI 칩과 NVIDIA 공급망을, Oracle과 CoreWeave는 GPU 기반 대형 계약을 앞세웁니다. Anthropic은 Google Cloud TPU와 AWS Trainium을 모두 활용하는 다중 인프라 전략을 보여줬습니다. OpenAI, xAI, Meta 같은 대형 모델 회사도 점점 칩과 전력, 데이터센터 계약을 직접 다룹니다. Google-Blackstone 합작은 이 전쟁에서 "우리는 TPU를 더 넓게 공급할 자본 구조를 만들었다"는 선언입니다.

결론: AI 컴퓨트는 이제 구매 방식이 제품 전략입니다

이번 뉴스의 핵심은 Google이 TPU를 발표했다는 사실이 아닙니다. 그 발표는 이미 4월에 있었습니다. 핵심은 Google이 TPU 용량을 클라우드 내부 기능으로만 두지 않고, Blackstone의 자본과 데이터센터 역량을 붙여 별도 공급 채널로 꺼냈다는 점입니다. AI 인프라 시장은 칩 성능, 모델 품질, 클라우드 제품만으로 움직이지 않습니다. 누가 전력을 확보하고, 누가 건설 리스크를 지고, 누가 장기 용량을 팔며, 누가 소프트웨어 스택을 책임지는지가 같은 층위의 경쟁 요소가 됐습니다.

개발자와 AI 제품 팀이 지금 당장 TPU 합작사와 계약할 일은 많지 않을 수 있습니다. 그래도 이 흐름은 제품 로드맵에 영향을 줍니다. 에이전트 기능을 많이 넣을수록 추론 비용은 더 동적이고 커집니다. 멀티모달 모델을 쓰고, 장기 컨텍스트를 유지하고, 백그라운드 작업을 돌리고, 사용자 대신 여러 도구를 호출할수록 컴퓨트 조달은 아키텍처의 핵심이 됩니다. Google과 Blackstone의 합작은 그 조달 문제가 얼마나 커졌는지를 보여주는 사건입니다.

따라서 이 발표는 "또 하나의 AI 클라우드"보다 "AI 용량을 누가 금융상품처럼 포장해 팔 것인가"라는 질문에 가깝습니다. GPU 부족이 CoreWeave를 키웠다면, TPU 수요와 Google의 수직 통합은 다른 형태의 AI 전용 클라우드를 만들고 있습니다. 2027년 500MW가 실제로 어떤 고객에게, 어떤 가격과 조건으로 열리는지가 다음 관찰 지점입니다. 그때가 되면 AI 팀의 벤더 비교표에는 모델 이름, 토큰 가격, 지연 시간 옆에 전력과 자본 구조까지 들어갈 가능성이 큽니다.

출처