Copilot Opus 4.8 도입, 15배 요청 계수의 비용 경고

GitHub Copilot이 Claude Opus 4.8을 일반 제공하며 15배 premium request multiplier를 붙였습니다. 성능보다 비용과 관리자 정책을 먼저 봐야 합니다.

AI 요약

무슨 일: GitHub Copilot이 Claude Opus 4.8을 Pro+, Business, Enterprise에 일반 제공했습니다.
- VS Code, Copilot CLI, cloud agent, Copilot App, GitHub Mobile, JetBrains, Xcode, Eclipse까지 model picker에 들어갑니다.
핵심 숫자: GitHub은 6월 1일 사용량 과금 전까지 15배 premium request multiplier를 붙였습니다.
실무 영향: 프론티어 모델 선택은 이제 성능 취향이 아니라 AI Credits, budget control, admin policy 문제입니다.

GitHub이 2026년 5월 28일 Copilot changelog에서 새 모델 제공을 알렸습니다. 발표 내용은 Claude Opus 4.8을 GitHub Copilot에서 일반 제공한다는 것입니다. 문장만 보면 "Copilot model picker에 새 Anthropic 모델이 추가됐다"는 제품 업데이트입니다. 그러나 개발팀이 먼저 봐야 할 줄은 따로 있습니다. GitHub은 이 모델이 2026년 6월 1일 Usage Based Billing이 시작되기 전까지 15X premium request multiplier로 출시된다고 밝혔습니다.

이번 글은 Claude Opus 4.8 자체의 성능 발표를 다시 쓰지 않습니다. Anthropic의 같은 날 발표에는 Claude Code dynamic workflows, effort control, Messages API 변경, fast mode 가격 인하가 함께 들어 있습니다. devlery에서도 Opus 4.8과 dynamic workflows를 이미 별도로 다뤘습니다. 여기서는 GitHub Copilot 안에서 같은 모델이 어떤 비용 단위, 어떤 제품 표면, 어떤 관리자 정책으로 배치되는지를 봅니다.

GitHub Copilot 안에서 Claude Opus 4.8을 선택할 때 함께 봐야 할 비용과 가용성 지표

Copilot이 Opus 4.8을 어디에 넣었나

GitHub의 공지 기준 Claude Opus 4.8은 Copilot Pro+, Business, Enterprise 사용자에게 제공됩니다. 선택 가능한 표면은 넓습니다. Visual Studio Code의 chat, ask, edit, agent 모드와 Visual Studio, Copilot CLI, Copilot cloud agent가 목록에 들어갑니다. GitHub Copilot App, github.com, GitHub Mobile iOS와 Android, JetBrains, Xcode, Eclipse도 같은 목록에 포함됐습니다. GitHub은 rollout이 gradual이라고 적었고, 아직 보이지 않으면 기다려야 한다고 안내했습니다.

Business와 Enterprise에서는 한 단계가 더 붙습니다. Copilot Enterprise와 Copilot Business plan 관리자는 Copilot settings에서 Claude Opus 4.8 policy를 켜야 합니다. 개인 개발자에게는 model picker가 선택 UI처럼 보이지만, 조직 계정에서는 admin policy가 앞에 있습니다. 이 차이는 작은 설정 문제가 아닙니다. 같은 Copilot 좌석을 써도 어떤 조직은 Opus 4.8을 허용하고, 어떤 조직은 비용이나 규정 때문에 막을 수 있습니다.

GitHub이 공지에서 강조한 성능 설명은 신중합니다. 회사는 early testing에서 Opus 4.8이 real-world coding tasks의 code understanding과 generation에서 이전 버전보다 나아졌고, complex problem-solving과 large-codebase navigation도 개선됐다고 말했습니다. 구체적인 Copilot 내부 벤치마크 수치는 공개하지 않았습니다. 따라서 이 발표를 "Copilot에서 가장 좋은 모델이 확정됐다"로 읽기보다는, GitHub이 고비용 프론티어 모델을 여러 Copilot 실행 표면에 배치했다는 사실로 읽는 편이 정확합니다.

15배 계수가 말하는 것

이번 발표의 숫자는 15X입니다. GitHub은 Usage Based Billing이 2026년 6월 1일 시작될 때까지 Claude Opus 4.8이 15X premium request multiplier로 출시된다고 밝혔습니다. premium request multiplier는 기존 Copilot 과금 체계에서 모델별 사용량을 계수화하는 장치입니다. 같은 요청이라도 모델 비용과 실행 성격에 따라 더 많은 request 단위를 소모하게 만드는 방식입니다.

15배라는 숫자는 단순히 "비싸다"가 아닙니다. Copilot이 이미 여러 모델을 모델 선택 UI에 넣고 있기 때문에, 같은 agent task라도 어떤 모델을 골랐는지에 따라 조직의 사용량 회계가 달라집니다. 특히 cloud agent나 Copilot App처럼 긴 작업을 위임하는 표면에서는 한 번의 사용자 요청이 파일 탐색, 계획, 코드 수정, 테스트 실행, 로그 해석, 재시도, PR 생성으로 늘어납니다. 모델 선택은 한 번의 chat 응답보다 더 큰 비용 차이를 만들 수 있습니다.

GitHub의 4월 27일 사용량 과금 발표는 이 배경을 직접 설명합니다. GitHub은 Copilot이 1년 전의 in-editor assistant와 달라졌고, 긴 multi-step coding session을 실행하는 agentic platform으로 바뀌었다고 썼습니다. 빠른 chat 질문과 몇 시간짜리 autonomous coding session이 같은 가격으로 처리되는 구조는 지속 가능하지 않다는 설명도 붙였습니다.

6월 1일부터는 premium request units가 GitHub AI Credits로 바뀝니다. GitHub 설명에 따르면 usage는 input, output, cached token을 포함한 token consumption 기준으로 계산되고, 각 모델의 published API rate에 맞춰 credit을 소비합니다. 이 전환 뒤에는 "몇 번 물어봤나"보다 "실제로 얼마나 많은 토큰과 실행 시간을 썼나"가 더 직접적인 지표가 됩니다. Opus 4.8의 15배 계수는 이 전환 직전의 다리 역할을 합니다.

Anthropic 가격표와 Copilot 가격표는 같은 말이 아니다

Anthropic은 5월 28일 Opus 4.8 출시 글에서 regular usage 가격을 Opus 4.7과 동일하게 유지한다고 밝혔습니다. 개발자는 claude-opus-4-8을 Claude API에서 사용할 수 있고, 정규 가격은 100만 input token당 5달러, 100만 output token당 25달러입니다. fast mode는 100만 input token당 10달러, output token당 50달러입니다. Anthropic은 fast mode가 2.5배 속도로 작동하고 이전 fast mode보다 3배 저렴해졌다고 설명했습니다.

이 숫자와 GitHub의 15X multiplier는 같은 단위가 아닙니다. Anthropic 가격표는 API 호출 단가입니다. GitHub Copilot은 구독, premium request, AI Credits, budget controls, enterprise policy를 묶어 최종 사용자 경험으로 제공합니다. 따라서 "Anthropic API 가격은 그대로인데 Copilot에서는 왜 15배인가"라고 바로 비교하면 어긋납니다. Copilot 안에는 모델 호출뿐 아니라 IDE 통합, context assembly, cloud agent runtime, GitHub workflow, cache, 조직 과금 처리, 정책 적용 비용이 들어갑니다.

개발팀 입장에서는 둘 다 봐야 합니다. Anthropic API를 직접 쓰는 internal tool이라면 token 단가, prompt cache, retry policy, rate limit이 계산의 중심입니다. Copilot을 조직 좌석으로 쓰는 팀이라면 좌석 가격, 포함 usage, 모델별 계수, AI Credits, budget cap, 모델 허용 정책이 계산의 중심입니다. 같은 Claude Opus 4.8이라도 구매 경로가 다르면 비용 제어 지점도 달라집니다.

관리자 정책이 model picker 앞에 선다

GitHub은 5월 26일 별도 changelog에서 enterprise owners가 조직별로 Copilot 모델을 허용하는 targeted model rules public preview를 공개했습니다. 같은 주에 Claude Opus 4.8이 Business와 Enterprise에서 admin policy를 요구한다는 점은 우연처럼 보이지 않습니다. Copilot 모델 선택이 개인 생산성 도구의 취향을 넘어, enterprise governance의 관리 대상이 되고 있습니다.

예를 들어 한 회사에 보안팀, 데이터팀, 앱개발팀이 있다고 합시다. 보안팀은 고난도 코드 분석 때문에 Opus 4.8을 허용하고 싶을 수 있습니다. 앱개발팀은 반복적인 CRUD 수정이 많아 Haiku나 mini 계열 모델을 기본으로 쓰고 싶을 수 있습니다. 데이터팀은 외부 모델 사용 제한이 걸린 저장소를 갖고 있을 수 있습니다. model rules와 admin policy는 이런 차이를 조직 단위로 나누는 장치입니다.

이 장치가 없으면 비용 문제와 보안 문제가 한 화면에서 섞입니다. 개발자는 "작업이 어려우니 가장 강한 모델을 쓰자"고 판단할 수 있습니다. 관리자는 "모든 팀이 같은 계수로 장기 실행 agent를 돌리면 예산이 터진다"고 봅니다. 보안팀은 "일부 저장소에는 특정 외부 모델을 허용할 수 없다"고 봅니다. Copilot의 model picker는 사용자 인터페이스이고, model rules는 조직의 통제 인터페이스입니다.

Opus 4.8의 성능 주장은 어디까지 확인됐나

Anthropic은 Opus 4.8을 Opus 4.7의 개선판으로 설명합니다. 공식 글에는 coding, agentic skills, reasoning, practical knowledge work task에서의 비교표가 있고, system card로 더 넓은 평가를 제공한다고 안내합니다. 또한 Opus 4.8이 predecessor보다 코드 결함을 "언급하지 않고 넘어갈" 가능성이 약 4배 낮다는 자체 평가를 제시했습니다. 정직성, 불확실성 표시, tool use consistency가 개선됐다는 early tester 인용도 많이 포함했습니다.

이런 주장은 유용하지만, Copilot 사용자에게 바로 같은 결과를 보장하지는 않습니다. Copilot은 Anthropic API를 그대로 노출하는 제품이 아닙니다. GitHub가 어떤 context를 넣는지, 저장소 색인을 어떻게 붙이는지, agent mode에서 어떤 도구 호출을 허용하는지, cloud agent가 어떤 runner와 권한으로 움직이는지에 따라 결과가 달라집니다. 같은 모델이라도 harness가 다르면 coding task 성공률과 비용이 달라집니다.

특히 large-codebase navigation은 제품 통합의 영향을 크게 받습니다. 모델이 긴 문맥을 잘 다뤄도 Copilot이 적절한 파일을 찾지 못하면 성능은 떨어집니다. 반대로 모델 자체가 약간 낮아도 repository indexing, semantic issue search, terminal feedback, test output summarization이 잘 붙으면 작업 성공률은 올라갑니다. Opus 4.8의 도입은 모델 경쟁이지만, 실제 체감은 GitHub의 context와 workflow 통합까지 포함한 경쟁입니다.

AI Credits 전환 뒤에 달라지는 질문

GitHub의 4월 발표에서 개인 Pro는 월 10달러 구독에 10달러 AI Credits, Pro+는 월 39달러에 39달러 AI Credits가 붙습니다. Business는 좌석당 월 19달러, Enterprise는 좌석당 월 39달러이고, 2026년 6월부터 8월까지 기존 Business와 Enterprise 고객에는 각각 월 30달러와 70달러의 promotional included usage가 제공된다고 GitHub은 설명했습니다. 조직에는 pooled included usage와 enterprise, cost center, user level budget controls도 들어갑니다.

이 구조에서는 "Opus 4.8을 쓸 수 있나"보다 "어떤 작업에 Opus 4.8을 쓰도록 허용할 것인가"가 먼저 옵니다. 짧은 질문, 간단한 refactor, boilerplate 생성, test 이름 수정까지 모두 같은 모델로 돌리면 credit 소비가 빨라집니다. 반대로 어려운 migration, 보안 취약점 분석, multi-service incident reproduction처럼 실패 비용이 큰 작업에는 높은 모델 비용을 정당화할 수 있습니다.

좋은 운영 기준은 모델 이름이 아니라 작업 등급입니다. 예를 들어 30분 이내 단순 수정은 저비용 모델, 여러 패키지를 건드리는 migration은 중간 모델, production incident나 보안 수정은 Opus 4.8 같은 고성능 모델로 나눌 수 있습니다. 이 기준을 문서화하지 않으면 model picker는 팀마다 다른 습관이 되고, budget report가 나온 뒤에야 비용 원인을 찾게 됩니다.

Copilot cloud agent에서 15배가 더 크게 보이는 이유

Copilot cloud agent는 비용 논의를 더 민감하게 만듭니다. 로컬 chat에서 개발자가 한 질문을 보고 다음 질문을 조정하는 방식과 달리, cloud agent는 하나의 위임 작업 안에서 여러 단계를 실행합니다. issue를 읽고, branch를 만들고, 파일을 수정하고, 테스트를 돌리고, 실패 로그를 다시 읽고, PR을 만드는 과정은 사람이 한 번 승인한 뒤 자동으로 길어질 수 있습니다.

이때 15X multiplier는 심리적으로도 다르게 작동합니다. 사용자는 "한 번 맡겼다"고 느끼지만, 시스템 내부에서는 많은 reasoning loop가 돌 수 있습니다. 6월 1일 이후 AI Credits 체계에서는 이 내부 소비가 token usage로 더 잘 드러날 가능성이 있습니다. GitHub이 fallback experiences가 사라지고 budget controls가 들어간다고 설명한 이유도 여기에 있습니다. 모델 선택이 실패했을 때 낮은 모델로 계속 진행하는 경험보다, 사용 가능한 credit과 관리자 budget cap이 상위 규칙이 됩니다.

개발팀은 cloud agent에 맡기는 작업의 종료 조건을 더 명확하게 써야 합니다. "고쳐줘"보다 "테스트 X와 Y가 통과하면 멈추고, schema 변경은 하지 말고, 실패하면 로그 요약만 남겨라"가 비용과 위험을 줄입니다. 이는 모델 성능과 별개의 운영 기술입니다. 강한 모델일수록 더 오래 시도할 수 있고, 더 많은 파일을 탐색할 수 있으며, 더 많은 token을 쓸 수 있습니다.

개발팀이 당장 확인할 체크포인트

첫째, 조직의 Copilot plan과 모델 허용 상태를 확인해야 합니다. Pro+ 개인 사용자는 model picker에서 볼 수 있지만, Business와 Enterprise는 관리자가 policy를 켜야 합니다. 여러 조직과 repository를 오가는 개발자는 같은 계정이어도 어느 organization context에서 작업하는지에 따라 선택 가능한 모델이 달라질 수 있습니다.

둘째, 2026년 6월 1일 전후의 청구 단위를 분리해서 봐야 합니다. 5월 말의 15X premium request multiplier와 6월 이후 AI Credits는 표현이 다릅니다. annual plan, monthly plan, Business, Enterprise의 전환 조건도 다릅니다. 팀 내부 문서에는 "Opus 4.8은 15배라서 비싸다"보다 "6월 이후 어떤 credit budget과 token 단가로 계산되는가"를 적어야 합니다.

셋째, agent task에 모델 등급을 붙이는 규칙이 필요합니다. 모든 PR 설명 생성에 Opus 4.8을 쓰는 팀과, 실패 비용이 큰 migration에만 쓰는 팀의 월 사용량은 달라질 수밖에 없습니다. GitHub이 cost center와 user level budget controls를 예고한 만큼, 팀별 비용 분리를 미리 준비하는 편이 낫습니다.

넷째, 결과 품질을 모델명만으로 평가하지 않아야 합니다. Opus 4.8이 코드 결함을 더 잘 지적한다는 Anthropic 평가가 있어도, Copilot 환경에서는 repository indexing, test harness, protected branch rule, PR review policy가 함께 작동합니다. 모델을 바꾼 뒤에는 task completion rate, reverted PR, review comment volume, test retry count, credit consumption을 함께 봐야 합니다.

성능 경쟁의 다음 단위는 구매 단위다

Claude Opus 4.8이 Copilot에 들어온 사건은 모델 선택지가 늘었다는 좋은 소식입니다. 하지만 2026년의 코딩 에이전트 시장에서 선택지는 더 이상 무료 옵션 목록이 아닙니다. GitHub은 15X multiplier를 붙였고, 6월 1일부터 AI Credits로 과금 단위를 바꿉니다. Business와 Enterprise에는 admin policy가 붙습니다. 같은 모델이라도 Claude API로 직접 쓰는 경우와 Copilot cloud agent 안에서 쓰는 경우의 계산서는 다릅니다.

개발자는 이제 model picker를 성능 메뉴가 아니라 운영 메뉴로 봐야 합니다. Opus 4.8은 어려운 코드 이해와 장기 작업에서 더 나은 선택이 될 수 있습니다. 동시에 그 선택은 credit, budget, policy, runner, review workflow와 묶입니다. 프론티어 모델이 IDE와 agent 표면에 들어올수록 "가장 똑똑한 모델을 고른다"는 질문은 "어떤 작업에 어떤 비용과 권한으로 쓰게 할 것인가"로 바뀝니다.