Superpowers 19만 스타, 코딩 에이전트의 공정표가 됐다

Superpowers는 코딩 에이전트 경쟁이 모델에서 반복 가능한 스킬, TDD, 리뷰, 워크트리 프로세스로 이동했음을 보여줍니다.

AI 요약

무슨 일: obra/superpowers가 코딩 에이전트용 스킬·방법론 계층으로 다시 주목받고 있습니다.
- 2026년 5월 17일 GitHub API 확인 기준 194,953 stars, 17,332 forks, 최신 릴리스는 v5.1.0입니다.
핵심 신호: 코딩 에이전트 경쟁이 모델 성능에서 반복 가능한 개발 공정으로 이동하고 있습니다.
- brainstorming, planning, worktree, TDD, subagent review, verification을 스킬로 강제하는 접근입니다.
주의점: 스킬 생태계가 커질수록 prompt가 아니라 공급망, 품질, 검증 문제가 됩니다.

AI 코딩 도구 뉴스는 보통 새 모델, 새 IDE, 새 CLI, 새 벤치마크에서 시작합니다. Claude Code가 더 긴 작업을 한다, Codex가 모바일로 들어왔다, Cursor가 클라우드 에이전트를 붙였다, GitHub가 PR 흐름에 에이전트를 넣었다는 식입니다. 그런데 이번에 볼 신호는 조금 다릅니다. 새 모델도 아니고 새 IDE도 아닙니다. 코딩 에이전트가 일하는 절차 자체를 패키징한 저장소가 다시 주목받고 있습니다.

그 주인공은 Jesse Vincent의 오픈소스 프로젝트 obra/superpowers입니다. GitHub README는 이 프로젝트를 "coding agents를 위한 완전한 소프트웨어 개발 방법론"이라고 설명합니다. 핵심은 단순합니다. 에이전트에게 "잘해봐"라고 말하는 대신, 사용자의 의도를 확인하고, 설계를 나누어 검토하고, 구현 계획을 만들고, TDD로 작업하고, 리뷰를 통과하고, 검증 전에는 완료를 선언하지 못하게 하는 일련의 스킬을 제공합니다.

2026년 5월 17일 확인한 GitHub API 기준으로 Superpowers는 194,953 stars와 17,332 forks를 기록하고 있습니다. 최신 릴리스는 2026년 5월 4일 공개된 v5.1.0입니다. 숫자만 보면 과열된 GitHub 스타 뉴스처럼 보일 수 있습니다. 하지만 이 프로젝트가 흥미로운 이유는 다른 데 있습니다. 코딩 에이전트 생태계가 "어느 모델이 코드를 더 잘 쓰는가"에서 "그 모델이 어떤 개발 공정을 반복적으로 지키게 할 것인가"로 옮겨가고 있다는 점입니다.

Superpowers README와 v5.1.0 릴리스 노트를 바탕으로 재구성한 코딩 에이전트 스킬 흐름

Superpowers는 도구가 아니라 공정입니다

Superpowers가 제공하는 기본 workflow는 명확합니다. 먼저 brainstorming이 작동해 사용자가 무엇을 만들려는지 묻습니다. 그 다음 using-git-worktrees가 격리된 작업 공간을 준비하고, writing-plans가 승인된 설계를 작고 검증 가능한 작업으로 쪼갭니다. 구현 단계에서는 subagent-driven-development나 executing-plans가 일을 진행하고, test-driven-development가 RED-GREEN-REFACTOR 순서를 강제합니다. 중간에는 requesting-code-review가 리뷰를 넣고, 마지막에는 finishing-a-development-branch가 검증과 통합 선택지를 제시합니다.

이 구조는 프롬프트 팁 모음과 다릅니다. README는 "The agent checks for relevant skills before any task. Mandatory workflows, not suggestions."라고 적습니다. 번역하면, 스킬은 제안이 아니라 의무 workflow입니다. 코딩 에이전트가 작업을 시작할 때 관련 스킬을 찾고, 해당 스킬이 있으면 그 절차를 따라야 한다는 모델입니다.

이 차이는 중요합니다. 많은 팀이 AI 코딩 도구를 도입할 때 처음에는 "테스트도 같이 써줘", "작게 커밋해줘", "먼저 계획해줘" 같은 자연어 지시를 붙입니다. 하지만 에이전트는 작업이 길어지면 지시를 잊거나, 자신감이 생기면 바로 코드를 쓰거나, 실패한 테스트를 대충 해석하거나, 검증하지 않은 채 완료됐다고 말할 수 있습니다. Superpowers는 이런 반복 실패를 개별 프롬프트가 아니라 재사용 가능한 절차로 바꾸려 합니다.

왜 지금 다시 중요해졌나

최근 코딩 에이전트 시장의 변화는 빠릅니다. OpenAI Codex는 CLI, 앱, 웹, IDE, 모바일 원격 제어로 표면을 넓혔습니다. Anthropic은 Claude Code와 Cowork를 기업 배포와 연결합니다. GitHub는 Copilot coding agent를 issue와 PR 수명주기에 넣고, Cursor는 IDE와 클라우드 에이전트 사이를 연결합니다. xAI도 Grok Build로 터미널 기반 코딩 에이전트 경쟁에 들어왔습니다.

이 경쟁에서 모델은 여전히 중요합니다. 하지만 모델만으로는 부족합니다. 실제 개발 작업은 단일 프롬프트로 끝나지 않습니다. 요구사항을 이해하고, 기존 코드 구조를 읽고, 테스트 기준을 잡고, 작은 변경을 만들고, 실패를 디버깅하고, 리뷰를 통과하고, 브랜치를 정리해야 합니다. 사람 개발자에게도 어려운 공정입니다. 에이전트에게는 더 어렵습니다. 왜냐하면 에이전트는 똑똑한 순간에도 쉽게 절차를 생략하기 때문입니다.

Superpowers가 제시하는 해법은 "에이전트에게 더 많은 자유를 주자"가 아닙니다. 오히려 반대입니다. 자유로운 모델 위에 더 강한 engineering discipline을 얹습니다. brainstorming으로 문제를 좁히고, writing-plans로 구현 지시를 구체화하며, TDD로 검증 가능한 단계를 만들고, review skill로 품질 게이트를 세웁니다. 이것은 에이전트 시대의 개발 방법론이 다시 중요해지고 있다는 신호입니다.

v5.1.0에서 보이는 성숙 단계

Superpowers의 최신 릴리스 v5.1.0은 기능 추가보다 운영 성숙에 가깝습니다. 릴리스 노트에서 가장 눈에 띄는 부분은 legacy slash command 제거, worktree skill rewrite, AI agent contributor guideline, Codex plugin mirror tooling, OpenCode bootstrap cache, code review consolidation입니다.

먼저 legacy slash command가 제거됐습니다. /brainstorm, /execute-plan, /write-plan 같은 오래된 명령은 대응 스킬을 직접 호출하라는 stub에 가까웠고, 이제는 superpowers:brainstorming, superpowers:executing-plans, superpowers:writing-plans처럼 스킬 단위 호출로 정리됐습니다. 이것은 Superpowers가 "명령 모음"에서 "스킬 시스템"으로 중심을 옮기고 있다는 뜻입니다.

worktree 관련 변화도 의미가 큽니다. using-git-worktrees와 finishing-a-development-branch는 에이전트가 이미 격리된 worktree 안에서 실행 중인지 감지하고, 네이티브 하네스가 제공하는 worktree 기능을 우선 사용하도록 바뀌었습니다. Codex App처럼 실행 환경 자체가 worktree를 관리할 수 있는 경우, 무작정 git worktree add를 실행하면 오히려 충돌이나 데이터 손실 위험이 생깁니다. 릴리스 노트는 submodule guard, cleanup provenance, detached HEAD handling 같은 세부 항목까지 다룹니다.

여기서 보이는 변화는 명확합니다. 코딩 에이전트가 여러 하네스에서 돌아가면서, 스킬은 더 이상 "내 로컬 Claude 설정"만 가정할 수 없습니다. Codex CLI, Codex App, Cursor, Gemini CLI, OpenCode, GitHub Copilot CLI처럼 서로 다른 실행 환경을 고려해야 합니다. 스킬도 일종의 cross-platform runtime layer가 되고 있습니다.

AI-generated slop을 막는 기여 가이드

v5.1.0에서 가장 흥미로운 대목은 AI agent contributor guideline입니다. 릴리스 노트는 최근 100개의 closed PR을 감사한 결과, AI-generated slop 때문에 94% rejection rate가 나왔다고 설명합니다. 문제는 PR template을 읽지 않거나, 중복 PR을 열거나, 존재하지 않는 문제 설명을 꾸미거나, 특정 포크나 도메인에만 맞는 변경을 core에 밀어 넣는 에이전트였습니다.

그래서 Superpowers는 AI 에이전트를 직접 겨냥한 기여 지침을 CLAUDE.md 상단에 추가했습니다. PR template을 읽고, 기존 PR을 검색하고, 실제 문제가 있는지 확인하고, 그 변경이 core에 속하는지 검증하고, 제출 전에 human partner에게 전체 diff를 보여주라는 checklist입니다. 새 하네스 통합에는 "깨끗한 세션에서 React todo list를 만들라고 했을 때 brainstorming이 자동으로 작동해야 한다"는 acceptance test와 완전한 transcript도 요구합니다.

이 대목은 오픈소스 유지관리자들에게 익숙한 문제를 정면으로 보여줍니다. AI 코딩 도구가 PR 생성을 쉽게 만들수록, 저장소 관리자는 더 많은 저품질 PR을 받습니다. Superpowers는 코딩 에이전트를 잘 쓰기 위한 프로젝트이면서 동시에, 코딩 에이전트가 만든 기여를 어떻게 걸러낼 것인가를 고민하는 프로젝트가 됐습니다.

아이러니하지만 중요한 장면입니다. 에이전트에게 좋은 개발 규율을 가르치는 저장소조차, 에이전트가 생성한 부실한 기여 때문에 기여 규율을 더 강화하고 있습니다. 이것은 앞으로 많은 오픈소스 프로젝트가 겪을 일입니다. AI 기여를 막을 수는 없지만, AI 기여가 사람의 검토 시간을 갉아먹지 않게 하는 절차는 필요합니다.

Codex plugin mirror가 의미하는 것

또 하나의 중요한 변화는 Codex plugin mirror tooling입니다. 릴리스 노트는 sync-to-codex-plugin 스크립트가 Superpowers를 OpenAI Codex plugin marketplace용 저장소로 미러링한다고 설명합니다. README도 Codex CLI와 Codex App에서 공식 Codex plugin marketplace를 통해 Superpowers를 설치할 수 있다고 안내합니다.

이것은 작은 배포 편의 기능처럼 보이지만, 시장 구조를 보여주는 신호입니다. 지금까지 코딩 에이전트 사용자는 도구별로 다른 instruction file, rules, plugin, extension을 관리해야 했습니다. Claude Code에는 plugin marketplace가 있고, Codex에는 plugin marketplace가 있으며, Cursor와 Gemini CLI도 각자 설치 흐름을 갖습니다. Superpowers가 여러 하네스에 맞춰 배포 경로를 정리하는 것은 스킬이 단일 도구의 부속물이 아니라 여러 에이전트 런타임을 가로지르는 portability layer가 되려는 움직임입니다.

개발팀 입장에서는 이식성이 중요합니다. 오늘은 Claude Code를 쓰지만 내일은 Codex를 쓰고, 특정 프로젝트에서는 Cursor를 쓰고, CI나 자동화에서는 OpenCode를 쓸 수 있습니다. 이때 팀의 개발 원칙이 도구별 프롬프트에 흩어져 있으면 관리가 어렵습니다. 스킬이 공통 단위가 되면 "우리 팀은 어떤 에이전트를 쓰든 먼저 설계하고, 작은 작업으로 나누고, 테스트를 먼저 쓰고, 리뷰와 검증을 통과한다"는 원칙을 더 일관되게 옮길 수 있습니다.

에이전트의 병목은 지능이 아니라 절차일 수 있습니다

Superpowers가 던지는 질문은 단순합니다. 코딩 에이전트가 실패할 때, 정말 모델이 멍청해서 실패하는 걸까요. 물론 그런 경우도 있습니다. 모델이 코드를 잘못 이해하거나, API를 환각하거나, 긴 문맥에서 실수를 할 수 있습니다. 하지만 현장에서 자주 보는 실패는 더 평범합니다. 요구사항을 충분히 묻지 않습니다. 테스트 없이 코드를 씁니다. 실패 원인을 확인하지 않고 추측합니다. 다 끝났다고 말한 뒤 실제로는 lint나 build를 돌리지 않았습니다. 리뷰에서 지적된 문제를 피상적으로 반영합니다.

이런 실패는 모델 크기만으로 해결되지 않습니다. 사람 개발자도 같은 실수를 합니다. 그래서 팀은 코드 리뷰, CI, 테스트, 릴리스 체크리스트, ADR, 이슈 템플릿, PR 템플릿을 둡니다. Superpowers는 이 오래된 소프트웨어 엔지니어링 장치를 에이전트가 이해하고 실행할 수 있는 스킬로 옮깁니다.

특히 TDD를 강하게 밀어붙이는 점이 흥미롭습니다. AI 코딩 도구를 쓰는 많은 사람은 "테스트까지 생성해줘"라고 요청합니다. 하지만 테스트가 구현 뒤에 나오면 모델은 자신이 방금 만든 코드에 맞춰 테스트를 합리화하기 쉽습니다. Superpowers의 test-driven-development는 먼저 실패하는 테스트를 쓰고, 실패를 확인하고, 최소 구현으로 통과시키는 순서를 강조합니다. 모델이 똑똑해질수록 이런 절차는 더 중요해질 수 있습니다. 똑똑한 모델은 틀렸을 때도 더 설득력 있게 틀리기 때문입니다.

스킬 생태계의 어두운 면

하지만 스킬이 만능은 아닙니다. 스킬 파일은 결국 에이전트가 읽고 따르는 지시입니다. 이 지시는 유용할 수 있지만, 악의적일 수도 있습니다. 2026년 2월 arXiv에 올라온 "SoK: Agentic Skills" 논문은 skill-based agent의 공급망 위험, skill payload를 통한 prompt injection, trust-tiered execution 같은 문제를 정리했습니다. 에이전트가 어떤 스킬을 신뢰하고, 그 스킬이 어떤 권한을 요구하며, 누가 업데이트했는지 추적하지 못하면 스킬은 새로운 공격면이 됩니다.

Superpowers 자체도 이 문제를 간접적으로 보여줍니다. 여러 marketplace와 하네스를 지원하고, Codex plugin mirror를 운영하고, contributors에게 강한 규칙을 요구합니다. 이는 스킬 배포가 단순히 파일을 복사하는 문제가 아니라는 뜻입니다. 스킬은 개발자의 로컬 파일, git, 터미널, 브라우저, 테스트, 배포 흐름에 영향을 줄 수 있습니다. 따라서 스킬 생태계에는 package manager와 비슷한 신뢰 모델이 필요합니다.

실무적으로는 몇 가지 기준이 필요합니다. 첫째, 팀이 쓰는 스킬은 버전을 고정해야 합니다. 둘째, 스킬 업데이트는 코드 변경처럼 리뷰해야 합니다. 셋째, 스킬이 요구하는 도구와 권한을 문서화해야 합니다. 넷째, 프로젝트별 custom skill은 core workflow와 분리해야 합니다. 다섯째, 에이전트가 스킬을 따랐는지 검증할 로그나 transcript가 있어야 합니다. Superpowers의 contributor guideline이 transcript를 요구하는 이유도 여기에 닿아 있습니다.

개발자에게 주는 실무적 신호

Superpowers를 지금 당장 설치할지 여부와 별개로, 개발팀이 배울 수 있는 점은 분명합니다. 코딩 에이전트를 팀에 들일 때 모델 선택만으로는 부족합니다. 어떤 작업을 에이전트에게 맡길지, 어떤 질문을 먼저 하게 할지, 어떤 테스트 기준을 요구할지, 어떤 승인 없이 명령을 실행하지 못하게 할지, 어느 시점에 리뷰를 받을지, 완료 선언 전 어떤 검증을 요구할지 정해야 합니다.

이것은 "에이전트 사용 가이드"보다 강한 것입니다. 사람에게는 가이드 문서가 어느 정도 통합니다. 에이전트에게는 더 구체적이어야 합니다. 트리거 조건, 단계, 실패 시 행동, 금지 패턴, 검증 명령, 산출물 형식이 있어야 합니다. 그런 의미에서 스킬은 프롬프트와 runbook의 중간 형태입니다. 사람이 읽을 수 있고, 에이전트도 실행할 수 있는 절차 문서입니다.

또 하나의 신호는 작은 작업의 중요성입니다. Superpowers의 계획 흐름은 작업을 작은 단위로 나눕니다. 이것은 에이전트에게 특히 중요합니다. 큰 요청 하나를 길게 맡기면 모델은 중간 목표를 잃기 쉽습니다. 반대로 작은 작업, 명확한 파일 경로, 예상 테스트, 리뷰 기준을 주면 실패를 빨리 발견할 수 있습니다. 에이전트의 속도를 살리려면 작업도 에이전트가 처리하기 좋은 크기로 재구성해야 합니다.

코딩 에이전트 시장의 다음 계층

최근 AI 코딩 시장은 빠르게 계층화되고 있습니다. 맨 아래에는 모델이 있습니다. 그 위에는 CLI, IDE, 데스크톱 앱, 클라우드 에이전트 같은 실행 표면이 있습니다. 그 위에는 GitHub PR, issue, CI, Slack, Linear, MCP, 브라우저, 배포 플랫폼 같은 도구 연결이 있습니다. 그리고 이제 더 위에 "작업 방법론" 계층이 올라오고 있습니다.

Superpowers는 바로 이 작업 방법론 계층의 대표 사례입니다. OpenAI나 Anthropic이 직접 만든 제품은 아니지만, 여러 모델과 하네스를 가로지르며 에이전트의 행동을 표준화하려 합니다. 이것은 코딩 에이전트 시장이 성숙해질 때 자연스럽게 나오는 흐름입니다. 모델이 충분히 강해지면, 다음 병목은 모델을 어떻게 일하게 하느냐가 됩니다.

기업은 이 계층을 더 강하게 요구할 가능성이 큽니다. 개인 개발자는 실패한 에이전트 작업을 직접 되돌리면 됩니다. 조직에서는 다릅니다. 에이전트가 만든 PR이 어떤 절차를 통과했는지, 어떤 테스트를 돌렸는지, 어떤 리뷰가 있었는지, 어떤 승인으로 파일을 바꿨는지 남아야 합니다. Superpowers 같은 스킬 기반 방법론은 아직 개인과 오픈소스 중심이지만, 그 문제의식은 엔터프라이즈 AI 개발 거버넌스와 맞닿아 있습니다.

결론

Superpowers의 부상은 "새로운 대세 도구가 나왔다" 정도로 읽기에는 아깝습니다. 더 큰 변화는 코딩 에이전트를 둘러싼 기대가 바뀌고 있다는 점입니다. 이제 사람들은 에이전트에게 단순히 코드를 쓰라고 하지 않습니다. 먼저 묻고, 계획하고, 테스트하고, 리뷰받고, 검증하고, 안전하게 통합하라고 요구합니다.

이 요구는 낯설지 않습니다. 좋은 개발팀이 오래전부터 해온 일입니다. 다만 이제 그 규율을 사람만이 아니라 에이전트도 따라야 합니다. Superpowers는 그 규율을 스킬이라는 형태로 패키징한 사례입니다. 그래서 이 뉴스의 핵심은 19만 스타라는 숫자가 아닙니다. 코딩 에이전트의 다음 경쟁력이 더 똑똑한 한 번의 답변이 아니라, 반복 가능한 개발 공정을 얼마나 잘 수행하는가로 이동하고 있다는 사실입니다.

앞으로 코딩 에이전트 제품을 평가할 때 질문은 더 구체적이어야 합니다. 이 도구는 어떤 모델을 쓰는가. 어떤 IDE에 붙는가. 그리고 이제 한 가지를 더 물어야 합니다. 이 에이전트는 어떤 개발 절차를 실제로 지키게 만들 수 있는가. Superpowers가 보여준 것은 바로 그 질문입니다.