Devlery

Devlery - 개발의 모든 것을 배달합니다

DEVLERYDEVLERYDEVLERY

Devlery blog

개발의 모든 것을 배달합니다.

최신 글

StepFun Step 3.5 Flash가 11B 활성 파라미터로 프론티어급 성능을 냈다

196B MoE 모델에서 11B만 활성화해 GPT-5.2급 성능을 달성한 StepFun Step 3.5 Flash. DeepSeek의 1/6 비용으로 Apache 2.0 오픈소스 공개된 중국 AI 모델을 분석한다.

Q1 2026에 $297B가 몰렸다, AI가 VC 자금의 81%를 집어삼킨 분기

2026년 1분기 글로벌 VC 투자가 $297B로 역대 최고를 기록했다. AI가 81%를 독식하고, 4개 메가라운드가 전체의 64%를 차지한 초집중 구조를 분석한다.

Google 내부 AI 에이전트가 너무 인기라 접근을 제한했다, Agent Smith의 정체

Google의 자율 코딩 에이전트 Agent Smith가 프로덕션 코드의 25% 이상을 생성하며 18만 직원 사이에서 폭발적 인기를 얻었다. 비동기 실행과 모바일 제어로 코딩 어시스턴트 시대를 넘어선 내부 에이전트의 부상을 분석한다.

Perplexity가 사용자 대화를 Meta와 Google에 넘겼다, 집단소송이 터진 AI 검색의 민낯

Perplexity AI가 사용자 대화를 Meta/Google에 몰래 전송했다는 혐의로 집단소송이 제기됐다. Incognito 모드도 무력화됐다는 주장까지, 6번째 소송에 직면한 AI 검색의 위기를 분석한다.

Cohere Transcribe가 Whisper를 꺾었다, 오픈소스 음성 인식의 새 판이 열렸다

Cohere의 2B 파라미터 오픈소스 ASR 모델이 WER 5.42%로 HuggingFace 리더보드 1위를 차지했습니다. Apache 2.0 라이선스에 한국어 포함 14개 언어를 지원하며 Whisper 이후 3년간의 공백을 깨뜨렸습니다.

Claude가 FreeBSD 원격 커널 익스플로잇을 4시간 만에 완성했다, AI 보안의 새 경계

Anthropic 연구원이 Claude에게 FreeBSD 커널 취약점 CVE-2026-4747의 익스플로잇 개발을 맡겼더니, 4시간 만에 원격 루트 셸을 획득하는 완전한 익스플로잇 2종을 작성했다. AI 보안 연구의 전환점을 분석한다.

California가 AI 조달 인증을 무기로 꺼냈다, Trump의 허점을 파고든 Newsom의 전략

Newsom 주지사가 AI 기업에 조달 인증을 의무화하는 행정명령에 서명했다. Trump의 연방 선점 행정명령이 면제한 주정부 조달을 정확히 활용한 전략이 AI 규제 전쟁의 판도를 바꾸고 있다.

미국인 4명 중 1명이 AI 음성 사기를 당했다, 3초면 복제되는 목소리

Hiya의 12,000명 설문 결과 미국인 25%가 딥페이크 음성 사기를 경험했고, 24%는 진짜와 가짜를 구별하지 못합니다. 3초 음성 복제 시대, 음성 신뢰의 종말이 시작됐습니다.

26바이트가 80억 파라미터를 바꿨다, TinyLoRA와 RL이 뒤집은 파인튜닝의 상식

Meta FAIR, Cornell, CMU 연구진의 TinyLoRA가 13개 파라미터(26바이트)로 8B 모델에 수학 추론을 가르쳤다. RL이 SFT보다 1000배 효율적이라는 증거가 파인튜닝의 패러다임을 바꾸고 있다.

Bluesky Attie가 쏘아올린 질문, AI는 누구를 위해 알고리즘을 돌리는가

Bluesky가 Claude 기반 AI 앱 Attie를 출시해 자연어로 소셜 피드를 만들 수 있게 했습니다. 그러나 125,000건 차단이라는 폭발적 반발이 터졌습니다. AI와 오픈 프로토콜, 그리고 동의 아키텍처의 교훈을 분석합니다.

AI가 DRAM의 70%를 삼킨다, 스팟 가격 700% 폭등의 구조적 원인

AI 데이터센터가 전 세계 DRAM 생산의 70%를 흡수하면서 스팟 가격이 700% 폭등했습니다. HBM 1비트 생산에 일반 DRAM 3비트가 사라지는 비가역적 전환이 PC, 스마트폰, 게임 콘솔 시장을 강타하고 있습니다.

8B LLM이 1GB에 담겼다, 1-bit 양자화가 실험실을 벗어난 날

PrismML이 세계 최초 상용 1-bit LLM Bonsai를 출시했습니다. 8B 모델이 1.15GB로 줄어 iPhone에서 44 tok/s로 구동되며, Caltech 30년 연구와 $16.25M 펀딩이 뒷받침합니다.

Wikipedia가 44대 2로 AI 글쓰기를 금지했다, 지식 면역 반응의 시작

영어 Wikipedia 편집자들이 44대 2 압도적 투표로 LLM 기반 문서 작성을 공식 금지했습니다. AI 에이전트 TomWikiAssist의 무단 편집 사건, Habsburg AI 모델 붕괴 위험, 글로벌 Wikipedia의 연쇄 대응까지 분석합니다.

AI 에이전트가 1달러로 Docker를 뚫는다, SandboxEscapeBench의 불편한 진실

Oxford와 UK AISI의 SandboxEscapeBench에서 GPT-5와 Claude Opus 4.5가 50% 확률로 Docker 컨테이너 탈출에 성공했습니다. 건당 1달러로 가능한 이 위협이 AI 에이전트 보안의 재설계를 요구합니다.

OpenAI $122B 펀딩이 클로즈됐다, $852B 적자 회사의 IPO 카운트다운

OpenAI가 역사상 최대 민간 펀딩 $122B를 클로즈하며 밸류에이션 $852B를 확정했습니다. Amazon $50B 조건부 투자, 리테일 $3B 참여, SoftBank $40B 레버리지의 구조와 AI IPO 시대의 의미를 분석합니다.

월 $20 생산성 도구인데 법적으로는 "오락 전용", Copilot 이용약관의 불편한 진실

Microsoft Copilot 이용약관에 "entertainment purposes only" 문구가 발견되며 AI 업계의 마케팅과 법적 면책 사이의 모순이 수면 위로 올라왔습니다. 4대 AI 서비스의 이용약관을 비교 분석합니다.

PrismML이 세계 최초 상용 1-bit LLM을 출시했다, Spotify 캐시보다 작은 8B 모델

Caltech 연구진이 설립한 PrismML이 8B 파라미터를 1.15GB로 압축한 1-bit Bonsai LLM을 Apache 2.0으로 공개했다. 스마트폰에서도 실시간 추론이 가능한 엣지 AI의 새 장을 열었다.

Ollama가 MLX를 품었다, Apple Silicon 로컬 AI 추론 속도가 2배가 된 이유

Ollama v0.19가 Apple MLX 프레임워크를 통합해 디코드 속도 2배 향상을 달성했습니다. 로컬 AI 추론이 실용적 수준에 도달한 전환점과 5개 도구의 경쟁 구도를 분석합니다.

Claude Code 51만 줄이 NPM에서 유출되었다, 소스맵이 드러낸 비밀 로드맵

Anthropic의 Claude Code 전체 소스코드가 NPM 소스맵으로 두 번째 유출되었습니다. 512,000줄의 코드에서 다마고치 AI 펫 BUDDY, 상시 에이전트 KAIROS, Capybara 모델 등 미공개 로드맵이 발견되었습니다.

AI 에이전트가 주당 1.2억 건을 결제한다, 7대 프로토콜 전쟁의 전체 그림

Alipay AI Pay가 주당 1.2억 건 결제를 돌파했고, Visa TAP부터 Google AP2까지 7개 프로토콜이 동시에 등장했습니다. $262B 시장의 실체와 다크웹 사기 450% 증가까지, 에이전틱 결제의 현재를 분석합니다.

AI가 코드의 40%를 쓰면 누가 검증하나, Qodo $70M이 여는 시장

Qodo가 $70M Series B를 마감하며 AI 코드 검증 시장의 탄생을 선언했습니다. AI 생성 코드의 60%에 문제가 있고, 성능 비효율은 8배 높은 현실에서 검증이 새로운 인프라로 부상하고 있습니다.

개발자 84%가 AI를 쓰지만 46%는 믿지 않는다, 신뢰의 역설

Stack Overflow 49,000명 설문에서 AI 도구 채택률 84%와 불신률 46%가 동시에 사상 최고를 기록했습니다. METR과 Anthropic 연구가 밝힌 체감과 현실의 격차, 그리고 이 역설이 실무에 미치는 영향을 분석합니다.

AI Slopageddon, 오픈소스 메인테이너들이 AI에게 DDoS 당하고 있다

cURL이 버그 바운티를 폐쇄하고, Ghostty가 AI PR을 금지하고, Jazzband가 10년 만에 문을 닫았습니다. AI 생성 저품질 코드가 오픈소스 메인테이너의 주의력을 고갈시키는 구조적 위기, AI Slopageddon의 실체를 분석합니다.

AI 음악의 Fair Use 시대가 끝난다, 라이선스 모델로의 대전환

Google Lyria 3 Pro와 Suno v5.5가 24시간 간격으로 출시되며 AI 음악 시장이 격돌하고 있습니다. 그 이면에서 진행되는 저작권 4대 전선이 AI 창작물 전체의 법적 지형을 바꾸고 있습니다.

휴머노이드 로봇 10,000대가 출하됐다, 중국이 만들고 미국이 AI를 넣는다

AGIBOT가 누적 10,000대 출하를 달성하고 Unitree G1이 $13,500까지 가격을 낮추면서 휴머노이드 로봇 대량 생산 시대가 본격화되고 있습니다. 중국의 하드웨어 90% 점유와 미국의 AI 두뇌 경쟁이 만드는 새로운 분업 구조를 분석합니다.

Sora가 떠난 자리, AI 비디오 시장의 4강 전쟁이 시작됐다

Sora 셧다운 이후 AI 비디오 생성 시장이 품질, 비용, 생태계, 오픈소스 4개 계층으로 재편되고 있습니다. Runway, Kling, Veo, LTX의 포지셔닝과 크리에이터 이동 패턴을 분석합니다.

Cline Kanban 출시로 본 멀티에이전트 오케스트레이션, 새로운 전쟁이 시작됐다

Cline이 CLI-agnostic 멀티에이전트 오케스트레이션 도구 Kanban을 출시했습니다. 에이전트 5개를 동시에 돌리는 시대, 개발자 워크플로우의 구조적 전환을 분석합니다.

Cursor가 3개월 만에 ARR $2B를 찍었다, AI 코딩 도구 시장의 빛과 그림자

Cursor의 ARR이 3개월 만에 $1B에서 $2B로 두 배 성장했습니다. JetBrains 20년 성과를 24개월에 5배 돌파한 성장의 이면에는 Kimi 논란, Copilot 광고 삽입, Windsurf 가격 반발이 공존합니다. $10B 시장으로 향하는 AI 코딩 도구 전쟁의 현주소를 분석합니다.

주니어 개발자 채용 67% 급감, 커리어 사다리의 가운데가 사라지고 있다

미국 엔트리레벨 테크 채용이 67% 급감하고 빅테크 신입 비중이 32%에서 7%로 추락했습니다. Anthropic RCT가 밝힌 AI 의존의 역설, 바벨 경제의 구조적 위기, 그리고 2030년 시니어는 어디서 올 것인가를 분석합니다.

3년간 17건, OpenAI의 인수 기계가 조립하는 AI 플랫폼 제국

OpenAI가 2023년부터 17건의 M&A를 통해 AI 연구소에서 플랫폼 기업으로 변신하고 있습니다. 오픈소스 도구 인수 47%, $840B 밸류에이션, Google 출신 M&A 수장 영입까지, 인수 전략의 전체 그림을 분석합니다.

Copilot은 PR에 광고를 넣고 Claude Code는 코드를 지웠다

GitHub Copilot이 PR에 광고를 삽입하고(HN 539pt), Claude Code가 10분마다 git reset --hard로 코드를 삭제(HN 234pt)하는 사건이 동시에 터졌습니다. AI 코딩 도구의 신뢰 위기가 시작되었습니다.

Google Stitch 2.0이 Figma 주가를 12% 떨어뜨렸다, Vibe Design의 시작

Google이 AI 네이티브 디자인 캔버스 Stitch 2.0을 무료로 출시하며 Figma 주가가 12% 급락했습니다. Voice Canvas, Vibe Design, SDK/MCP 서버 통합으로 디자인 도구 시장의 판도가 바뀌고 있습니다.

Meta가 하루에 AI 칩 4세대를 공개했다, Nvidia 독립 경쟁의 시작

Meta가 MTIA 300-500까지 4세대 커스텀 AI 칩을 한꺼번에 공개했습니다. Google TPU, Amazon Trainium, Microsoft Maia까지 — 2026년 말까지 모든 주요 AI 기업이 자체 칩을 갖거나 구조적 비용 열위에 놓입니다.

Meta의 Manus가 데스크톱에 내려왔다, AI 에이전트 전쟁의 새 전선

Meta가 $2B에 인수한 Manus가 데스크톱 앱 My Computer를 출시했습니다. OpenClaw, Claude Cowork, Perplexity와 함께 데스크톱 AI 에이전트 4파전이 본격화되면서, 프라이버시와 편의성 사이의 트레이드오프가 핵심 쟁점으로 떠오르고 있습니다.

Langflow 취약점, 공시 20시간 만에 실전 공격 전환: AI 인프라 보안의 경고등

Langflow RCE 취약점 CVE-2026-33017이 공개 20시간 만에 무기화되었습니다. CISA KEV 등재, 패치 버전 오보, LiteLLM 공급망 공격까지 겹치며 AI 인프라가 새로운 공격 표면으로 부상하고 있습니다.

AI 에이전트 20개를 동시에 돌리다 막힌 개발자가 만든 무인 회사 운영체제

Paperclip은 여러 AI 에이전트를 하나의 회사처럼 조직화하는 오픈소스 오케스트레이션 플랫폼입니다. 3주 만에 GitHub 스타 4만 개를 돌파한 이 프로젝트가 AI 에이전트 인프라의 새로운 계층을 열고 있습니다.

OpenUI가 JSON을 밀어내고 있다, 생성형 UI 표준 전쟁의 서막

LLM이 UI를 직접 생성하는 시대가 열리고 있습니다. Thesys의 OpenUI가 JSON 대비 67% 토큰 절약과 3배 빠른 렌더링으로 생성형 UI의 새 표준을 제시하며, Vercel json-render, CopilotKit과 3파전을 벌이고 있습니다.

Intercom이 GPT-5.4와 Claude를 이기는 AI를 직접 만들었다, 버티컬 모델의 시대

Intercom이 60명의 AI 팀으로 개발한 Fin Apex 1.0이 고객 서비스 해결률에서 GPT-5.4(71.1%)와 Claude Opus 4.5(71.1%)를 73.1%로 능가했습니다. ARR $100M, 주 200만 건 해결. 버티컬 AI 모델 시대가 열렸습니다.

SoftBank이 $40B를 빌려 OpenAI에 걸었다, 역대 최대 AI 베팅의 구조

SoftBank이 $40B 무담보 대출을 받아 OpenAI에 투자했습니다. 12개월 만기의 이 대출 구조는 2026년 OpenAI IPO를 사실상 전제합니다. Alibaba에서 $200B를 벌고 WeWork에서 $18.5B를 잃은 손정의의 최대 베팅입니다.

인지적 암흑의 숲, AI가 열린 인터넷을 삼키고 있다

HN 421포인트를 기록한 "The Cognitive Dark Forest"가 던진 질문입니다. 봇이 인터넷 트래픽의 51%를 차지하고, AI가 공유된 아이디어를 학습 데이터로 흡수하는 시대에, 개발자는 여전히 공개적으로 코드를 공유해야 할까요?

코딩 에이전트가 자유 소프트웨어를 부활시킬 수 있을까

HN 167포인트를 기록한 글이 던진 질문입니다. AI 코딩 에이전트가 소스 코드 접근권을 실질적 권리로 바꾸면서, SaaS 시대에 잊혔던 소프트웨어 자유가 다시 의미를 갖기 시작했습니다. 하지만 Tailwind의 80% 매출 하락이 보여주듯, 이 부활에는 대가가 따릅니다.

ChatGPT에 프롬프트를 보내기 전, 브라우저에서 55가지가 읽힌다

보안 연구자가 Cloudflare Turnstile 프로그램 377개를 복호화하여 ChatGPT가 GPU 정보, React 내부 상태, 키스트로크 타이밍까지 수집하는 과정을 밝혔습니다. 28개 옵코드의 커스텀 VM이 매 요청마다 변하는 암호화 바이트코드를 실행합니다.

AI 얼굴 인식이 무고한 할머니를 6개월 감옥에 보냈다, Clearview AI의 실패

Clearview AI의 얼굴 인식이 테네시 할머니 Angela Lipps를 1,200마일 떨어진 노스다코타 은행 사기범으로 오인해 6개월간 감옥에 보냈습니다. 미국 9번째 AI 오인 체포 사건이 던지는 질문들.

백악관이 AI 규제의 방향을 선택했다, 저작권 면책과 주법 선점의 의미

3월 20일 백악관이 발표한 국가 AI 정책 프레임워크는 AI 훈련 데이터의 저작권 침해를 부정하고, 주정부의 AI 규제를 선점하며, 신규 규제 기관 설립을 거부합니다. EU AI Act와 정반대 방향입니다.

Nvidia Nemotron 3 Super가 Transformer만의 시대를 끝내고 있다

Nvidia가 Mamba-Transformer 하이브리드 MoE 아키텍처의 Nemotron 3 Super를 공개했습니다. 120B 파라미터 중 12B만 활성화하며, 에이전틱 AI의 context explosion 문제를 해결하는 새로운 아키텍처 패러다임입니다.

매출 0원에 25조원, Reflection AI가 보여주는 오픈소스 AI의 지정학

DeepMind 출신 창업자들의 Reflection AI가 매출 없이 $25B 밸류에이션을 받았습니다. Nvidia $800M, JPMorgan 국가안보 펀드까지 참여한 이 딜의 본질은 AI 기술이 아니라 지정학적 인프라 포지셔닝입니다.

Mistral이 ElevenLabs를 이기는 TTS를 오픈 웨이트로 풀었다, 음성 AI의 게임 체인저

Mistral AI가 3월 26일 출시한 Voxtral TTS는 4B 파라미터, 3GB RAM으로 구동되며 ElevenLabs 대비 68.4% 선호도를 기록합니다. 3초 음성 클로닝, 9개 언어 지원, API 가격은 ElevenLabs의 절반. 오픈 웨이트 TTS가 상용 서비스를 넘어선 첫 사례입니다.

AI는 왜 당신 편만 들까, Stanford가 Science에서 증명한 아첨의 구조

Stanford 연구팀이 Science 저널에 발표한 연구에서 ChatGPT, Claude, Gemini 등 11개 주요 LLM이 대인 관계 조언 시 인간보다 49% 더 사용자에게 동조하며, 유해한 행동도 47% 확률로 승인한다는 사실을 2,400명 실험으로 증명했습니다.

Shopify가 560만 매장을 ChatGPT에 연결했다, Instant Checkout 실패 후 AI 커머스의 재설계

OpenAI Instant Checkout이 12개 매장에서 멈춘 후, Shopify가 Agentic Storefronts로 560만 매장을 ChatGPT·Gemini·Copilot에 기본 연결했습니다. Universal Commerce Protocol과 함께 AI 커머스의 새로운 공식이 등장했습니다.

OpenAI Codex가 플러그인 마켓플레이스를 열었다, 코딩 에이전트는 이제 플랫폼이다

OpenAI가 Codex에 Slack, Figma, Notion 등 20개 이상의 플러그인을 탑재한 마켓플레이스를 출시했습니다. 코딩 에이전트가 IDE를 넘어 개발 워크플로우 전체를 장악하려는 플랫폼 전쟁이 시작됐습니다.

Visa가 AI 에이전트에 결제 능력을 부여했다, 유럽 21개 은행이 동시에 움직인 이유

Visa가 유럽 21개 금융사와 함께 Agentic Ready 프로그램을 런칭했습니다. Banco Santander는 AI 에이전트로 실제 구매를 완료했고, Mastercard, Stripe, Google이 각자의 표준을 내세우며 에이전틱 결제 인프라 전쟁이 시작되었습니다.

Cursor가 ripgrep을 1,300배 이긴 비결, GitHub Code Search의 로컬 부활

GitHub Code Search를 만든 Vicent Marti가 같은 sparse n-gram 기술을 Cursor에 로컬 적용했습니다. ripgrep 16.8초가 13ms로. AI 코딩 에이전트의 검색 병목이 해소되는 이유와 커뮤니티 반응을 분석합니다.

Anthropic의 차세대 모델 Mythos가 CMS 오류로 세상에 드러났다

Anthropic의 외부 CMS 설정 오류로 차세대 AI 모델 Claude Mythos의 존재가 유출되었습니다. Opus 위 신규 티어 Capybara, 코딩과 추론에서 질적 도약, 사이버보안 최강 AI를 표방하는 이 모델의 실체와 보안 아이러니, IPO 전략까지 분석합니다.

벡터 DB 회사 Chroma가 20B 검색 모델을 직접 만든 이유

Chroma가 20B 파라미터 검색 에이전트 모델 Context-1을 Apache 2.0으로 공개했습니다. 자기편집 메커니즘으로 Context Rot 문제를 해결하고, 프론티어 모델 대비 10배 빠르고 25배 저렴한 에이전틱 검색을 제시합니다.

YC CEO가 공개한 Claude Code 가상 엔지니어링 팀, GitHub 50K 스타의 실체

Y Combinator CEO Garry Tan이 공개한 gstack이 GitHub 50K 스타를 돌파했습니다. 60일간 60만 줄의 코드, 15개 AI 페르소나로 구성된 가상 엔지니어링 팀. AI 코딩에서 프롬프트가 아닌 프로세스가 핵심이라는 메시지가 업계를 양극화시키고 있습니다.

ChatGPT 900M, Midjourney 추락, 에이전트 부상: a16z AI 앱 리포트가 말하는 것

a16z가 Top 100 AI 소비자 앱 6판을 발표했습니다. ChatGPT WAU 900M으로 세계 인구 10% 돌파, Midjourney는 Top10에서 46위로 추락, OpenClaw가 GitHub 최다 스타를 기록했습니다. AI 소비자 시장의 구조적 변화를 분석합니다.

Figma MCP 서버가 캔버스를 열었다, AI 에이전트가 디자인을 직접 그리는 시대

Figma가 MCP 서버 write-to-canvas 베타와 Skills 프레임워크를 출시했습니다. AI 코딩 에이전트가 Figma 캔버스에 직접 디자인을 생성하고 수정할 수 있게 되면서, 디자인과 코드 사이의 핸드오프가 근본적으로 변화합니다.

Replit이 6개월 만에 $9B가 됐다, 병렬 AI 에이전트의 힘

Replit이 $400M 시리즈 D로 $9B 밸류에이션을 달성했습니다. 6개월 전 $3B에서 3배 성장. Agent 4의 병렬 에이전트, 90% 머지 충돌 자동 해결, Zillow의 7,000개 앱 생성 사례까지. 바이브 코딩의 현재와 한계를 분석합니다.

Anthropic이 AI로 AI를 감시한다, Claude Code Auto Mode의 2단계 분류기

Anthropic이 Claude Code에 auto mode를 도입했습니다. AI 분류기가 매 행위를 실시간으로 판단하는 2단계 안전 시스템으로, 93%의 승인 피로를 없애면서 0.4% 오탐률을 달성했습니다. AI 에이전트 안전성의 새로운 패러다임을 분석합니다.

AI 에이전트는 왜 자기 코드를 칭찬할까, Anthropic의 GAN 영감 해법

Anthropic이 GAN에서 영감 받은 Planner-Generator-Evaluator 3-에이전트 아키텍처를 공개했습니다. 자기 칭찬 편향을 구조적으로 해결하고, $9 솔로 에이전트 대비 $200 풀 하네스가 완전 작동 앱을 만들어냅니다.

JetBrains Central이 연 새 전쟁터, AI 코딩은 이제 "거버넌스"가 핵심이다

JetBrains가 AI 코딩 에이전트 거버넌스 플랫폼 Central과 LLM-agnostic CLI 에이전트 Junie를 공개했습니다. 코드 생성 경쟁에서 에이전트 관리 경쟁으로의 구조적 전환을 분석합니다.

GitHub Copilot이 당신의 코드로 AI를 학습시킨다, 4월 24일부터

GitHub이 Copilot Free/Pro/Pro+ 사용자의 코드 입력·출력·컨텍스트를 AI 모델 학습에 기본 사용한다고 발표했습니다. 옵트아웃 방식으로, 직접 끄지 않으면 동의한 것으로 간주합니다. 2,000만 개발자에게 영향을 미치는 이 정책 변경의 의미를 분석합니다.

ARC-AGI-3가 증명한 것: 최고의 AI도 인간의 12%에 불과하다

François Chollet이 만든 ARC-AGI-3가 3월 25일 출시되었습니다. 최초의 인터랙티브 AI 추론 벤치마크에서 최고 AI는 12.58%, GPT-5.4와 Grok 4.20은 0%를 기록했습니다. 1,000개 레벨, $2M 상금, 그리고 AI 지능 측정의 패러다임이 바뀌었습니다.

Google TurboQuant, LLM 메모리를 6배 줄이고 속도를 8배 올렸다

Google Research가 LLM KV 캐시를 3비트로 압축하면서 정확도 손실 제로를 달성하는 TurboQuant 알고리즘을 공개했습니다. H100 GPU에서 8배 속도 향상, 학습 불필요, 그리고 온디바이스 AI의 새로운 가능성까지 열어젖히는 이 기술의 의미를 분석합니다.

OpenAI가 올해 $14B를 태운다 — AI 산업은 지속 가능한가

OpenAI의 2026년 예상 손실은 $14B, 매출 $13B을 초과합니다. 추론 비용 4배 폭발, 총마진 40%→33% 붕괴, ChatGPT 점유율 22%p 하락. AI 산업의 경제적 지속가능성을 데이터로 분석합니다.

OpenAI가 Sora를 죽였다 — 6개월 만의 퇴장과 $1B Disney 딜의 붕괴

OpenAI가 AI 비디오 앱 Sora의 서비스 종료를 발표했습니다. 출시 6개월, 전체 매출 $2.1M, Disney $1B 딜 붕괴. 소비자 AI 앱의 현실과 OpenAI의 전략적 후퇴를 분석합니다.

Claude가 당신의 Mac을 조종한다: Computer Use와 Dispatch가 바꿀 AI 에이전트의 현실

Anthropic이 Claude로 실제 macOS를 직접 제어하는 Computer Use를 출시했습니다. Dispatch와 결합해 스마트폰에서 지시하고 데스크톱에서 실행하는 원격 AI 비서 시스템의 의미를 분석합니다.

iPhone 17 Pro에서 400B LLM이 돌아갔다, 온디바이스 AI의 새 이정표

RAM 12GB 스마트폰에서 200GB짜리 모델을 구동한 Flash-MoE 기술의 원리, A19 Pro의 AI 성능, 그리고 온디바이스 AI의 미래를 분석합니다.

Mistral Small 4 — 세 모델을 하나로 통합한 오픈소스 AI의 역습

Mistral AI가 추론, 비전, 코딩 3개 특화 모델을 119B MoE 하나로 통합했습니다. 활성 파라미터 6B, Apache 2.0, $0.15/M 토큰. AI 모델 파편화 시대의 종말을 알리는 통합 전략을 분석합니다.

Knuth가 "Shock!"라고 외친 순간: Claude가 수십 년 된 수학 문제를 1시간에 풀다

컴퓨터 과학의 아버지 Donald Knuth가 수십 년간 풀지 못한 그래프 이론 문제를 Claude Opus 4.6이 1시간 만에 해결했습니다. 87세 튜링상 수상자가 AI에 대한 입장을 수정한 역사적 순간입니다.

Anthropic이 펜타곤을 고소한 이유: AI 안전 원칙이 법정에 서다

Anthropic이 "대량 감시 금지, 자율 무기 금지" 레드라인을 고수하다 트럼프 행정부로부터 공급망 위험 지정을 받았습니다. AI 안전 원칙과 국가 안보가 법정에서 정면 충돌합니다.

AI가 수학자도 못 푼 문제를 풀었다: FrontierMath가 증명한 능력의 새 체제

Epoch AI의 FrontierMath 벤치마크에서 GPT-5.4 Pro가 미해결 수학 문제를 처음 풀었습니다. 4개 프론티어 모델이 같은 문제를 해결하며 "능력 체제"의 도래를 시사합니다.

Apple이 Siri의 두뇌를 라이벌 Google에게 맡긴 이유

Apple이 Google Gemini 1.2조 파라미터 모델로 Siri를 재구축합니다. 화면 인식, 멀티스텝 실행, 멀티턴 대화가 iOS 26.4에 탑재되며, AI 시대 하드웨어 기업의 전략 전환을 상징합니다.

Arm이 43년 만에 직접 만든 칩, AGI CPU와 에이전트 시대의 CPU 부활

Arm이 43년 IP 라이선싱 역사를 깨고 최초의 자체 프로덕션 칩 AGI CPU를 발표했습니다. 136코어 3nm, Meta가 리드 파트너. AI 에이전트 시대에 CPU가 부활하는 이유를 분석합니다.

AI가 전력망을 삼키고 있다: 데이터센터 에너지 전쟁의 실체

미국 데이터센터 전력이 5년간 150% 증가하며 지역 전기료가 267% 폭등했습니다. 트럼프는 빅테크를 백악관에 소환했고, Microsoft는 Three Mile Island 원전을 재가동합니다.

휴머노이드 로봇이 공장에 들어간 2026년, 대량 생산 원년의 시작

Boston Dynamics Atlas가 Hyundai 공장에 배치되고, Tesla Optimus Gen 3가 생산에 들어갔습니다. Q1에만 40억 달러 이상이 투자된 휴머노이드 로봇 산업의 현주소를 분석합니다.

Mozilla가 만든 AI 에이전트용 Stack Overflow, Cq의 야심과 보안 딜레마

Mozilla AI가 코딩 에이전트 간 지식 공유 플랫폼 Cq를 오픈소스로 공개했습니다. Stack Overflow가 월 20만 질문에서 3,862개로 추락한 시대, 에이전트에게 집단 기억을 주려는 실험과 보안 우려를 분석합니다.

OpenAI vs Anthropic 매출 역전 카운트다운, 소비자 왕국과 기업 제국의 결투

Anthropic이 기업 신규 AI 지출의 73%를 장악하며 OpenAI를 추격합니다. OpenAI $25B vs Anthropic $19B, 하지만 성장률 10배 vs 3.4배. Epoch AI는 2026년 중반 매출 역전을 전망합니다.

DeepSeek V4가 Nvidia를 배제하며 AI 생태계가 둘로 갈라지고 있다

DeepSeek이 V4 모델의 사전 접근을 Nvidia와 AMD에 거부하고 Huawei에 독점 제공했습니다. 1조 파라미터 모델이 중국산 칩에 최적화되며, 글로벌 AI 생태계의 분기가 현실이 되고 있습니다.

프론티어 모델 4파전, GPT부터 Grok까지 누구도 이기지 못한다

2026년 3월, GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro, Grok 4가 2주 간격으로 격돌했습니다. 벤치마크 차이 1-3%, 각 모델이 다른 영역에서 1위. 승자 없는 경쟁이 AI의 미래를 바꾸고 있습니다.

AI 앱은 다 어디로 갔나? PyPI 80만 패키지가 말하는 불편한 진실

answer.ai가 PyPI 데이터를 분석한 결과, AI 도구의 생산성 혁명은 데이터에서 보이지 않습니다. AI가 만든 것은 더 많은 소프트웨어가 아니라, 더 많은 AI 소프트웨어뿐이었습니다.

Karpathy의 선언: "인간이 AI 연구의 병목이다"

Andrej Karpathy가 630줄 Python으로 하룻밤에 100개 ML 실험을 자동 실행하는 Autoresearch를 공개했습니다. 20년 경험으로도 놓친 최적화를 AI가 찾아냈고, Shopify CEO는 19% 성능 향상을 보고했습니다.

Cursor의 자체 모델은 중국산이었다: Composer 2와 Kimi K2.5 논란의 전말

Cursor가 "자체 개발"로 발표한 Composer 2가 출시 3시간 만에 중국 Moonshot AI의 Kimi K2.5 기반임이 밝혀졌습니다. AI 코딩 도구 시장의 투명성과 미중 AI 지정학 이슈를 분석합니다.

Nvidia GTC 2026: GPU 회사가 $1조짜리 AI 공장 제국을 선언하다

Nvidia가 GTC 2026에서 7개 칩, 5개 랙의 Vera Rubin 플랫폼을 공개하고 2027년까지 1조 달러 매출을 전망했습니다. 추론 변곡점, AI 공장, 에이전트 스케일링이 핵심 키워드입니다.

Microsoft가 라이벌 Anthropic에게 Copilot의 두뇌를 맡긴 이유

Microsoft가 OpenAI가 아닌 Anthropic의 Claude로 Copilot Cowork를 구동합니다. 월 99달러 E7 티어와 함께 출시되며, 이는 AI 에이전트 시대의 멀티 모델 전략을 상징합니다.

LiteLLM 해킹 사건: AI 인프라를 노린 TeamPCP 연쇄 공급망 공격의 전말

월 9500만 다운로드 AI 프록시 LiteLLM이 공급망 공격으로 감염됐습니다. TeamPCP 그룹이 한 달간 Trivy, npm, KICS, LiteLLM을 연쇄 공격한 캠페인의 기술적 분석과 AI 생태계 보안 시사점을 정리합니다.

Perplexity가 재정의한 "Personal Computer", 24시간 상시 AI 에이전트의 등장

Perplexity가 Mac Mini에서 24시간 상시 구동되는 AI 에이전트 Personal Computer를 출시했습니다. 월 200달러로 파일, 앱, 업무를 통합 관리하며 엔터프라이즈 버전은 4주 만에 3.25년치 작업을 완료했다고 주장합니다.

OpenClaw, GitHub 250K Stars AI 에이전트가 촉발한 보안 위기와 상품화 논쟁

오스트리아 개발자 1명이 만든 OpenClaw가 GitHub 역사상 가장 빠르게 성장하며 React를 추월했습니다. 하지만 135,000개 인스턴스가 해킹에 노출되고 중국은 금지와 보조금을 동시에 내놓는 모순이 벌어지고 있습니다.

AI Washing: 5만 명을 해고한 테크 기업들은 정말 AI 때문이었을까?

Block, Oracle, Meta가 AI를 명분으로 5만 명 이상을 해고했습니다. 하지만 HBR 연구에 따르면 실제 AI 기반 대규모 감축은 2%에 불과합니다. AI Washing 논쟁의 실체를 분석합니다.

Walmart이 ChatGPT 결제를 포기한 이유, AI 커머스의 전환율 참사와 교훈

Walmart의 ChatGPT Instant Checkout 전환율이 자사 웹사이트 대비 3배 낮았다는 데이터가 공개되었습니다. OpenAI는 전 머천트에서 Instant Checkout을 폐지했고, Walmart은 자체 챗봇 Sparky로 전환합니다. AI 커머스는 왜 실패했을까요.

Anthropic이 공개한 역대 최대 AI 질적 연구: 81,000명이 말한 빛과 그림자

Anthropic이 159개국 81,000명을 대상으로 역대 최대 AI 질적 연구를 공개했습니다. AI가 가장 사랑받는 이유가 가장 두려운 이유와 같다는 빛과 그림자 문제가 핵심 발견입니다.

Apple이 바이브 코딩 앱을 차단하면서 Xcode AI 에이전트는 허용한 이유

Apple이 Replit, Vibecode 등 바이브 코딩 앱의 App Store 업데이트를 차단하며 App Store 가이드라인 2.5.2를 근거로 내세웠습니다. 동시에 Xcode 26.3에는 Anthropic과 OpenAI의 AI 에이전트를 통합한 상황. 개발자 커뮤니티는 이중잣대를 지적합니다.

Google AI Studio와 Antigravity가 여는 풀스택 바이브 코딩 시대

Google이 AI Studio에 Antigravity 코딩 에이전트와 Firebase를 통합해 브라우저에서 프롬프트만으로 풀스택 앱을 만드는 바이브 코딩 경험을 출시했습니다. AI 코딩 도구 전쟁의 판도가 어떻게 바뀌는지 분석합니다.

OpenAI가 Python의 심장을 샀다: Astral 인수와 AI 코딩 플랫폼 전쟁

OpenAI가 ruff와 uv를 만든 Astral을 인수합니다. 월 1.26억 다운로드의 Python 핵심 인프라가 AI 코딩 에이전트 Codex에 통합되는 이 움직임이 개발자 생태계에 미칠 파장을 분석합니다.

Yann LeCun이 10억 달러를 들고 LLM 시대에 반기를 들다: AMI Labs의 도전

튜링상 수상자 Yann LeCun이 설립한 AMI Labs가 유럽 역대 최대 시드 라운드 $10.3억을 기록했습니다. JEPA 아키텍처 기반 세계 모델로 autoregressive LLM 패러다임에 정면 도전하는 이 움직임의 의미를 분석합니다.

tRPC 실전 가이드: TypeScript로 스키마 없는 타입 안전 API 구축하기

REST의 타입 불일치, GraphQL의 스키마 피로감을 해결하는 tRPC의 핵심 개념부터 Next.js App Router 통합, 인증 미들웨어 패턴까지 실전 코드와 함께 알아봅니다.

2026 JavaScript 패키지 매니저 비교: npm, yarn, pnpm, Bun

npm, yarn, pnpm, Bun 네 가지 패키지 매니저의 설치 속도, 디스크 효율, 보안, 모노레포 지원을 벤치마크 수치와 함께 비교하고 상황별 선택 가이드를 제시합니다.

Zustand 완벽 가이드: React 상태 관리를 단순하게 만드는 법

Redux 보일러플레이트와 Context 리렌더링 문제에 지쳤다면, 1.2KB 경량 상태 관리 라이브러리 Zustand의 핵심 API부터 미들웨어, 실전 패턴, 안티패턴까지 알아봅니다.

Tailwind CSS v4 실전 가이드: CSS 우선 설정과 새로운 기능 총정리

Tailwind CSS v4의 CSS-first 설정 패러다임, Oxide 엔진의 빌드 성능 개선, Container Queries 등 새 기능, 그리고 v3에서의 마이그레이션 방법을 실전 코드와 함께 정리합니다.

RAG 실전 가이드: TypeScript와 AI SDK로 검색 증강 생성 구축하기

RAG의 핵심 원리부터 pgvector, AI SDK embed, Agentic RAG까지. TypeScript로 프로덕션급 RAG 파이프라인을 구축하는 단계별 가이드입니다.

AI 코드 리뷰 자동화: 2026년 주요 도구 비교와 실전 도입 가이드

AI 생성 코드가 42%에 달하는 시대, PR 리뷰 병목을 해결할 AI 코드 리뷰 도구 7종을 비교하고 팀 규모별 도입 전략을 안내합니다.

GPT-5.4 출시, AI가 처음으로 컴퓨터 사용에서 인간을 넘어섰다

OpenAI의 GPT-5.4가 OSWorld 벤치마크에서 75%를 기록하며 인간 전문가(72.4%)를 처음으로 초과했습니다. 네이티브 컴퓨터 사용, Tool Search, 1M 토큰 컨텍스트까지 — 3월 AI 모델 경쟁의 판도를 분석합니다.

로컬에서 돌리는 오픈소스 코딩 LLM: API 비용 0원으로 AI 코딩 환경 구축하기

Qwen3-Coder-Next, DeepSeek-V3.2, GLM-5 등 2026년 최신 오픈소스 코딩 모델을 Ollama와 Cline으로 로컬에서 실행하는 실전 가이드. SWE-Bench 벤치마크 비교부터 하드웨어 요구사항, 실무 활용 전략까지 다룹니다.

Claude Code 플러그인 완벽 가이드: Skills, Agents, Hooks로 워크플로우 확장하기

Claude Code 플러그인 시스템의 핵심 구성 요소인 Skills, Agents, Hooks를 코드 예시와 함께 살펴보고, 직접 플러그인을 만들어 봅니다.

AI 에이전트 프로토콜 전쟁: 경쟁사들이 하나의 재단에 모인 이유

MCP, A2A, AGENTS.md 등 AI 에이전트 프로토콜의 경쟁 구도와 AAIF 설립의 의미를 웹 표준 역사와 비교하며 분석합니다. 개발자가 이 생태계 변화에 어떻게 대응해야 하는지 살펴봅니다.

Context Engineering: 프롬프트를 넘어, 에이전트 시대의 핵심 설계 역량

프롬프트를 잘 쓰는 것만으로는 부족한 시대가 왔습니다. Context Engineering이 무엇이고, 왜 에이전트 시대의 핵심 역량으로 부상하는지 분석합니다.

Vibe Coding의 불편한 진실과 Spec Coding의 부상

AI 생성 코드의 45%에서 보안 취약점이 발견되고, 프로젝트는 3개월 만에 무너집니다. Vibe Coding의 성공과 한계를 데이터로 분석하고, Spec-Driven Development라는 대안을 살펴봅니다.

다중 에이전트 개발 패턴: 아키텍트-개발자-리뷰어 분리 전략

하나의 LLM에게 설계, 구현, 검증을 모두 맡기면 품질이 무너집니다. 역할을 분리하고 다중 모델을 조합하는 아키텍트-개발자-리뷰어 패턴과 5단계 검증 구조를 살펴봅니다.

Claude Agent SDK로 코드 리뷰 에이전트 만들기: PR 분석부터 코멘트까지

Claude Agent SDK를 사용해 GitHub PR을 자동으로 리뷰하는 에이전트를 처음부터 끝까지 만든다. 커스텀 도구 정의, MCP 서버 연동, 가드레일 설정까지 실전 코드와 함께 다룬다.

AI 시대 개발 워크플로우 재설계: 도구 조합부터 파이프라인 자동화까지

AI 코딩 도구를 개별적으로 쓰는 단계를 넘어, 개발 파이프라인 전체를 AI 중심으로 재설계하는 방법을 다룬다. 기획, 구현, 리뷰, 배포까지 각 단계에서 AI를 어떻게 조합하는지 실전 워크플로우로 정리했다.

Claude Code vs Cursor vs GitHub Copilot: 작업 유형별 실전 비교 가이드

2026년 가장 많이 쓰이는 AI 코딩 도구 3가지를 작업 유형별로 비교한다. 새 기능 구현, 버그 수정, 리팩토링, 코드 리뷰, 테스트 작성까지 — 언제 어떤 도구를 써야 하는지 정리했다.

Vitest: Jest를 대체하는 차세대 테스팅 프레임워크

Vite 기반의 빠르고 현대적인 테스팅 프레임워크 Vitest의 핵심 기능, Jest와의 비교, 실전 활용법을 알아본다.

Claude Code MCP 필수 추천 10가지: AI 프로그래밍 능력을 두 배로 만드는 도구

Claude Code의 능력을 확장하는 MCP(Model Context Protocol) 서버 10가지를 소개합니다. 설치 방법, 설정 가이드, 추천 조합까지 한눈에 알아봅니다.

Claude Code 200% 활용법: 계획과 실행을 분리하는 6단계 워크플로우

Claude Code를 9개월간 주력 도구로 사용한 개발자의 체계적 워크플로우를 분석합니다. 프롬프트-수정 반복 대신, 리서치-계획-주석-구현의 구조화된 접근법으로 AI 코딩의 품질을 극적으로 높이는 방법을 소개합니다.

Biome: ESLint + Prettier를 하나로 대체하는 올인원 도구

Rust로 만들어진 초고속 린터이자 포매터 Biome의 설치부터 설정, ESLint/Prettier 마이그레이션까지 핵심 사용법을 알아봅니다.

Hono: 어디서든 돌아가는 초경량 웹 프레임워크

Express를 대체할 차세대 웹 프레임워크 Hono의 설치부터 라우팅, 미들웨어, 다양한 런타임 배포까지 핵심 기능을 알아봅니다.

Effect: TypeScript에 견고함을 더하는 함수형 프레임워크

에러 처리, 동시성, 의존성 관리를 타입 레벨에서 해결하는 TypeScript 프레임워크 Effect의 핵심 개념과 기본 사용법을 알아봅니다.

Drizzle ORM: SQL을 아는 개발자를 위한 TypeScript ORM

SQL 친화적이고 가벼운 TypeScript ORM, Drizzle의 스키마 정의부터 쿼리 작성, 마이그레이션까지 핵심 사용법을 알아봅니다.

Zod: TypeScript 런타임 검증의 정석

TypeScript의 타입 안전성을 런타임까지 확장하는 스키마 검증 라이브러리 Zod의 기본 사용법부터 폼 검증, API 연동까지 실전 활용법을 알아봅니다.