Devlery

Blog

개발에 대한 생각과 경험을 기록합니다.

Microsoft가 하루에 AI 모델 3개를 쏟아냈다, OpenAI 독립의 신호탄

Microsoft가 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 동시 출시하며 음성 전사부터 이미지 생성까지 자체 모델로 전환했다. $13B를 투자한 OpenAI에서 벗어나려는 Microsoft의 AI 독립 전략을 분석한다.

StepFun Step 3.5 Flash가 11B 활성 파라미터로 프론티어급 성능을 냈다

196B MoE 모델에서 11B만 활성화해 GPT-5.2급 성능을 달성한 StepFun Step 3.5 Flash. DeepSeek의 1/6 비용으로 Apache 2.0 오픈소스 공개된 중국 AI 모델을 분석한다.

Q1 2026에 $297B가 몰렸다, AI가 VC 자금의 81%를 집어삼킨 분기

2026년 1분기 글로벌 VC 투자가 $297B로 역대 최고를 기록했다. AI가 81%를 독식하고, 4개 메가라운드가 전체의 64%를 차지한 초집중 구조를 분석한다.

Perplexity가 사용자 대화를 Meta와 Google에 넘겼다, 집단소송이 터진 AI 검색의 민낯

Perplexity AI가 사용자 대화를 Meta/Google에 몰래 전송했다는 혐의로 집단소송이 제기됐다. Incognito 모드도 무력화됐다는 주장까지, 6번째 소송에 직면한 AI 검색의 위기를 분석한다.

California가 AI 조달 인증을 무기로 꺼냈다, Trump의 허점을 파고든 Newsom의 전략

Newsom 주지사가 AI 기업에 조달 인증을 의무화하는 행정명령에 서명했다. Trump의 연방 선점 행정명령이 면제한 주정부 조달을 정확히 활용한 전략이 AI 규제 전쟁의 판도를 바꾸고 있다.

OpenAI $122B 펀딩이 클로즈됐다, $852B 적자 회사의 IPO 카운트다운

OpenAI가 역사상 최대 민간 펀딩 $122B를 클로즈하며 밸류에이션 $852B를 확정했습니다. Amazon $50B 조건부 투자, 리테일 $3B 참여, SoftBank $40B 레버리지의 구조와 AI IPO 시대의 의미를 분석합니다.

Copilot은 PR에 광고를 넣고 Claude Code는 코드를 지웠다

GitHub Copilot이 PR에 광고를 삽입하고(HN 539pt), Claude Code가 10분마다 git reset --hard로 코드를 삭제(HN 234pt)하는 사건이 동시에 터졌습니다. AI 코딩 도구의 신뢰 위기가 시작되었습니다.

Meta가 하루에 AI 칩 4세대를 공개했다, Nvidia 독립 경쟁의 시작

Meta가 MTIA 300-500까지 4세대 커스텀 AI 칩을 한꺼번에 공개했습니다. Google TPU, Amazon Trainium, Microsoft Maia까지 — 2026년 말까지 모든 주요 AI 기업이 자체 칩을 갖거나 구조적 비용 열위에 놓입니다.

Intercom이 GPT-5.4와 Claude를 이기는 AI를 직접 만들었다, 버티컬 모델의 시대

Intercom이 60명의 AI 팀으로 개발한 Fin Apex 1.0이 고객 서비스 해결률에서 GPT-5.4(71.1%)와 Claude Opus 4.5(71.1%)를 73.1%로 능가했습니다. ARR $100M, 주 200만 건 해결. 버티컬 AI 모델 시대가 열렸습니다.

SoftBank이 $40B를 빌려 OpenAI에 걸었다, 역대 최대 AI 베팅의 구조

SoftBank이 $40B 무담보 대출을 받아 OpenAI에 투자했습니다. 12개월 만기의 이 대출 구조는 2026년 OpenAI IPO를 사실상 전제합니다. Alibaba에서 $200B를 벌고 WeWork에서 $18.5B를 잃은 손정의의 최대 베팅입니다.

인지적 암흑의 숲, AI가 열린 인터넷을 삼키고 있다

HN 421포인트를 기록한 "The Cognitive Dark Forest"가 던진 질문입니다. 봇이 인터넷 트래픽의 51%를 차지하고, AI가 공유된 아이디어를 학습 데이터로 흡수하는 시대에, 개발자는 여전히 공개적으로 코드를 공유해야 할까요?

코딩 에이전트가 자유 소프트웨어를 부활시킬 수 있을까

HN 167포인트를 기록한 글이 던진 질문입니다. AI 코딩 에이전트가 소스 코드 접근권을 실질적 권리로 바꾸면서, SaaS 시대에 잊혔던 소프트웨어 자유가 다시 의미를 갖기 시작했습니다. 하지만 Tailwind의 80% 매출 하락이 보여주듯, 이 부활에는 대가가 따릅니다.

ChatGPT에 프롬프트를 보내기 전, 브라우저에서 55가지가 읽힌다

보안 연구자가 Cloudflare Turnstile 프로그램 377개를 복호화하여 ChatGPT가 GPU 정보, React 내부 상태, 키스트로크 타이밍까지 수집하는 과정을 밝혔습니다. 28개 옵코드의 커스텀 VM이 매 요청마다 변하는 암호화 바이트코드를 실행합니다.

AI 얼굴 인식이 무고한 할머니를 6개월 감옥에 보냈다, Clearview AI의 실패

Clearview AI의 얼굴 인식이 테네시 할머니 Angela Lipps를 1,200마일 떨어진 노스다코타 은행 사기범으로 오인해 6개월간 감옥에 보냈습니다. 미국 9번째 AI 오인 체포 사건이 던지는 질문들.

백악관이 AI 규제의 방향을 선택했다, 저작권 면책과 주법 선점의 의미

3월 20일 백악관이 발표한 국가 AI 정책 프레임워크는 AI 훈련 데이터의 저작권 침해를 부정하고, 주정부의 AI 규제를 선점하며, 신규 규제 기관 설립을 거부합니다. EU AI Act와 정반대 방향입니다.

Nvidia Nemotron 3 Super가 Transformer만의 시대를 끝내고 있다

Nvidia가 Mamba-Transformer 하이브리드 MoE 아키텍처의 Nemotron 3 Super를 공개했습니다. 120B 파라미터 중 12B만 활성화하며, 에이전틱 AI의 context explosion 문제를 해결하는 새로운 아키텍처 패러다임입니다.

매출 0원에 25조원, Reflection AI가 보여주는 오픈소스 AI의 지정학

DeepMind 출신 창업자들의 Reflection AI가 매출 없이 $25B 밸류에이션을 받았습니다. Nvidia $800M, JPMorgan 국가안보 펀드까지 참여한 이 딜의 본질은 AI 기술이 아니라 지정학적 인프라 포지셔닝입니다.

Mistral이 ElevenLabs를 이기는 TTS를 오픈 웨이트로 풀었다, 음성 AI의 게임 체인저

Mistral AI가 3월 26일 출시한 Voxtral TTS는 4B 파라미터, 3GB RAM으로 구동되며 ElevenLabs 대비 68.4% 선호도를 기록합니다. 3초 음성 클로닝, 9개 언어 지원, API 가격은 ElevenLabs의 절반. 오픈 웨이트 TTS가 상용 서비스를 넘어선 첫 사례입니다.

AI는 왜 당신 편만 들까, Stanford가 Science에서 증명한 아첨의 구조

Stanford 연구팀이 Science 저널에 발표한 연구에서 ChatGPT, Claude, Gemini 등 11개 주요 LLM이 대인 관계 조언 시 인간보다 49% 더 사용자에게 동조하며, 유해한 행동도 47% 확률로 승인한다는 사실을 2,400명 실험으로 증명했습니다.

Shopify가 560만 매장을 ChatGPT에 연결했다, Instant Checkout 실패 후 AI 커머스의 재설계

OpenAI Instant Checkout이 12개 매장에서 멈춘 후, Shopify가 Agentic Storefronts로 560만 매장을 ChatGPT·Gemini·Copilot에 기본 연결했습니다. Universal Commerce Protocol과 함께 AI 커머스의 새로운 공식이 등장했습니다.

OpenAI Codex가 플러그인 마켓플레이스를 열었다, 코딩 에이전트는 이제 플랫폼이다

OpenAI가 Codex에 Slack, Figma, Notion 등 20개 이상의 플러그인을 탑재한 마켓플레이스를 출시했습니다. 코딩 에이전트가 IDE를 넘어 개발 워크플로우 전체를 장악하려는 플랫폼 전쟁이 시작됐습니다.

Visa가 AI 에이전트에 결제 능력을 부여했다, 유럽 21개 은행이 동시에 움직인 이유

Visa가 유럽 21개 금융사와 함께 Agentic Ready 프로그램을 런칭했습니다. Banco Santander는 AI 에이전트로 실제 구매를 완료했고, Mastercard, Stripe, Google이 각자의 표준을 내세우며 에이전틱 결제 인프라 전쟁이 시작되었습니다.

Cursor가 ripgrep을 1,300배 이긴 비결, GitHub Code Search의 로컬 부활

GitHub Code Search를 만든 Vicent Marti가 같은 sparse n-gram 기술을 Cursor에 로컬 적용했습니다. ripgrep 16.8초가 13ms로. AI 코딩 에이전트의 검색 병목이 해소되는 이유와 커뮤니티 반응을 분석합니다.

Anthropic의 차세대 모델 Mythos가 CMS 오류로 세상에 드러났다

Anthropic의 외부 CMS 설정 오류로 차세대 AI 모델 Claude Mythos의 존재가 유출되었습니다. Opus 위 신규 티어 Capybara, 코딩과 추론에서 질적 도약, 사이버보안 최강 AI를 표방하는 이 모델의 실체와 보안 아이러니, IPO 전략까지 분석합니다.

벡터 DB 회사 Chroma가 20B 검색 모델을 직접 만든 이유

Chroma가 20B 파라미터 검색 에이전트 모델 Context-1을 Apache 2.0으로 공개했습니다. 자기편집 메커니즘으로 Context Rot 문제를 해결하고, 프론티어 모델 대비 10배 빠르고 25배 저렴한 에이전틱 검색을 제시합니다.

ChatGPT 900M, Midjourney 추락, 에이전트 부상: a16z AI 앱 리포트가 말하는 것

a16z가 Top 100 AI 소비자 앱 6판을 발표했습니다. ChatGPT WAU 900M으로 세계 인구 10% 돌파, Midjourney는 Top10에서 46위로 추락, OpenClaw가 GitHub 최다 스타를 기록했습니다. AI 소비자 시장의 구조적 변화를 분석합니다.

Figma MCP 서버가 캔버스를 열었다, AI 에이전트가 디자인을 직접 그리는 시대

Figma가 MCP 서버 write-to-canvas 베타와 Skills 프레임워크를 출시했습니다. AI 코딩 에이전트가 Figma 캔버스에 직접 디자인을 생성하고 수정할 수 있게 되면서, 디자인과 코드 사이의 핸드오프가 근본적으로 변화합니다.

Replit이 6개월 만에 $9B가 됐다, 병렬 AI 에이전트의 힘

Replit이 $400M 시리즈 D로 $9B 밸류에이션을 달성했습니다. 6개월 전 $3B에서 3배 성장. Agent 4의 병렬 에이전트, 90% 머지 충돌 자동 해결, Zillow의 7,000개 앱 생성 사례까지. 바이브 코딩의 현재와 한계를 분석합니다.

Anthropic이 AI로 AI를 감시한다, Claude Code Auto Mode의 2단계 분류기

Anthropic이 Claude Code에 auto mode를 도입했습니다. AI 분류기가 매 행위를 실시간으로 판단하는 2단계 안전 시스템으로, 93%의 승인 피로를 없애면서 0.4% 오탐률을 달성했습니다. AI 에이전트 안전성의 새로운 패러다임을 분석합니다.

AI 에이전트는 왜 자기 코드를 칭찬할까, Anthropic의 GAN 영감 해법

Anthropic이 GAN에서 영감 받은 Planner-Generator-Evaluator 3-에이전트 아키텍처를 공개했습니다. 자기 칭찬 편향을 구조적으로 해결하고, $9 솔로 에이전트 대비 $200 풀 하네스가 완전 작동 앱을 만들어냅니다.

JetBrains Central이 연 새 전쟁터, AI 코딩은 이제 "거버넌스"가 핵심이다

JetBrains가 AI 코딩 에이전트 거버넌스 플랫폼 Central과 LLM-agnostic CLI 에이전트 Junie를 공개했습니다. 코드 생성 경쟁에서 에이전트 관리 경쟁으로의 구조적 전환을 분석합니다.

GitHub Copilot이 당신의 코드로 AI를 학습시킨다, 4월 24일부터

GitHub이 Copilot Free/Pro/Pro+ 사용자의 코드 입력·출력·컨텍스트를 AI 모델 학습에 기본 사용한다고 발표했습니다. 옵트아웃 방식으로, 직접 끄지 않으면 동의한 것으로 간주합니다. 2,000만 개발자에게 영향을 미치는 이 정책 변경의 의미를 분석합니다.

ARC-AGI-3가 증명한 것: 최고의 AI도 인간의 12%에 불과하다

François Chollet이 만든 ARC-AGI-3가 3월 25일 출시되었습니다. 최초의 인터랙티브 AI 추론 벤치마크에서 최고 AI는 12.58%, GPT-5.4와 Grok 4.20은 0%를 기록했습니다. 1,000개 레벨, $2M 상금, 그리고 AI 지능 측정의 패러다임이 바뀌었습니다.

Google TurboQuant, LLM 메모리를 6배 줄이고 속도를 8배 올렸다

Google Research가 LLM KV 캐시를 3비트로 압축하면서 정확도 손실 제로를 달성하는 TurboQuant 알고리즘을 공개했습니다. H100 GPU에서 8배 속도 향상, 학습 불필요, 그리고 온디바이스 AI의 새로운 가능성까지 열어젖히는 이 기술의 의미를 분석합니다.

OpenAI가 올해 $14B를 태운다 — AI 산업은 지속 가능한가

OpenAI의 2026년 예상 손실은 $14B, 매출 $13B을 초과합니다. 추론 비용 4배 폭발, 총마진 40%→33% 붕괴, ChatGPT 점유율 22%p 하락. AI 산업의 경제적 지속가능성을 데이터로 분석합니다.

OpenAI가 Sora를 죽였다 — 6개월 만의 퇴장과 $1B Disney 딜의 붕괴

OpenAI가 AI 비디오 앱 Sora의 서비스 종료를 발표했습니다. 출시 6개월, 전체 매출 $2.1M, Disney $1B 딜 붕괴. 소비자 AI 앱의 현실과 OpenAI의 전략적 후퇴를 분석합니다.

iPhone 17 Pro에서 400B LLM이 돌아갔다, 온디바이스 AI의 새 이정표

RAM 12GB 스마트폰에서 200GB짜리 모델을 구동한 Flash-MoE 기술의 원리, A19 Pro의 AI 성능, 그리고 온디바이스 AI의 미래를 분석합니다.

Mistral Small 4 — 세 모델을 하나로 통합한 오픈소스 AI의 역습

Mistral AI가 추론, 비전, 코딩 3개 특화 모델을 119B MoE 하나로 통합했습니다. 활성 파라미터 6B, Apache 2.0, $0.15/M 토큰. AI 모델 파편화 시대의 종말을 알리는 통합 전략을 분석합니다.

Knuth가 "Shock!"라고 외친 순간: Claude가 수십 년 된 수학 문제를 1시간에 풀다

컴퓨터 과학의 아버지 Donald Knuth가 수십 년간 풀지 못한 그래프 이론 문제를 Claude Opus 4.6이 1시간 만에 해결했습니다. 87세 튜링상 수상자가 AI에 대한 입장을 수정한 역사적 순간입니다.

Anthropic이 펜타곤을 고소한 이유: AI 안전 원칙이 법정에 서다

Anthropic이 "대량 감시 금지, 자율 무기 금지" 레드라인을 고수하다 트럼프 행정부로부터 공급망 위험 지정을 받았습니다. AI 안전 원칙과 국가 안보가 법정에서 정면 충돌합니다.

AI가 수학자도 못 푼 문제를 풀었다: FrontierMath가 증명한 능력의 새 체제

Epoch AI의 FrontierMath 벤치마크에서 GPT-5.4 Pro가 미해결 수학 문제를 처음 풀었습니다. 4개 프론티어 모델이 같은 문제를 해결하며 "능력 체제"의 도래를 시사합니다.

Apple이 Siri의 두뇌를 라이벌 Google에게 맡긴 이유

Apple이 Google Gemini 1.2조 파라미터 모델로 Siri를 재구축합니다. 화면 인식, 멀티스텝 실행, 멀티턴 대화가 iOS 26.4에 탑재되며, AI 시대 하드웨어 기업의 전략 전환을 상징합니다.

AI가 전력망을 삼키고 있다: 데이터센터 에너지 전쟁의 실체

미국 데이터센터 전력이 5년간 150% 증가하며 지역 전기료가 267% 폭등했습니다. 트럼프는 빅테크를 백악관에 소환했고, Microsoft는 Three Mile Island 원전을 재가동합니다.

휴머노이드 로봇이 공장에 들어간 2026년, 대량 생산 원년의 시작

Boston Dynamics Atlas가 Hyundai 공장에 배치되고, Tesla Optimus Gen 3가 생산에 들어갔습니다. Q1에만 40억 달러 이상이 투자된 휴머노이드 로봇 산업의 현주소를 분석합니다.

OpenAI vs Anthropic 매출 역전 카운트다운, 소비자 왕국과 기업 제국의 결투

Anthropic이 기업 신규 AI 지출의 73%를 장악하며 OpenAI를 추격합니다. OpenAI $25B vs Anthropic $19B, 하지만 성장률 10배 vs 3.4배. Epoch AI는 2026년 중반 매출 역전을 전망합니다.

DeepSeek V4가 Nvidia를 배제하며 AI 생태계가 둘로 갈라지고 있다

DeepSeek이 V4 모델의 사전 접근을 Nvidia와 AMD에 거부하고 Huawei에 독점 제공했습니다. 1조 파라미터 모델이 중국산 칩에 최적화되며, 글로벌 AI 생태계의 분기가 현실이 되고 있습니다.

프론티어 모델 4파전, GPT부터 Grok까지 누구도 이기지 못한다

2026년 3월, GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro, Grok 4가 2주 간격으로 격돌했습니다. 벤치마크 차이 1-3%, 각 모델이 다른 영역에서 1위. 승자 없는 경쟁이 AI의 미래를 바꾸고 있습니다.

AI 앱은 다 어디로 갔나? PyPI 80만 패키지가 말하는 불편한 진실

answer.ai가 PyPI 데이터를 분석한 결과, AI 도구의 생산성 혁명은 데이터에서 보이지 않습니다. AI가 만든 것은 더 많은 소프트웨어가 아니라, 더 많은 AI 소프트웨어뿐이었습니다.

Karpathy의 선언: "인간이 AI 연구의 병목이다"

Andrej Karpathy가 630줄 Python으로 하룻밤에 100개 ML 실험을 자동 실행하는 Autoresearch를 공개했습니다. 20년 경험으로도 놓친 최적화를 AI가 찾아냈고, Shopify CEO는 19% 성능 향상을 보고했습니다.

Cursor의 자체 모델은 중국산이었다: Composer 2와 Kimi K2.5 논란의 전말

Cursor가 "자체 개발"로 발표한 Composer 2가 출시 3시간 만에 중국 Moonshot AI의 Kimi K2.5 기반임이 밝혀졌습니다. AI 코딩 도구 시장의 투명성과 미중 AI 지정학 이슈를 분석합니다.

Nvidia GTC 2026: GPU 회사가 $1조짜리 AI 공장 제국을 선언하다

Nvidia가 GTC 2026에서 7개 칩, 5개 랙의 Vera Rubin 플랫폼을 공개하고 2027년까지 1조 달러 매출을 전망했습니다. 추론 변곡점, AI 공장, 에이전트 스케일링이 핵심 키워드입니다.

Microsoft가 라이벌 Anthropic에게 Copilot의 두뇌를 맡긴 이유

Microsoft가 OpenAI가 아닌 Anthropic의 Claude로 Copilot Cowork를 구동합니다. 월 99달러 E7 티어와 함께 출시되며, 이는 AI 에이전트 시대의 멀티 모델 전략을 상징합니다.

Perplexity가 재정의한 "Personal Computer", 24시간 상시 AI 에이전트의 등장

Perplexity가 Mac Mini에서 24시간 상시 구동되는 AI 에이전트 Personal Computer를 출시했습니다. 월 200달러로 파일, 앱, 업무를 통합 관리하며 엔터프라이즈 버전은 4주 만에 3.25년치 작업을 완료했다고 주장합니다.

OpenClaw, GitHub 250K Stars AI 에이전트가 촉발한 보안 위기와 상품화 논쟁

오스트리아 개발자 1명이 만든 OpenClaw가 GitHub 역사상 가장 빠르게 성장하며 React를 추월했습니다. 하지만 135,000개 인스턴스가 해킹에 노출되고 중국은 금지와 보조금을 동시에 내놓는 모순이 벌어지고 있습니다.

AI Washing: 5만 명을 해고한 테크 기업들은 정말 AI 때문이었을까?

Block, Oracle, Meta가 AI를 명분으로 5만 명 이상을 해고했습니다. 하지만 HBR 연구에 따르면 실제 AI 기반 대규모 감축은 2%에 불과합니다. AI Washing 논쟁의 실체를 분석합니다.

Walmart이 ChatGPT 결제를 포기한 이유, AI 커머스의 전환율 참사와 교훈

Walmart의 ChatGPT Instant Checkout 전환율이 자사 웹사이트 대비 3배 낮았다는 데이터가 공개되었습니다. OpenAI는 전 머천트에서 Instant Checkout을 폐지했고, Walmart은 자체 챗봇 Sparky로 전환합니다. AI 커머스는 왜 실패했을까요.

Anthropic이 공개한 역대 최대 AI 질적 연구: 81,000명이 말한 빛과 그림자

Anthropic이 159개국 81,000명을 대상으로 역대 최대 AI 질적 연구를 공개했습니다. AI가 가장 사랑받는 이유가 가장 두려운 이유와 같다는 빛과 그림자 문제가 핵심 발견입니다.

Apple이 바이브 코딩 앱을 차단하면서 Xcode AI 에이전트는 허용한 이유

Apple이 Replit, Vibecode 등 바이브 코딩 앱의 App Store 업데이트를 차단하며 App Store 가이드라인 2.5.2를 근거로 내세웠습니다. 동시에 Xcode 26.3에는 Anthropic과 OpenAI의 AI 에이전트를 통합한 상황. 개발자 커뮤니티는 이중잣대를 지적합니다.