Devlery

Blog

개발에 대한 생각과 경험을 기록합니다.

Microsoft가 하루에 AI 모델 3개를 쏟아냈다, OpenAI 독립의 신호탄

Microsoft가 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 동시 출시하며 음성 전사부터 이미지 생성까지 자체 모델로 전환했다. $13B를 투자한 OpenAI에서 벗어나려는 Microsoft의 AI 독립 전략을 분석한다.

Q1 2026에 $297B가 몰렸다, AI가 VC 자금의 81%를 집어삼킨 분기

2026년 1분기 글로벌 VC 투자가 $297B로 역대 최고를 기록했다. AI가 81%를 독식하고, 4개 메가라운드가 전체의 64%를 차지한 초집중 구조를 분석한다.

Cohere Transcribe가 Whisper를 꺾었다, 오픈소스 음성 인식의 새 판이 열렸다

Cohere의 2B 파라미터 오픈소스 ASR 모델이 WER 5.42%로 HuggingFace 리더보드 1위를 차지했습니다. Apache 2.0 라이선스에 한국어 포함 14개 언어를 지원하며 Whisper 이후 3년간의 공백을 깨뜨렸습니다.

California가 AI 조달 인증을 무기로 꺼냈다, Trump의 허점을 파고든 Newsom의 전략

Newsom 주지사가 AI 기업에 조달 인증을 의무화하는 행정명령에 서명했다. Trump의 연방 선점 행정명령이 면제한 주정부 조달을 정확히 활용한 전략이 AI 규제 전쟁의 판도를 바꾸고 있다.

26바이트가 80억 파라미터를 바꿨다, TinyLoRA와 RL이 뒤집은 파인튜닝의 상식

Meta FAIR, Cornell, CMU 연구진의 TinyLoRA가 13개 파라미터(26바이트)로 8B 모델에 수학 추론을 가르쳤다. RL이 SFT보다 1000배 효율적이라는 증거가 파인튜닝의 패러다임을 바꾸고 있다.

AI가 DRAM의 70%를 삼킨다, 스팟 가격 700% 폭등의 구조적 원인

AI 데이터센터가 전 세계 DRAM 생산의 70%를 흡수하면서 스팟 가격이 700% 폭등했습니다. HBM 1비트 생산에 일반 DRAM 3비트가 사라지는 비가역적 전환이 PC, 스마트폰, 게임 콘솔 시장을 강타하고 있습니다.

8B LLM이 1GB에 담겼다, 1-bit 양자화가 실험실을 벗어난 날

PrismML이 세계 최초 상용 1-bit LLM Bonsai를 출시했습니다. 8B 모델이 1.15GB로 줄어 iPhone에서 44 tok/s로 구동되며, Caltech 30년 연구와 $16.25M 펀딩이 뒷받침합니다.

OpenAI $122B 펀딩이 클로즈됐다, $852B 적자 회사의 IPO 카운트다운

OpenAI가 역사상 최대 민간 펀딩 $122B를 클로즈하며 밸류에이션 $852B를 확정했습니다. Amazon $50B 조건부 투자, 리테일 $3B 참여, SoftBank $40B 레버리지의 구조와 AI IPO 시대의 의미를 분석합니다.

PrismML이 세계 최초 상용 1-bit LLM을 출시했다, Spotify 캐시보다 작은 8B 모델

Caltech 연구진이 설립한 PrismML이 8B 파라미터를 1.15GB로 압축한 1-bit Bonsai LLM을 Apache 2.0으로 공개했다. 스마트폰에서도 실시간 추론이 가능한 엣지 AI의 새 장을 열었다.

Ollama가 MLX를 품었다, Apple Silicon 로컬 AI 추론 속도가 2배가 된 이유

Ollama v0.19가 Apple MLX 프레임워크를 통합해 디코드 속도 2배 향상을 달성했습니다. 로컬 AI 추론이 실용적 수준에 도달한 전환점과 5개 도구의 경쟁 구도를 분석합니다.

AI 음악의 Fair Use 시대가 끝난다, 라이선스 모델로의 대전환

Google Lyria 3 Pro와 Suno v5.5가 24시간 간격으로 출시되며 AI 음악 시장이 격돌하고 있습니다. 그 이면에서 진행되는 저작권 4대 전선이 AI 창작물 전체의 법적 지형을 바꾸고 있습니다.

휴머노이드 로봇 10,000대가 출하됐다, 중국이 만들고 미국이 AI를 넣는다

AGIBOT가 누적 10,000대 출하를 달성하고 Unitree G1이 $13,500까지 가격을 낮추면서 휴머노이드 로봇 대량 생산 시대가 본격화되고 있습니다. 중국의 하드웨어 90% 점유와 미국의 AI 두뇌 경쟁이 만드는 새로운 분업 구조를 분석합니다.

Sora가 떠난 자리, AI 비디오 시장의 4강 전쟁이 시작됐다

Sora 셧다운 이후 AI 비디오 생성 시장이 품질, 비용, 생태계, 오픈소스 4개 계층으로 재편되고 있습니다. Runway, Kling, Veo, LTX의 포지셔닝과 크리에이터 이동 패턴을 분석합니다.

3년간 17건, OpenAI의 인수 기계가 조립하는 AI 플랫폼 제국

OpenAI가 2023년부터 17건의 M&A를 통해 AI 연구소에서 플랫폼 기업으로 변신하고 있습니다. 오픈소스 도구 인수 47%, $840B 밸류에이션, Google 출신 M&A 수장 영입까지, 인수 전략의 전체 그림을 분석합니다.

Meta가 하루에 AI 칩 4세대를 공개했다, Nvidia 독립 경쟁의 시작

Meta가 MTIA 300-500까지 4세대 커스텀 AI 칩을 한꺼번에 공개했습니다. Google TPU, Amazon Trainium, Microsoft Maia까지 — 2026년 말까지 모든 주요 AI 기업이 자체 칩을 갖거나 구조적 비용 열위에 놓입니다.

Langflow 취약점, 공시 20시간 만에 실전 공격 전환: AI 인프라 보안의 경고등

Langflow RCE 취약점 CVE-2026-33017이 공개 20시간 만에 무기화되었습니다. CISA KEV 등재, 패치 버전 오보, LiteLLM 공급망 공격까지 겹치며 AI 인프라가 새로운 공격 표면으로 부상하고 있습니다.

AI 에이전트 20개를 동시에 돌리다 막힌 개발자가 만든 무인 회사 운영체제

Paperclip은 여러 AI 에이전트를 하나의 회사처럼 조직화하는 오픈소스 오케스트레이션 플랫폼입니다. 3주 만에 GitHub 스타 4만 개를 돌파한 이 프로젝트가 AI 에이전트 인프라의 새로운 계층을 열고 있습니다.

SoftBank이 $40B를 빌려 OpenAI에 걸었다, 역대 최대 AI 베팅의 구조

SoftBank이 $40B 무담보 대출을 받아 OpenAI에 투자했습니다. 12개월 만기의 이 대출 구조는 2026년 OpenAI IPO를 사실상 전제합니다. Alibaba에서 $200B를 벌고 WeWork에서 $18.5B를 잃은 손정의의 최대 베팅입니다.

Nvidia Nemotron 3 Super가 Transformer만의 시대를 끝내고 있다

Nvidia가 Mamba-Transformer 하이브리드 MoE 아키텍처의 Nemotron 3 Super를 공개했습니다. 120B 파라미터 중 12B만 활성화하며, 에이전틱 AI의 context explosion 문제를 해결하는 새로운 아키텍처 패러다임입니다.

매출 0원에 25조원, Reflection AI가 보여주는 오픈소스 AI의 지정학

DeepMind 출신 창업자들의 Reflection AI가 매출 없이 $25B 밸류에이션을 받았습니다. Nvidia $800M, JPMorgan 국가안보 펀드까지 참여한 이 딜의 본질은 AI 기술이 아니라 지정학적 인프라 포지셔닝입니다.

Mistral이 ElevenLabs를 이기는 TTS를 오픈 웨이트로 풀었다, 음성 AI의 게임 체인저

Mistral AI가 3월 26일 출시한 Voxtral TTS는 4B 파라미터, 3GB RAM으로 구동되며 ElevenLabs 대비 68.4% 선호도를 기록합니다. 3초 음성 클로닝, 9개 언어 지원, API 가격은 ElevenLabs의 절반. 오픈 웨이트 TTS가 상용 서비스를 넘어선 첫 사례입니다.

Google TurboQuant, LLM 메모리를 6배 줄이고 속도를 8배 올렸다

Google Research가 LLM KV 캐시를 3비트로 압축하면서 정확도 손실 제로를 달성하는 TurboQuant 알고리즘을 공개했습니다. H100 GPU에서 8배 속도 향상, 학습 불필요, 그리고 온디바이스 AI의 새로운 가능성까지 열어젖히는 이 기술의 의미를 분석합니다.

OpenAI가 올해 $14B를 태운다 — AI 산업은 지속 가능한가

OpenAI의 2026년 예상 손실은 $14B, 매출 $13B을 초과합니다. 추론 비용 4배 폭발, 총마진 40%→33% 붕괴, ChatGPT 점유율 22%p 하락. AI 산업의 경제적 지속가능성을 데이터로 분석합니다.

OpenAI가 Sora를 죽였다 — 6개월 만의 퇴장과 $1B Disney 딜의 붕괴

OpenAI가 AI 비디오 앱 Sora의 서비스 종료를 발표했습니다. 출시 6개월, 전체 매출 $2.1M, Disney $1B 딜 붕괴. 소비자 AI 앱의 현실과 OpenAI의 전략적 후퇴를 분석합니다.

iPhone 17 Pro에서 400B LLM이 돌아갔다, 온디바이스 AI의 새 이정표

RAM 12GB 스마트폰에서 200GB짜리 모델을 구동한 Flash-MoE 기술의 원리, A19 Pro의 AI 성능, 그리고 온디바이스 AI의 미래를 분석합니다.

Arm이 43년 만에 직접 만든 칩, AGI CPU와 에이전트 시대의 CPU 부활

Arm이 43년 IP 라이선싱 역사를 깨고 최초의 자체 프로덕션 칩 AGI CPU를 발표했습니다. 136코어 3nm, Meta가 리드 파트너. AI 에이전트 시대에 CPU가 부활하는 이유를 분석합니다.

AI가 전력망을 삼키고 있다: 데이터센터 에너지 전쟁의 실체

미국 데이터센터 전력이 5년간 150% 증가하며 지역 전기료가 267% 폭등했습니다. 트럼프는 빅테크를 백악관에 소환했고, Microsoft는 Three Mile Island 원전을 재가동합니다.

휴머노이드 로봇이 공장에 들어간 2026년, 대량 생산 원년의 시작

Boston Dynamics Atlas가 Hyundai 공장에 배치되고, Tesla Optimus Gen 3가 생산에 들어갔습니다. Q1에만 40억 달러 이상이 투자된 휴머노이드 로봇 산업의 현주소를 분석합니다.

DeepSeek V4가 Nvidia를 배제하며 AI 생태계가 둘로 갈라지고 있다

DeepSeek이 V4 모델의 사전 접근을 Nvidia와 AMD에 거부하고 Huawei에 독점 제공했습니다. 1조 파라미터 모델이 중국산 칩에 최적화되며, 글로벌 AI 생태계의 분기가 현실이 되고 있습니다.

Nvidia GTC 2026: GPU 회사가 $1조짜리 AI 공장 제국을 선언하다

Nvidia가 GTC 2026에서 7개 칩, 5개 랙의 Vera Rubin 플랫폼을 공개하고 2027년까지 1조 달러 매출을 전망했습니다. 추론 변곡점, AI 공장, 에이전트 스케일링이 핵심 키워드입니다.

LiteLLM 해킹 사건: AI 인프라를 노린 TeamPCP 연쇄 공급망 공격의 전말

월 9500만 다운로드 AI 프록시 LiteLLM이 공급망 공격으로 감염됐습니다. TeamPCP 그룹이 한 달간 Trivy, npm, KICS, LiteLLM을 연쇄 공격한 캠페인의 기술적 분석과 AI 생태계 보안 시사점을 정리합니다.

AI Washing: 5만 명을 해고한 테크 기업들은 정말 AI 때문이었을까?

Block, Oracle, Meta가 AI를 명분으로 5만 명 이상을 해고했습니다. 하지만 HBR 연구에 따르면 실제 AI 기반 대규모 감축은 2%에 불과합니다. AI Washing 논쟁의 실체를 분석합니다.

Yann LeCun이 10억 달러를 들고 LLM 시대에 반기를 들다: AMI Labs의 도전

튜링상 수상자 Yann LeCun이 설립한 AMI Labs가 유럽 역대 최대 시드 라운드 $10.3억을 기록했습니다. JEPA 아키텍처 기반 세계 모델로 autoregressive LLM 패러다임에 정면 도전하는 이 움직임의 의미를 분석합니다.