Devlery

Devlery - AI 개발자를 위한 AI 뉴스 큐레이션

DEVLERYDEVLERYDEVLERY

Devlery blog

AI 개발자를 위한 최신 AI 뉴스 큐레이션.

2.03배 토큰 처리량, EAGLE 3.1이 고친 추측의 흔들림

2.03배 토큰 처리량, EAGLE 3.1이 고친 추측의 흔들림

vLLM EAGLE 3.1은 speculative decoding의 attention drift를 줄여 long-context와 코딩 워크로드의 서빙 병목을 겨냥합니다.

AI가 에르되시 예상을 깼다, 수학 연구의 새 검증 루프

AI가 에르되시 예상을 깼다, 수학 연구의 새 검증 루프

OpenAI 모델의 단위거리 예상 반증은 AI 연구 자동화의 핵심이 답 생성보다 검증 가능한 증명 루프에 있음을 보여줍니다.

90일 사전검토가 멈췄다, AI 모델 출시표의 새 전쟁

90일 사전검토가 멈췄다, AI 모델 출시표의 새 전쟁

Trump의 AI 행정명령 연기는 frontier 모델 출시가 속도, 보안 평가, critical infrastructure 대응 사이에서 재편되고 있음을 보여줍니다.

SQLite에 붙은 에이전트, Datasette가 고른 좁은 길

SQLite에 붙은 에이전트, Datasette가 고른 좁은 길

Datasette Agent는 SQLite 데이터 탐색을 LLM, 플러그인 도구, 권한 모델, sandbox 실행과 결합한 좁지만 실용적인 에이전트 실험입니다.

1천 세션의 벽, 에이전트 제품 분석이 필요한 순간

1천 세션의 벽, 에이전트 제품 분석이 필요한 순간

Voker Launch HN을 계기로 에이전트 운영이 trace 디버깅에서 제품 분석 지표로 확장되는 흐름을 짚습니다.

3초 승인 장치, 에이전트 권한을 손에 쥐려는 하드웨어

3초 승인 장치, 에이전트 권한을 손에 쥐려는 하드웨어

Foundation Passport Prime은 AI 에이전트의 최종 승인권을 브라우저가 아니라 전용 하드웨어로 옮기려는 실험입니다.

한 번의 API 호출, Google이 에이전트 서버리스를 연 순간

한 번의 API 호출, Google이 에이전트 서버리스를 연 순간

Gemini API Managed Agents는 sandbox, 상태, 도구 루프를 API로 감추며 에이전트 런타임 경쟁을 새 단계로 옮깁니다.

1만5천 API를 묶은 AWS MCP, 클라우드 에이전트의 새 경계

1만5천 API를 묶은 AWS MCP, 클라우드 에이전트의 새 경계

AWS Agent Toolkit과 MCP Server GA는 코딩 에이전트의 클라우드 권한을 IAM, CloudWatch, CloudTrail로 통제하는 신호입니다.

Docusign MCP 베타, 계약서가 에이전트 도구가 되는 순간

Docusign MCP 베타, 계약서가 에이전트 도구가 되는 순간

Docusign Iris Agents와 MCP 베타가 계약 업무를 Claude, Gemini, ChatGPT의 도구 표면으로 바꾸는 의미를 짚습니다.

72% 브라우저 성공률, 작은 에이전트가 Operator를 넘은 지점

72% 브라우저 성공률, 작은 에이전트가 Operator를 넘은 지점

Microsoft Fara1.5는 작은 computer use 모델과 합성 웹 환경이 브라우저 에이전트 경쟁의 새 병목임을 보여줍니다.

15배 토큰 청구서, AI 네이티브 클라우드의 귀환

15배 토큰 청구서, AI 네이티브 클라우드의 귀환

DigitalOcean AI-Native Cloud는 에이전트 비용 병목이 GPU보다 추론 라우팅, 데이터, 상태, 운영 스택에 있음을 보여줍니다.

9억 Gemini 사용자 앞의 24시간 에이전트 권한 문제

9억 Gemini 사용자 앞의 24시간 에이전트 권한 문제

Google Gemini Spark는 24시간 백그라운드 에이전트를 대중 앱에 얹으며 MCP, 승인, 책임 경계를 새 쟁점으로 만들었습니다.