Devlery - AI 개발자를 위한 AI 뉴스 큐레이션
Devlery blog
AI 개발자를 위한 최신 AI 뉴스 큐레이션.
Nova Act 100단계 제한, 브라우저 에이전트의 AWS 책임선
AWS Nova Act Service Card가 브라우저 에이전트의 100단계, 30분 세션, prompt injection 책임 경계를 문서화했습니다.
QVAC AI SDK Provider 공개, 로컬 모델을 AI SDK로 호출
Tether QVAC이 Vercel AI SDK provider를 공개했습니다. 로컬 OpenAI 호환 서버와 코딩 에이전트 연결 방식, 한계를 짚습니다.
Salt Code 40개 정책 공개, MCP로 코딩 어시스턴트를 통제
Salt Code는 MCP로 AI 코딩 어시스턴트에 보안 정책을 연결하고, 4개 팩과 40개 이상 정책을 생성 단계에 적용합니다.
Command A+ 공개, 2개 H100으로 돌리는 오픈웨이트 MoE
Cohere Command A+는 Apache 2.0, 218B MoE, 25B active, 128K context, 2개 H100 배포를 앞세운 기업용 오픈웨이트 모델입니다.
SageMaker OpenAI API 지원, AWS 모델 배포의 새 선택지
AWS SageMaker가 /openai/v1 endpoint를 지원합니다. OpenAI SDK, LangChain, Strands agent를 AWS hosted model로 옮기는 비용이 낮아졌습니다.
MiniMax M3 공개, 1M 컨텍스트 오픈웨이트 코딩 모델
MiniMax M3는 1M 컨텍스트, 멀티모달, 코딩 에이전트 벤치마크를 묶었지만 weights와 리포트는 아직 검증 대상입니다.
Mistral Search Toolkit 공개, RAG 실패를 검색 평가로 분리
Mistral Search Toolkit public preview는 RAG와 에이전트 검색 실패를 모델 문제가 아니라 retrieval 평가와 pipeline 문제로 나눕니다.
RTX Spark 공개, 120B LLM용 로컬 AI PC
NVIDIA와 Microsoft가 RTX Spark를 공개했습니다. 120B LLM, 128GB unified memory, OpenShell로 로컬 에이전트 PC를 겨냥합니다.
Codex 세무 AI 7000건 처리, 개선 루프는 eval에서 시작
OpenAI와 Thrive의 Tax AI 사례는 Codex가 production trace와 eval을 묶어 세무 agent를 개선한 방식을 공개했습니다.
ChatGPT Sheets 보안 보고, 사이드바까지 덮은 프롬프트 인젝션
PromptArmor가 ChatGPT for Google Sheets 유출 경로를 공개했고, OpenAI는 Apps Script 코드 생성을 제거했습니다.
Mythos 1만 건 취약점 발견, 패치 속도가 병목
Anthropic Project Glasswing 한 달 보고서는 Claude Mythos Preview가 취약점 발견 속도보다 패치와 공개 절차를 압박한다고 말합니다.
SkillOpt 52개 평가 셀 1위권, 에이전트 스킬은 학습 대상
Microsoft SkillOpt는 SKILL.md 같은 에이전트 스킬을 rollout과 검증 점수로 학습하는 배포 산출물로 다룹니다.