Devlery

Devlery - AI 개발자를 위한 AI 뉴스 큐레이션

DEVLERYDEVLERYDEVLERY

Devlery blog

AI 개발자를 위한 최신 AI 뉴스 큐레이션.

헌법을 따르는 모델 2.0%, AI 행동 명세서의 감사법

헌법을 따르는 모델 2.0%, AI 행동 명세서의 감사법

새 논문은 Claude Constitution과 OpenAI Model Spec을 테스트 가능한 감사 대상으로 바꿨습니다. 모델 정책이 벤치마크가 되는 장면을 짚습니다.

유튜브가 AI 영상에 자동 라벨을 붙인다, 검출 책임의 이동

유튜브가 AI 영상에 자동 라벨을 붙인다, 검출 책임의 이동

YouTube가 AI 생성 영상 라벨을 플레이어 표면으로 옮기고 자동 검출을 시작했습니다. 크리에이터, 시청자, AI 제품팀의 실무 영향을 짚습니다.

Decepticon 1.1.3 공개, 레드팀 에이전트의 안전장치 시험

Decepticon 1.1.3 공개, 레드팀 에이전트의 안전장치 시험

Decepticon 1.1.3은 자동 해킹 데모보다 RoE, 샌드박스, 지식 그래프, 릴리스 검증이 더 중요한 레드팀 에이전트 사례입니다.

Takane 28포인트 개선, 자기개선 에이전트의 안전한 좁은 길

Takane 28포인트 개선, 자기개선 에이전트의 안전한 좁은 길

Fujitsu 자기진화 멀티 AI 에이전트는 업무 특화 LLM과 설계서 검색을 운영 중 계속 고치는 검증 루프를 보여줍니다.

CopilotKit 2700만 달러 투자, AG-UI와 에이전트 UI 경쟁

CopilotKit 2700만 달러 투자, AG-UI와 에이전트 UI 경쟁

CopilotKit의 2,700만 달러 Series A와 AG-UI가 에이전트 UI 표준 경쟁에서 갖는 의미를 짚습니다.

모델 선택도 조직별 통제, Copilot 청구서 앞의 새 규칙

모델 선택도 조직별 통제, Copilot 청구서 앞의 새 규칙

GitHub Copilot 모델 규칙은 6월 1일 AI Credits 전환을 앞두고 모델 선택을 조직별 비용·보안 통제 문제로 바꿉니다.

키워드 없이 이슈를 찾는다, Copilot 트리아지의 새 색인

키워드 없이 이슈를 찾는다, Copilot 트리아지의 새 색인

GitHub Copilot Chat의 semantic issue search는 이슈 검색을 키워드 매칭에서 에이전트용 backlog 이해 계층으로 넓힙니다.

잠긴 맥에서도 일한다, Codex 목표 모드의 새 경계

잠긴 맥에서도 일한다, Codex 목표 모드의 새 경계

OpenAI가 Codex에 Appshots, Goal mode GA, locked computer use를 추가했습니다. 코딩 에이전트가 장시간 작업자로 바뀌는 신호를 짚습니다.

AI 검색에도 선호 출처, 구글이 클릭의 새 버튼을 붙인 이유

AI 검색에도 선호 출처, 구글이 클릭의 새 버튼을 붙인 이유

Google이 Preferred Sources와 Highly Cited를 AI Overviews·AI Mode로 확장했습니다. AI 검색 시대의 출처, 클릭, 퍼블리셔 전략을 짚습니다.

11.1k 스타 React Doctor, AI가 쓴 React의 검진표

11.1k 스타 React Doctor, AI가 쓴 React의 검진표

React Doctor는 코딩 에이전트가 만든 React 코드를 state, effect, 성능, 보안, 접근성 기준으로 다시 검사하는 새 감사 루프입니다.

같은 PR에 12.5배 청구서, 코딩 에이전트 비용의 민낯

같은 PR에 12.5배 청구서, 코딩 에이전트 비용의 민낯

Joule Index V0.1은 코딩 에이전트 벤치마크에 달러, joule, 공개 trace를 붙이며 정확도 경쟁의 다음 질문을 꺼냈습니다.

41개 커밋의 착시, Claude Code가 넓힌 개발자 경계

41개 커밋의 착시, Claude Code가 넓힌 개발자 경계

새 arXiv 논문은 Claude Code 채택 뒤 개발자의 언어와 저장소 폭이 넓어지는 신호를 보였지만, 인과 해석에는 큰 빈칸이 남아 있습니다.