Blog
AI 뉴스와 코딩 에이전트, LLM, AI 인프라의 변화를 기록합니다.
Mistral 3 675B, 오픈 모델 전쟁의 새 기준선
Mistral 3는 675B MoE와 3B·8B·14B 엣지 모델을 Apache 2.0으로 묶어 오픈 AI의 경쟁축을 성능에서 배포로 옮깁니다.
My Lord라 부른 채용봇, AI 리크루팅의 진짜 취약점
LinkedIn 프로필 프롬프트 인젝션이 채용 자동화 메시지를 바꿨습니다. 공개 프로필과 이력서가 에이전트 입력이 될 때의 위험을 짚습니다.
안드로이드가 AI OS가 된다, Gemini의 진짜 관문
Google Gemini Intelligence는 Android를 앱 실행 OS에서 AI가 문맥을 읽고 행동하는 지능 시스템으로 바꾸려는 시도입니다.
Meta AI 시크릿 모드, 프라이버시는 이제 인프라 싸움
Meta Incognito Chat은 WhatsApp의 Private Processing으로 AI 대화를 처리합니다. 핵심은 기록 삭제가 아니라 검증 가능한 비공개 추론입니다.
SANA-WM 2.6B, 1분 월드 모델이 묻는 진짜 비용
NVIDIA SANA-WM은 2.6B 파라미터로 720p 60초 월드 모델을 주장합니다. 진짜 의미는 영상 품질보다 오픈 모델의 비용 구조입니다.
DAU 다음은 DAA, Baidu가 에이전트 지표를 꺼낸 이유
Baidu가 Daily Active Agents를 AI 시대 핵심 지표로 제안했습니다. 토큰 비용이 아니라 결과를 내는 에이전트 수를 보자는 주장입니다.
ChatGPT가 통장을 읽는다, 금융 AI의 안전선은 read-only
OpenAI가 ChatGPT 개인 금융 기능을 공개했습니다. 핵심은 예산 앱이 아니라 AI가 민감한 돈 데이터에 접근할 때의 권한 경계입니다.
Google이 본 첫 AI 제로데이, 보안의 시간표가 바뀐다
Google GTIG가 AI로 개발된 것으로 판단한 첫 제로데이 악용 시도를 공개했습니다. 취약점 발견과 방어 시간표가 달라지고 있습니다.
Codex Windows 샌드박스, 로컬 에이전트 보안의 기준
OpenAI가 Codex Windows 샌드박스 설계를 공개했습니다. 로컬 코딩 에이전트 보안이 앱 격리에서 OS 경계 설계로 이동합니다.
Superpowers 19만 스타, 코딩 에이전트의 공정표가 됐다
Superpowers는 코딩 에이전트 경쟁이 모델에서 반복 가능한 스킬, TDD, 리뷰, 워크트리 프로세스로 이동했음을 보여줍니다.
SocialReasoning-Bench, 에이전트 평가의 기준을 바꾸다
Microsoft Research가 SocialReasoning-Bench를 공개했습니다. 에이전트 평가는 작업 완료율에서 사용자 이익 대변으로 이동하고 있습니다.
중국 AI 에이전트 가이드라인, 지능 인터넷의 시작
중국의 AI 에이전트 시행 의견은 챗봇 규제를 넘어 등록, 신원, 상호운용, 권한, 추적을 갖춘 지능 인터넷 구상으로 이동합니다.