AI
26M 모델 Needle, 도구 호출을 온디바이스로 끌어내린다
Cactus Compute의 Needle은 도구 호출을 26M 파라미터 로컬 모델로 분리하려는 실험입니다. 에이전트 설계의 비용과 지연 시간을 다시 보게 합니다.
AI
Cactus Compute의 Needle은 도구 호출을 26M 파라미터 로컬 모델로 분리하려는 실험입니다. 에이전트 설계의 비용과 지연 시간을 다시 보게 합니다.
AI
NVIDIA와 Ineffable Intelligence의 협력은 모델 경쟁이 인간 데이터 이후의 RL 인프라 경쟁으로 이동하고 있음을 보여줍니다.
AI
OpenAI의 GPT-Realtime-2는 음성 AI를 답변형 인터페이스에서 도구 호출형 에이전트 런타임으로 옮기는 업데이트입니다.
AI
CAISI가 Google DeepMind, Microsoft, xAI와 사전 평가 협력을 넓혔습니다. 모델 출시는 이제 벤치마크 경쟁을 넘어 정부 평가 체계 경쟁으로 이동합니다.
AI
Anthropic이 Claude를 CoCounsel, LexisNexis, iManage와 연결했습니다. 법률 AI 경쟁은 답변 모델에서 검증 가능한 업무 데이터로 이동합니다.
AI
Google이 Gemini API File Search에 멀티모달 검색, 메타데이터 필터, 페이지 citation을 추가했습니다. RAG가 데모에서 운영 레이어로 이동하는 신호입니다.
AI
Google이 Gemma 4용 MTP drafter를 공개했습니다. 최대 3배 빠른 추론이 로컬 LLM과 AI 에이전트 배포에 주는 의미를 짚습니다.
AI
OpenAI가 GPT-5급 추론을 갖춘 GPT-Realtime-2와 실시간 번역·전사 모델을 공개했습니다. 음성 AI 경쟁이 음질에서 업무 수행 능력으로 이동하는 흐름을 살펴봅니다.
AI
MiniMax가 AI 모델이 자신의 학습 과정에 직접 참여하는 자기 진화 메커니즘의 M2.7을 오픈소스로 공개했습니다. 230B 파라미터 중 10B만 활성화하며 Claude Opus 4.6에 근접한 성능을 50배 이상 저렴한 가격에 제공합니다.
AI
Anthropic이 Claude Mythos Preview를 공개하면서 일반 배포를 거부했습니다. 모든 주요 OS에서 수천 개 제로데이를 발견한 이 모델은 Project Glasswing을 통해 방어적 보안 용도로만 제한 배포됩니다.
AI
Stanford HAI가 AI Index 2026을 발표했습니다. 생성형 AI는 3년 만에 인류 절반이 채택했지만, 모델 투명성은 58점에서 40점으로 추락했습니다. 에이전트 성공률 20%에서 77%로의 급등과 함께, 채택과 불투명성의 역설을 데이터로 분석합니다.

AI
중국 Z.ai가 744B MoE 모델 GLM-5.1을 MIT 라이선스로 공개하며 SWE-Bench Pro에서 Claude Opus 4.6과 GPT-5.4를 제치고 1위를 차지했습니다. 같은 주에 Meta가 클로즈드로 전환한 것과 극명한 대비를 이룹니다.