728x90 반응형 AI 에이전트 개발 동향1 gWorld-32B 심층 분석: 픽셀을 넘어 '코드'로 모바일 세상을 예측하는 최초의 월드모델 Key Takeaways세계 최초의 코드 기반 월드모델: 기존 픽셀 기반 예측의 한계를 넘어, 모바일 화면의 다음 상태를 '실행 가능한 HTML/CSS 코드'로 생성하여 텍스트와 아이콘의 왜곡 없는 렌더링을 구현합니다.Llama-4-402B 성능 상회: 50배 이상 작은 32B 매개변수 규모에도 불구하고, 모바일 GUI 예측 정확도에서 초거대 모델을 능가하는 경량화 및 최적화 기술력을 입증했습니다.압도적인 제로샷 성능: 국내 모바일 앱 환경에 특화된 'KApps' 벤치마크에서 별도 학습 없이 복잡한 다단계 작업을 성공적으로 수행하며 높은 실용성을 증명했습니다.'행동하는 AI'의 새로운 패러다임: UI 요소 간의 인과관계를 학습하여, 단순 자동화를 넘어 사용자의 목표를 이해하고 동적으로 변화하는 환경에 적.. 2026. 2. 10. 이전 1 다음 반응형