본문 바로가기
728x90
반응형

월드 모델2

DreamDojo 심층 분석: 44,000시간 인간 비디오로 구축한 범용 로봇 월드 모델의 모든 것 Key Takeaways대규모 인간 비디오 활용: 44,000시간에 달하는 1인칭 인간 비디오 데이터셋(DreamDojo-HV)을 기반으로, 로봇이 현실 세계의 물리 법칙과 상호작용을 학습합니다.연속 잠재 액션 도입: 기존의 이산적 제어 방식과 달리, self-supervised 방식으로 추출된 '연속 잠재 액션'을 통해 미세하고 부드러운 로봇 제어를 가능하게 합니다.실시간 예측 성능: 증류(Distillation) 파이프라인을 통해 모델을 경량화하여 640x480 해상도에서 10.81 FPS의 실시간 예측 성능을 달성, 라이브 원격 조작에 적용할 수 있습니다.뛰어난 OOD 일반화: 학습 데이터에 없던 새로운 객체, 환경, 기술에 대해서도 높은 제로샷(Zero-shot) 일반화 성능을 보여 범용 로봇의 .. 2026. 2. 9.
AI가 세계를 '상상'한다: 구글 프로젝트 지니, 게임의 미래를 바꿀까? 당신의 상상력을 현실로: 구글 프로젝트 지니, 돈과 시간을 아껴주는 AI 월드 빌더의 등장안녕하세요, 워크플로우 아키텍트입니다.이번 주, AI의 지형을 뒤흔들 만한 소식이 전해졌습니다.단순히 영상을 생성하는 것을 넘어, 사용자의 행동에 반응하는 ‘인터랙티브 가상 세계’를 실시간으로 만드는 기술이 등장했기 때문입니다.구글 딥마인드의 '프로젝트 지니(Project Genie)'와 그 핵심 엔진인 'Genie 3' 월드 모델이 바로 그 주인공입니다.이것이 지금 당장 당신의 업무와 창작에 어떤 영향을 미칠 수 있을까요?현실적인 관점에서, 돈과 시간을 어떻게 절약할 수 있는지 구체적으로 알아보겠습니다.1. The Shift (상황 변화): AI가 '세계를 상상'하기 시작했습니다.우리는 텍스트로 이미지를 만들고, .. 2026. 1. 30.
반응형