Gemini 3.1 Flash-Lite: 2.5배 빠른 AI! 성능, 가격, 활용법 총정리
Gemini 3.1 Flash-Lite 핵심 요약초고속 및 저지연: 이전 버전 대비 응답 시작 속도 2.5배, 출력 속도 45% 향상으로 극도로 낮은 지연 시간과 높은 처리량을 제공합니다.기술적 혁신: 추론 워크로드에 최적화된 아키텍처, 'Thinking Level' 기능으로 속도와 정확성 조절, 고급 모델 증류 및 매개변수 공유 기술이 적용되었습니다.뛰어난 벤치마크 성능: GPQA Diamond 86.9%, MMMU Pro 76.8% 달성으로 경량 모델임에도 복잡한 추론 및 다중 모달리티 이해 능력을 입증했습니다.다양한 실무 워크플로우 최적화: 대량 번역, 콘텐츠 검토, UI 생성, 시뮬레이션 설계, 실시간 서비스 구축 등 7가지 주요 작업에 매우 효과적입니다.파격적인 가격 정책: 입력 1백만 토큰당 ..
2026. 4. 10.