본문 바로가기

728x90

경량 AI 모델2

Gemini 3.1 Flash-Lite: 2.5배 빠른 AI! 성능, 가격, 활용법 총정리 Gemini 3.1 Flash-Lite 핵심 요약초고속 및 저지연: 이전 버전 대비 응답 시작 속도 2.5배, 출력 속도 45% 향상으로 극도로 낮은 지연 시간과 높은 처리량을 제공합니다.기술적 혁신: 추론 워크로드에 최적화된 아키텍처, 'Thinking Level' 기능으로 속도와 정확성 조절, 고급 모델 증류 및 매개변수 공유 기술이 적용되었습니다.뛰어난 벤치마크 성능: GPQA Diamond 86.9%, MMMU Pro 76.8% 달성으로 경량 모델임에도 복잡한 추론 및 다중 모달리티 이해 능력을 입증했습니다.다양한 실무 워크플로우 최적화: 대량 번역, 콘텐츠 검토, UI 생성, 시뮬레이션 설계, 실시간 서비스 구축 등 7가지 주요 작업에 매우 효과적입니다.파격적인 가격 정책: 입력 1백만 토큰당 .. 2026. 4. 10.

GPT-5.4 미니 & 나노: 더 작고, 빠르고, 효율적인 AI 혁신! GPT-5.4 미니 & 나노 모델: 초고효율 AI의 새 시대2026년 3월 17일, 더 작고, 빠르며, 효율적인 경량 AI 모델인 GPT-5.4 mini와 GPT-5.4 nano가 공식 출시되었습니다.GPT-5.4 nano는 초당 최대 200 토큰, GPT-5.4 mini는 초당 180~190 토큰의 높은 API 처리량으로 실시간 응답 환경에 최적화되었습니다.벤치마크 결과, GPT-5.4 nano는 SWE-Bench Pro 52.4%, OSWorld 39.0%를 달성하며 이전 나노급 모델 대비 '주요한 도약'을 이루었습니다. GPT-5.4 mini는 풀 사이즈 GPT-5.4에 근접하는 성능을 보였습니다.GPT-5.4 nano는 입력 토큰당 $0.20, 출력 토큰당 $1.25, GPT-5.4 mini는 입.. 2026. 3. 23.

이전 1 다음

728x90

티스토리툴바