본문 바로가기

728x90

SWE-Bench Pro2

GLM-5.1: AI 자기 진화 시대 개척! 개발 5일→8시간, 6배 성능 혁신 GLM-5.1: AI 자기 진화 시대 개척과 개발 패러다임 혁신GLM-5.1은 '단순 실행'을 넘어 '지속적 개선' 패러다임을 AI 영역에 도입하며 '자기 진화' 단계에 진입했음을 입증했습니다.벡터 데이터베이스 최적화에서 6배 성능 향상, 8시간 만에 웹 기반 리눅스 데스크톱 환경 구축 등 경이로운 실증 사례로 그 능력을 증명했습니다.세계 최고 성능 모델 중 하나이자 오픈 모델 중 최고 리더로, SWE-Bench Pro를 선도하며 오픈소스와 클로즈드소스 모델 간 코딩 성능 격차를 사실상 해소했습니다.개발 작업 시간을 3~5일에서 6~8시간으로 단축시키는 혁신적인 생산성 향상을 제공하며, MIT 라이선스 및 다양한 플랫폼을 통한 폭넓은 접근성을 자랑합니다.다만, 장기 실행 안정성, 자기 평가 능력의 한계,.. 2026. 5. 20.

GPT-5.4 미니 & 나노: 더 작고, 빠르고, 효율적인 AI 혁신! GPT-5.4 미니 & 나노 모델: 초고효율 AI의 새 시대2026년 3월 17일, 더 작고, 빠르며, 효율적인 경량 AI 모델인 GPT-5.4 mini와 GPT-5.4 nano가 공식 출시되었습니다.GPT-5.4 nano는 초당 최대 200 토큰, GPT-5.4 mini는 초당 180~190 토큰의 높은 API 처리량으로 실시간 응답 환경에 최적화되었습니다.벤치마크 결과, GPT-5.4 nano는 SWE-Bench Pro 52.4%, OSWorld 39.0%를 달성하며 이전 나노급 모델 대비 '주요한 도약'을 이루었습니다. GPT-5.4 mini는 풀 사이즈 GPT-5.4에 근접하는 성능을 보였습니다.GPT-5.4 nano는 입력 토큰당 $0.20, 출력 토큰당 $1.25, GPT-5.4 mini는 입.. 2026. 3. 23.

이전 1 다음

728x90

티스토리툴바