연구자들이 OpenAI의 o1 '추론' 모델에 대한 오픈 라이벌을 50달러 미만으로 만들었습니다.개발 관련 이야기2025. 2. 7. 14:38
Table of Contents
반응형
발전이 점점 가속화 되고 있네.. 컴퓨터가 지금 크기가 되는데 50년이 걸렸는데 그에 비하면 AI 모델은 놀라운 속도야
https://slashdot.org/story/25/02/06/1445231/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50
연구 논문에 따르면, 스탠포드와 워싱턴 대학의 AI 연구원들은 클라우드 컴퓨팅 크레딧으로 50달러 미만의 비용으로 AI '추론' 모델을 훈련할 수 있었습니다. 보고서에서 발췌:
s1이라고 알려진 이 모델은 수학 및 코딩 능력을 측정하는 테스트에서 OpenAI의 o1과 DeepSeek의 R1과 같은 최첨단 추론 모델과 유사한 성능을 발휘합니다. s1 모델은 훈련에 사용된 데이터 및 코드와 함께 GitHub에서 사용할 수 있습니다.
s1을 만든 팀은 기성품 기반 모델로 시작해서, 다른 AI 모델의 답변을 훈련시켜서 “추론” 기능을 추출하는 과정인 증류를 통해 세부 조정했다고 밝혔습니다. 연구원들은 s1이 구글의 추론 모델 중 하나인 Gemini 2.0 Flash Thinking Experimental에서 추출되었다고 말했습니다. 증류는 버클리 연구원들이 지난달 약 450달러에 AI 추론 모델을 만드는 데 사용한 것과 동일한 접근 방식입니다.
반응형
'개발 관련 이야기' 카테고리의 다른 글
Hugging Face가 24시간 만에 OpenAI의 Deep Research를 복제하다 (1) | 2025.02.07 |
---|---|
AMD, 데이터 센터에서 처음으로 인텔을 제치고 판매량 1위 달성 (1) | 2025.02.06 |
블로거의 경쟁 상대는 AI가 되는 건가 (0) | 2025.02.01 |
Claude를 사용한 프로그래밍 후기 (0) | 2025.01.29 |
NVIDIA에서 Linux GPU Kernel Module을 오픈 소스로 공개 (0) | 2024.07.22 |