개발 관련 이야기

연구자들이 OpenAI의 o1 '추론' 모델에 대한 오픈 라이벌을 50달러 미만으로 만들었습니다.

webnautes 2025. 2. 7. 14:38
반응형

발전이 점점 가속화 되고 있네.. 컴퓨터가 지금 크기가 되는데 50년이 걸렸는데 그에 비하면 AI  모델은 놀라운 속도야

https://slashdot.org/story/25/02/06/1445231/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50


연구 논문에 따르면, 스탠포드와 워싱턴 대학의 AI 연구원들은 클라우드 컴퓨팅 크레딧으로 50달러 미만의 비용으로 AI '추론' 모델을 훈련할 수 있었습니다. 보고서에서 발췌:
s1이라고 알려진 이 모델은 수학 및 코딩 능력을 측정하는 테스트에서 OpenAI의 o1과 DeepSeek의 R1과 같은 최첨단 추론 모델과 유사한 성능을 발휘합니다. s1 모델은 훈련에 사용된 데이터 및 코드와 함께 GitHub에서 사용할 수 있습니다.

s1을 만든 팀은 기성품 기반 모델로 시작해서, 다른 AI 모델의 답변을 훈련시켜서 “추론” 기능을 추출하는 과정인 증류를 통해 세부 조정했다고 밝혔습니다. 연구원들은 s1이 구글의 추론 모델 중 하나인 Gemini 2.0 Flash Thinking Experimental에서 추출되었다고 말했습니다. 증류는 버클리 연구원들이 지난달 약 450달러에 AI 추론 모델을 만드는 데 사용한 것과 동일한 접근 방식입니다.

반응형