Deep Research 방식으로 자료 수집해준는 것들이 많이 나오려나.
https://news.slashdot.org/story/25/02/06/216251/hugging-face-clones-openais-deep-research-in-24-hours
익명의 독자가 Ars Technica의 보도를 인용합니다:
화요일, Hugging Face 연구원들은 자율적으로 웹을 검색하고 연구 보고서를 작성할 수 있는 OpenAI의 Deep Research 기능 출시 24시간 만에 자체 팀이 만든 ‘Open Deep Research’라는 오픈 소스 AI 연구 에이전트를 공개했습니다. 이 프로젝트는 개발자들에게 기술을 자유롭게 제공하면서 Deep Research의 성능을 맞추는 것을 목표로 합니다. “강력한 LLM이 이제 오픈 소스로 자유롭게 제공되고 있지만, OpenAI는 Deep Research의 기본 에이전트 프레임워크에 대해 많이 공개하지 않았습니다.”라고 Hugging Face는 발표 페이지에 썼습니다. “그래서 우리는 그들의 결과를 재현하고 필요한 프레임워크를 오픈 소스로 공개하는 24시간 미션을 시작하기로 결정했습니다!”
OpenAI의 Deep Research와 Google이 Gemini를 사용하여 자체적으로 구현한 “Deep Research”와 유사하게, Hugging Face의 솔루션은 기존 AI 모델에 “에이전트” 프레임워크를 추가하여 정보 수집 및 보고서 작성 등 여러 단계의 작업을 수행할 수 있도록 합니다. 이 작업은 사용자가 최종적으로 보고서를 받을 때 수행됩니다. 오픈 소스 클론은 이미 비슷한 벤치마크 결과를 기록하고 있습니다. 하루 만에 휴깅 페이스(Hugging Face)의 오픈 딥 리서치(Open Deep Research)는 여러 출처에서 정보를 수집하고 종합하는 AI 모델의 능력을 테스트하는 GAIA(General AI Assistants) 벤치마크에서 55.15%의 정확도를 달성했습니다. OpenAI의 딥 리서치는 단일 패스 응답으로 동일한 벤치마크에서 67.36%의 정확도를 기록했습니다(합의 메커니즘을 사용하여 64개의 응답을 결합했을 때 OpenAI의 점수는 72.57%까지 상승했습니다).
Hugging Face가 자신의 글에서 지적했듯이, GAIA에는 다음과 같은 복잡한 다단계 질문이 포함되어 있습니다: “2008년 작품 ‘우즈베키스탄의 자수’에 등장하는 과일 중 1949년 10월, 영화 ‘마지막 항해’의 부유식 소품으로 사용된 여객선의 아침 식사 메뉴에 포함된 과일은 무엇입니까?” 아이템을 쉼표로 구분된 목록으로 제공하여 그림의 배열에 따라 시계 방향으로 정렬하고 12시 위치에서 시작합니다. 각 과일의 복수형으로 사용합니다.” 이러한 유형의 질문에 올바르게 답하려면 AI 에이전트가 여러 가지 서로 다른 출처를 찾아서 일관된 답변으로 조합해야 합니다. GAIA의 많은 질문은 인간에게도 쉬운 일이 아니므로 에이전트 AI의 기량을 테스트하는 데 아주 적합합니다.
Open Deep Research는 “API를 통해 OpenAI의 대규모 언어 모델(예: GPT-4o) 또는 시뮬레이션된 추론 모델(예: o1 및 o3-mini)을 기반으로 구축됩니다”라고 Ars는 말합니다. “그러나 Open Deep Research는 오픈 가중치 AI 모델에도 적용될 수 있습니다. 여기서 새로운 부분은 모든 것을 하나로 묶고 AI 언어 모델이 자율적으로 연구 과제를 완료할 수 있도록 하는 에이전트 구조입니다.”
코드 주소
https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research
'개발 관련 이야기' 카테고리의 다른 글
연구자들이 OpenAI의 o1 '추론' 모델에 대한 오픈 라이벌을 50달러 미만으로 만들었습니다. (0) | 2025.02.07 |
---|---|
AMD, 데이터 센터에서 처음으로 인텔을 제치고 판매량 1위 달성 (1) | 2025.02.06 |
블로거의 경쟁 상대는 AI가 되는 건가 (0) | 2025.02.01 |
Claude를 사용한 프로그래밍 후기 (0) | 2025.01.29 |
NVIDIA에서 Linux GPU Kernel Module을 오픈 소스로 공개 (0) | 2024.07.22 |