Devstral - Mistral의 에이전틱 LLM

1 day ago 6

  • Devstral은 소프트웨어 엔지니어링 작업을 위한 에이전틱 LLM으로, Mistral AI와 All Hands AI의 협업으로 개발됨
  • SWE-Bench Verified 벤치마크에서 기존 오픈소스 모델 대비 6% 이상 높은 46.8% 성능을 달성함
  • 경쟁 모델(Deepseek-V3, Qwen3 등) 및 일부 클로즈드소스 모델(GPT-4.1-mini 등)보다 우수한 성능을 보임
  • RTX 4090 또는 32GB RAM의 Mac에서도 로컬 사용 가능, 엔터프라이즈 환경이나 코파일럿에도 적합함
  • Apache 2.0 라이선스 하에 무료 배포되며, 다양한 플랫폼에서 즉시 사용 및 커스터마이즈 가능함

Devstral 소개

  • Devstral은 코드 작성, 수정, 이슈 해결 등 소프트웨어 엔지니어링 작업을 위한 에이전틱 LLM(Agentic Large Language Model)
  • Mistral AI와 All Hands AI의 파트너십으로 개발됨
  • Devstral은 현실 세계의 GitHub 이슈를 실제로 해결하는 방식으로 훈련되었으며, OpenHands나 SWE-Agent와 같은 코드 에이전트 스캐폴드를 기반으로 동작함

SWE-Bench Verified 벤치마크에서의 Devstral 성능

  • Devstral은 SWE-Bench Verified에서 46.8%의 점수를 기록하며, 오픈소스 최고 성능 모델을 6%포인트 이상 초과
  • 같은 테스트 스캐폴드(OpenHands) 기준에서 Deepseek-V3-0324(671B), Qwen3 232B-A22B 같은 더 큰 모델도 능가하는 결과를 보여줌
  • 커스텀 테스트 환경에서도 Devstral은 여러 클로즈드소스 대체 모델보다 뛰어난 성능을 기록함
    • 예를 들어, 최신 GPT-4.1-mini보다 20% 이상 높은 정확성을 보임

다양성 및 적용성

  • Devstral은 RTX 4090 또는 32GB RAM의 Mac에서도 원활하게 작동 가능하여, 로컬 배포 및 온-디바이스 활용에 유리함
  • OpenHands 같은 플랫폼에서는 로컬 코드베이스와 연동하여 이슈를 빠르게 해결할 수 있음
  • 엔터프라이즈 환경의 프라이버시 보호가 필요한 코드 저장소에도 적합함
  • 코파일럿, 에이전트 IDE 플러그인 등 다양한 개발환경에 적용 가능함

배포 및 사용

  • Devstral은 Apache 2.0 라이선스를 적용받아, 누구나 무료로 활용, 커스터마이즈, 재배포 가능함
  • 모델 사용 방법 안내 및 튜토리얼이 제공되며, HuggingFace, Ollama, Kaggle, Unsloth, LM Studio 등 다양한 플랫폼에서 다운로드 가능함
  • Mistral의 공식 API에서도 devstral-small-2505 명칭으로 제공되며, Mistral Small 3.1과 동일한 사용 요금 정책을 채택함
  • 엔터프라이즈 환경에서 프라이빗 코드베이스에 특화된 파인튜닝 등 고급 커스터마이즈가 필요할 경우 문의 가능함

앞으로의 계획

  • Devstral은 현재 리서치 프리뷰 단계임
  • 향후 더 큰 규모의 에이전틱 코딩 모델도 출시 예정임
  • Devstral 활용 또는 Mistral의 다양한 모델 및 솔루션에 대해 문의를 원하면 공식 연락처를 통해 상담 가능함

Read Entire Article